我想给一个php的小程序加一个低级关键词功能,就像动易采集时候的分词效果一样,例如标题是:我从未见过奥特曼动易采集自动分词的结果是:我从|从未|未见|见过|过奥|奥特|特曼
我自己试了 php的分割函数,但是分割后都是很痛苦的数组,郁闷,求指点!我没php基础 只是看了一点小介绍!我这样想的$title=我从未见过奥特曼$keyword = str_split($title,1);但是这样分割后都是数组,而且这样分割好貌似就变成了:我|从|未|见|过|奥|特|曼求指点,怎么才能像动易采集自动生成关键词那样的生成结果呢!
我自己试了 php的分割函数,但是分割后都是很痛苦的数组,郁闷,求指点!我没php基础 只是看了一点小介绍!我这样想的$title=我从未见过奥特曼$keyword = str_split($title,1);但是这样分割后都是数组,而且这样分割好貌似就变成了:我|从|未|见|过|奥|特|曼求指点,怎么才能像动易采集自动生成关键词那样的生成结果呢!
解决方案 »
- 10000 求购游戏收货、出货网站(php)
- .htaccess 配置问题
- ubuntu 设置PHP环境变量$_ENV
- 请问谁有仿PHPMYADMIN的文本SQL文件导入生成数据表的功能
- 关于vBulletin自动解禁的问题!
- php+sybase高手请进,查询数据时最多只能读出200多个字符,急急急!
- 一个读取字符的问题
- 大家有什么比较好的免费PHP+MYSQL空间推荐?
- include的 问题?
- php 4.21和4.12是不是有很大区别?在函数上是否有不同?
- php:怎样将中文字符以规定字符长度分段截取并将每段放入数组元素中
- php 验证码报错Call to undefined function imagecreatetruecolor() 多种方法无效
$len= mb_strlen($title,'utf-8');
$l=0;
while($l<$len-1){
$arr[]=mb_substr($title,$l,2,'UTF-8');
$l++;
}
echo join('|',$arr);我从|从未|未见|见过|过奥|奥特|特曼
例子:
$sh = scws_open();
scws_set_charset($sh, 'gbk');
scws_set_multi($sh,SCWS_MULTI_SHORT | SCWS_MULTI_DUALITY | SCWS_MULTI_ZMAIN | SCWS_MULTI_ZALL);
$text = "我从未见过奥特曼";
scws_send_text($sh, $text);
$top = scws_get_tops($sh, 10);
print_r($top);