用pscws4分词,为什么只打印出里面的数字,中文直接不分词打印,网页编码是utf8function get_tags_arr($title){
require 'pscws4/pscws4.class.php';
$pscws = new PSCWS4();
$pscws->set_dict('scws/dict.utf8.xdb');
$pscws->set_rule('scws/rules.utf8.ini');
$pscws->set_ignore(true);
$pscws->send_text($title);
$words = $pscws->get_tops(10);
$tags = array();
foreach ($words as $val) {
$tags[] = $val['word'];
}
$pscws->close();
return $tags;
}
------------------------------------
$title=并遵守中华人民共和国有关法律法规,21343尊重网上道德;
$tags=get_tags_arr($title);
echo print_r($tags);为什么只打印出里面的数字,中文直接不分词打印

解决方案 »

  1.   

    $pscws = new PSCWS4('utf-8'); //默认是 gbk 的
      

  2.   


    版主我已经$pscws = new PSCWS4('utf-8');处理过了 但是还是不行!那是什么地方的问题啊
      

  3.   

    $pscws->set_dict('scws/dict.utf8.xdb');
    $pscws->set_rule('scws/rules.utf8.ini');
    这两个文件名和路径对吗?对于 php 5.3 及以后会有 Redefining already defined constructor 错误,打开错误提示后并不影响正常工作
      

  4.   


    应该不是是路径的问题,因为GBK测试可以,但是UTF-8编码就不行!不是知道是什么地方的原因?
      

  5.   

    噢,那我就不知道了,我不用utf8的库