为了解决MySQL的FULLTEXT全文检索,我把文章中的汉字转成了Unicode编码文字显示,如:
重新开始 ——在网页中不用处理就可以显示成汉字“重新开始”。
诸如此类,那么我想知道的是:Unicode文字百度和其它搜索引擎认么?会正常收录这篇文章中的文字么?

解决方案 »

  1.   

    不确定,hoho~~~  可以写几个页面,让蜘蛛试试能否被收录如果正要上架,可以echo mb_convert_encoding("重新开始", "HTML-ENTITIES", "UTF-8");
    //输出重新开始
      

  2.   

    会把重新开始这个字符串作为关键字
      

  3.   

    问题是不仅仅是一个字符串,通篇文章数据都是Unicode文字了,因为已经不直接用汉字了,如:为了应付MYSQL的全文检索,我将中文汉字转成Unicode编码文字直接储存在数据库中,当然从数据库调出数据显示时也会直接显示在网页上而不必再转码,经过测试全文检索是可行的,虽然Unicode编码占8个字符长,比汉字的3个字符长占用空间多些,但实现了MYSQL全文检索对中文汉字的支持,同时不用再分词即可实现全文检索,也算是值了。但是,我想到另一个问题就是,百度和其它的搜索引擎对Unicode编码文字友好么?能正常收录这些文字么,比如“我爱编程”在网页上输出“&#25105&#59;&#29233&#59;&#32534&#59;&#31243&#59;”,诸如此类,如果搜索引擎不能或者不愿正常收录Unicode编码文字的话,那我的方案就有问题了,所以先测试一下吧,用此文。