请问全文检索是怎样实现的呢

csdn的搜索可以搜索论坛或者博客。也可以搜索全部，全部的话是不是要论坛、博客等表一起查的呢？这样会狠慢的吧。还是另外生成一个表放着关键字的索引，再关联回博客或者论坛等呢。求助大神帮忙给个思路，先谢谢啦。全文检索整站搜索

解决方案 »

免费领取超大流量手机卡，每月29元包185G流量+100分钟通话, 中国电信官方发货

你可以借鑒discuz的做法,他首先存儲常用關鍵字和用這些常用關鍵字搜出的文章id號碼,下次有人用常用關鍵字搜的時候直接從已存儲的結果顯示出來
如果是新的關鍵字,則先存儲關鍵字,然後搜尋出結果 ,把結果id存入數據庫,同時顯示出來
我查了帝国的cms  支持全文检索。
存储中文的方式为区位码。实现存储的方式如下：//区位码
function SearchReturnQwm($t){
return sprintf("%02d%02d",ord($t[0])-160,ord($t[1])-160);
}//转换字符串
function SearchReturnSaveStr($str){
//所有汉字后添加ASCII的0字符,此法是为了排除特殊中文拆分错误的问题
$str=preg_replace("/[\x80-\xff]{2}/","\\0".chr(0x00),$str);
//拆分的分割符
$search = array(",", "/", "\\", ".", ";", ":", "\"", "!", "~", "`", "^", "(", ")", "?", "-", "\t", "\n", "'", "<", ">", "\r", "\r\n", "$", "&", "%", "#", "@", "+", "=", "{", "}", "[", "]", "：", "）", "（", "．", "。", "，", "！", "；", "“", "”", "‘", "’", "［", "］", "、", "—", "　", "《", "》", "－", "…", "【", "】",);
//替换所有的分割符为空格
$str = str_replace($search,' ',$str);
//用正则匹配半角单个字符或者全角单个字符,存入数组$ar
preg_match_all("/[\x80-\xff]?./",$str,$ar);$ar=$ar[0];
//去掉$ar中ASCII为0字符的项目
for($i=0;$i<count($ar);$i++)
{
if($ar[$i]!=chr(0x00))
{
$ar_new[]=$ar[$i];
}
}
$ar=$ar_new;
unset($ar_new);
$oldsw=0;
//把连续的半角存成一个数组下标,或者全角的每2个字符存成一个数组的下标
for($ar_str='',$i=0;$i<count($ar);$i++)
{
$sw=strlen($ar[$i]);
if($i>0 and $sw!=$oldsw)
{
$ar_str.=" ";
}
if($sw==1)
{
$ar_str.=$ar[$i];
}
else
{
if(strlen($ar[$i+1])==2)
{
$ar_str.=SearchReturnQwm($ar[$i]).SearchReturnQwm($ar[$i+1]).' ';
}
elseif($oldsw==1 or $oldsw==0)
{
$ar_str.=SearchReturnQwm($ar[$i]);
}
}
$oldsw=$sw;
}
//去掉连续的空格
$ar_str=trim(preg_replace("# {1,}#i"," ",$ar_str));
//返回拆分后的结果
return $ar_str;
}
原标题：奥地利“兽父”是怎么养成的？存储的字段值为16342156 21563291 42622424 42395285 52853520 35204988 49881941 19412136 21360331 中文的语义为：奥地地利兽父是怎怎么么养养成成的的？查询时将中文转为区位码进行查询，不解为什么要以这样的格式存储；盼大神们讲解一下呢。
sibang
discuz 我不大熟  貌似狠复杂。有空会探索一下的  谢谢你的回答
补充：查询“奥地”文字会转为  四个汉字的区位码
select id,classid from phome_enewssearchall where MATCH(title,infotext) AGAINST('16342156 21563291' IN BOOLEAN MODE)
MATCH (col1,col2,...) AGAINST (expr [IN BOOLEAN MODE | WITH QUERY EXPANSION])
用于全文检索索引 FULLTEXT 的查询由于目前的 mysql 不支持中文的全文检索索引，所以他变换了一下汉字的表现形式我想，文章出处一定是说明了为什么的
找到答案了  谢谢各位
http://hi.baidu.com/hlhwpz/item/4ea585d01c1e1de9795daac0