csdn的搜索  可以搜索论坛或者博客。也可以搜索全部,全部的话是不是要论坛、博客等表一起查的呢?这样会狠慢的吧。还是另外生成一个表放着关键字的索引,再关联回 博客或者论坛等呢。求助大神帮忙给个思路,先谢谢啦。全文检索整站搜索

解决方案 »

  1.   

    你可以借鑒discuz的做法,他首先存儲常用關鍵字和用這些常用關鍵字搜出的文章id號碼,下次有人用常用關鍵字搜的時候直接從已存儲的結果顯示出來
    如果是新的關鍵字,則先存儲關鍵字,然後搜尋出結果 ,把結果id存入數據庫,同時顯示出來
      

  2.   

    我查了帝国的cms  支持全文检索。
    存储中文的方式为区位码。实现存储的方式如下://区位码
    function SearchReturnQwm($t){
    return sprintf("%02d%02d",ord($t[0])-160,ord($t[1])-160);
    }//转换字符串
    function SearchReturnSaveStr($str){
    //所有汉字后添加ASCII的0字符,此法是为了排除特殊中文拆分错误的问题
    $str=preg_replace("/[\x80-\xff]{2}/","\\0".chr(0x00),$str);
    //拆分的分割符
    $search = array(",", "/", "\\", ".", ";", ":", "\"", "!", "~", "`", "^", "(", ")", "?", "-", "\t", "\n", "'", "<", ">", "\r", "\r\n", "$", "&", "%", "#", "@", "+", "=", "{", "}", "[", "]", ":", ")", "(", ".", "。", ",", "!", ";", "“", "”", "‘", "’", "[", "]", "、", "—", " ", "《", "》", "-", "…", "【", "】",);
    //替换所有的分割符为空格
    $str = str_replace($search,' ',$str);
    //用正则匹配半角单个字符或者全角单个字符,存入数组$ar
    preg_match_all("/[\x80-\xff]?./",$str,$ar);$ar=$ar[0];
    //去掉$ar中ASCII为0字符的项目
    for($i=0;$i<count($ar);$i++)
    {
    if($ar[$i]!=chr(0x00))
    {
    $ar_new[]=$ar[$i];
    }
    }
    $ar=$ar_new;
    unset($ar_new);
    $oldsw=0;
    //把连续的半角存成一个数组下标,或者全角的每2个字符存成一个数组的下标
    for($ar_str='',$i=0;$i<count($ar);$i++)
    {
    $sw=strlen($ar[$i]);
    if($i>0 and $sw!=$oldsw)
    {
    $ar_str.=" ";
    }
    if($sw==1)
    {
    $ar_str.=$ar[$i];
    }
    else
    {
    if(strlen($ar[$i+1])==2)
    {
    $ar_str.=SearchReturnQwm($ar[$i]).SearchReturnQwm($ar[$i+1]).' ';
    }
    elseif($oldsw==1 or $oldsw==0)
    {
    $ar_str.=SearchReturnQwm($ar[$i]);
    }
    }
    $oldsw=$sw;
    }
    //去掉连续的空格
    $ar_str=trim(preg_replace("# {1,}#i"," ",$ar_str));
    //返回拆分后的结果
    return $ar_str;
    }
    原标题:奥地利“兽父”是怎么养成的?存储的字段值为16342156 21563291 42622424 42395285 52853520 35204988 49881941 19412136 21360331 中文的语义为: 奥地 地利 兽父 是怎 怎么 么养 养成 成的 的?查询时将中文转为 区位码进行查询,不解为什么要以这样的格式存储;盼大神们讲解一下呢。
      

  3.   

    sibang 
    discuz 我不大熟  貌似狠复杂。 有空会探索一下的  谢谢你的回答
      

  4.   

    补充: 查询“奥地”文字会转为  四个汉字的区位码
    select id,classid from phome_enewssearchall where MATCH(title,infotext) AGAINST('16342156 21563291' IN BOOLEAN MODE)
      

  5.   

    MATCH (col1,col2,...) AGAINST (expr [IN BOOLEAN MODE | WITH QUERY EXPANSION]) 
    用于全文检索索引 FULLTEXT 的查询由于目前的 mysql 不支持中文的全文检索索引,所以他变换了一下汉字的表现形式我想,文章出处一定是说明了为什么的
      

  6.   

    找到答案了  谢谢各位
    http://hi.baidu.com/hlhwpz/item/4ea585d01c1e1de9795daac0