百度百科的关键词带有链接。我在想少量关键词,只需要简单替换成链接就可以。可是百度的关键词是狠多的,可能成万上千万个。如果替换上万次,那效率也太低了吧。请教这样的功能是怎样实现的呢?谢谢!附截图:关键字链接

解决方案 »

  1.   

    百科的关键词是按类别相关性来分配的,所以不会有很多个关键词。
    另外你感觉可能要调用replace函数很多次,这只是PHP的正常实现方式。实际上,用C语言来遍历一次整篇文章即可,这个效率还是远远超过PHP的实现方式的。
      

  2.   

    dream1206    如果一个类别的关键字有一万个  一篇文章替换一万次;你认为合理不?
      

  3.   

    少量的关键词 php有个strtr函数
      

  4.   

    当然不合理!
    但是你为什么不反过来做呢?
    抄写一遍文章,对于文章中的每一个词去检查是否在关键词集合中,不就快多了吗?记得我发过基于 trie 的关键词匹配代码
      

  5.   

    好吧,我再发一遍include 'TTrie.php';class wordkey extends TTrie {
      function b() {
        $t = array_pop($this->buffer);
        $this->buffer[] = "<b>$t</b>";
      }
    }
    $p = new wordkey;
    $p->set('秦始皇', 'b');
    $p->set('洛阳', 'b');
    $t = $p->match('秦始皇东巡洛阳');
    echo join('', $t);
    <b>秦始皇</b>东巡<b>洛阳</b>TTrie.phpclass TTrie {
      protected $buffer = array();
      protected $dict = array( array() );
      protected $input = 0; //字符串当前偏移
      protected $backtracking = 0; //字符串回溯位置
      public $debug = 0;
      public $savematch = 1;  function set($word, $action='') {
    if(is_array($word)) {
    foreach($word as $k=>$v) $this->set($k, $v);
    return;
    }
    $p = count($this->dict);
    $cur = 0; //当前节点号
    foreach(str_split($word) as $c) {
    if (isset($this->dict[$cur][$c])) { //已存在就下移
    $cur = $this->dict[$cur][$c];
    continue;
    }
    $this->dict[$p]= array(); //创建新节点
    $this->dict[$cur][$c] = $p; //在父节点记录子节点号
    $cur = $p; //把当前节点设为新插入的
    $p++;
    }
    $this->dict[$cur]['acc'] = $action; //一个词结束,标记叶子节点
      }
      function getto($ch) {
    $i =& $this->input; //字符串当前偏移
    $p =& $this->backtracking; //字符串回溯位置
    $len = strlen($this->doc);
    $t = '';
    $this->input++;
    // while($this->input<$len && $this->doc{$this->input} != $ch) $t .= $this->doc{$this->input++};
    // $t .= $this->doc{$this->input++};
    do {
    if($this->input >= $len) break;
    $t .= $this->doc{$this->input};
    }while($this->doc{$this->input++} != $ch);
    return trim($t);
      }
      function match($s) {
    $this->doc =& $s;
    $this->buffer = array();
    $ret = array();
    $cur = 0; //当前节点,初始为根节点
    $i =& $this->input; //字符串当前偏移
    $p =& $this->backtracking; //字符串回溯位置
    $i = $p = 0;
    $s .= "\0"; //附加结束符
    $len = strlen($s);
    $buf = '';
    while($i < $len) {
    $c = $s{$i};
    if(isset($this->dict[$cur][$c])) { //如果存在
    $cur = $this->dict[$cur][$c]; //转到对应的位置
    if(isset($this->dict[$cur][$s[$i+1]])) {//检查下一个字符是否也能匹配,长度优先
    $i++;
    continue;
    }
    if(isset($this->dict[$cur]['acc'])) { //是叶子节点,单词匹配!
    if($buf != '') {
    $this->buffer[] = $buf;
    $buf = '';
    }
    if($this->savematch) $this->buffer[] = substr($s, $p, $i - $p + 1); //取出匹配位置和匹配的词 $ar = explode(',', $this->dict[$cur]['acc']);
    call_user_func_array( array($this, array_shift($ar)), $ar ); $p = $i + 1; //设置下一个回溯位置
    $cur = 0; //重置当前节点为根节点
    }
    } else { //不匹配
    $buf .= $s{$p}; //substr($s, $p, $i - $p + 1); //保存未匹配位置和未匹配的内容
    $cur = 0; //重置当前节点为根节点
    $i = $p; //把当前偏移设为回溯位置
    $p = $i + 1; //设置下一个回溯位置
    }
    $i++; //下一个字符
    }
    if(trim($buf, "\0")) $this->buffer[] = trim($buf, "\0");
    return $this->buffer;
      }  function __call($method, $param) {
    if($this->debug) printf("偏移:%d 回溯:%d\n", $this->input, $this->backtracking);
      }
    }
      

  6.   

    传说中的 PHP文字高亮 ,很好的class啊……