就是任意一篇文章,程序可以自动的提取多少汉字为标题的程序,当然可以不是那么准确,就是能不能找到一篇文章,较为重要的一句,自动提取它作为标题。

解决方案 »

  1.   

    这可以通过PHP的mb_substr()函数来完成啊!不过得保证你的PHP是支持mb_string的,首先确保你的Windows/system32下有php_mbstring.dll这个文件,没有就从你Php安装目录extensions里拷入Windows/system32里面。 
    然后找到php.ini打开编辑找到 
    ;extension=php_mbstring.dll把前面的;号去掉,这样mb_substr函数就可以生效了 <?php 
    $str = '汉字字符串截取就不会有乱码'; 
    echo "mb_substr:" . mb_substr($str, 0, 7, 'utf-8'); 
    //结果:汉字字符串截取
    ?> mb_substr()是按字来切分字符,非常的精确
      

  2.   

    mb_substr()只能截固定的字符串如果你想截一段话里重要的一句,那就复杂了,像新浪之类也都是人为编辑的。程序不可能那么智能。搜索引擎,像GOOGLE,是根据一篇文章中出现频率最高的词语做为这篇文章的重点进行索引的。
      

  3.   

    哪句话重要不重要,php需要设置一个规则这样才知道的。不然你就直接去前面或者后面的某句话。。截取功能上面的朋友已经说了。
      

  4.   

    如果复杂点来说,就是分词技术了,如果简单点那就取特定的东西呗
    分词就不说了,俺 也说不明白,取特定的东西可以取<h1></h1>或<strong>像这些标签中的内容,取一个,试试看效果会怎么样