我想实现的功能是根据地址和文章摘要 抓取地址下面需要的整篇文章 请问哪位高手可以实现吗 实际上也就是 rss的功能衍生 因为rss不能读取整篇文章?                                                                      请问哪位高手知道的告诉一下!

解决方案 »

  1.   

    根据地址和文章摘要?是说Curl网址后,匹配有包含摘要字符串的标签?即包含摘要字符串的标签里的所有内容?
      

  2.   

    这就要配置了,不同的地址文章的html格式也有所不同,那就得不同的正则匹配出来了。
    这需要你每一个地址都自己去看一下内容是什么样子的,然后curl模拟抓取再正则匹配出来即可。
      

  3.   

    比如这个网址 http://news.163.com/13/0411/08/8S5S40RU0001124J.html 我取里面文章的内容需要在本地显示出来, 其它没有用的广告信息和头文件就不要了 该怎么做呢?
      

  4.   

    分析HTML 代码,使用正则 匹配出来
      

  5.   

    思维方式是:
    1. remove javascript
    2. remove css
    3. remove html tag
    4. remove re tag具体代码自己写正则匹配即可。
      

  6.   

    utf-8编码
    $s=file_get_contents('http://news.163.com/13/0411/08/8S5S40RU0001124J.html');
    preg_match('/<div id="endText">(.+?)<\/div>\s*<\!-- 分页 -->/is',iconv('gbk','utf-8',$s),$m);
    echo $m[1];
      

  7.   

    一般情况下用file_get_contents
    如果某些特殊需要就用curl