php 怎么根据 域名地址 摘要 抓取 里面相关的文章? 我想实现的功能是根据地址和文章摘要 抓取地址下面需要的整篇文章 请问哪位高手可以实现吗 实际上也就是 rss的功能衍生 因为rss不能读取整篇文章? 请问哪位高手知道的告诉一下! 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 根据地址和文章摘要?是说Curl网址后,匹配有包含摘要字符串的标签?即包含摘要字符串的标签里的所有内容? 这就要配置了,不同的地址文章的html格式也有所不同,那就得不同的正则匹配出来了。这需要你每一个地址都自己去看一下内容是什么样子的,然后curl模拟抓取再正则匹配出来即可。 比如这个网址 http://news.163.com/13/0411/08/8S5S40RU0001124J.html 我取里面文章的内容需要在本地显示出来, 其它没有用的广告信息和头文件就不要了 该怎么做呢? 分析HTML 代码,使用正则 匹配出来 思维方式是:1. remove javascript2. remove css3. remove html tag4. remove re tag具体代码自己写正则匹配即可。 utf-8编码$s=file_get_contents('http://news.163.com/13/0411/08/8S5S40RU0001124J.html');preg_match('/<div id="endText">(.+?)<\/div>\s*<\!-- 分页 -->/is',iconv('gbk','utf-8',$s),$m);echo $m[1]; 一般情况下用file_get_contents如果某些特殊需要就用curl 大侠进!求一个正则表达式小语句~~~ 开发了一个BUG跟踪管理软件,开放源代码,欢迎大家下载试用 xml解析亂碼問題,在線等待,急!!!! php与表单的问题 PHP的网页在操作系统2000和2003的区别是什么?怎么改? 请教,关于调查的数据库结构设计 100分征求远程POP3收取邮件的函数 SESSION我不会啊 一个关于apache和perl的问题 使用thinkPHP有一个搜索怎么用link进行模糊查询 基础题,通过递归正则匹配数字元素 请教一个 PHP 定时执行任务的问题!
这需要你每一个地址都自己去看一下内容是什么样子的,然后curl模拟抓取再正则匹配出来即可。
1. remove javascript
2. remove css
3. remove html tag
4. remove re tag具体代码自己写正则匹配即可。
$s=file_get_contents('http://news.163.com/13/0411/08/8S5S40RU0001124J.html');
preg_match('/<div id="endText">(.+?)<\/div>\s*<\!-- 分页 -->/is',iconv('gbk','utf-8',$s),$m);
echo $m[1];
如果某些特殊需要就用curl