php 怎么根据 域名地址 摘要 抓取 里面相关的文章? 我想实现的功能是根据地址和文章摘要 抓取地址下面需要的整篇文章 请问哪位高手可以实现吗 实际上也就是 rss的功能衍生 因为rss不能读取整篇文章? 请问哪位高手知道的告诉一下! 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 根据地址和文章摘要?是说Curl网址后,匹配有包含摘要字符串的标签?即包含摘要字符串的标签里的所有内容? 这就要配置了,不同的地址文章的html格式也有所不同,那就得不同的正则匹配出来了。这需要你每一个地址都自己去看一下内容是什么样子的,然后curl模拟抓取再正则匹配出来即可。 比如这个网址 http://news.163.com/13/0411/08/8S5S40RU0001124J.html 我取里面文章的内容需要在本地显示出来, 其它没有用的广告信息和头文件就不要了 该怎么做呢? 分析HTML 代码,使用正则 匹配出来 思维方式是:1. remove javascript2. remove css3. remove html tag4. remove re tag具体代码自己写正则匹配即可。 utf-8编码$s=file_get_contents('http://news.163.com/13/0411/08/8S5S40RU0001124J.html');preg_match('/<div id="endText">(.+?)<\/div>\s*<\!-- 分页 -->/is',iconv('gbk','utf-8',$s),$m);echo $m[1]; 一般情况下用file_get_contents如果某些特殊需要就用curl [求助]。xmlrpc网易博客报错,有源码 MYSQL时间格式可以更改么? preg_match正则基础题 正则表达式怎么写啊? 哪位用php寫過條碼 50分借代码,谁愿意帮忙啊? 寻求帮助,熟悉类的朋友请进 为什么流行CMS数据库都不用视图或存储过程 如何获取网页里面的表格? 今天被问一个问题,PHP数组如何添加属性 基础题,通过递归正则匹配数字元素 请教一个 PHP 定时执行任务的问题!
这需要你每一个地址都自己去看一下内容是什么样子的,然后curl模拟抓取再正则匹配出来即可。
1. remove javascript
2. remove css
3. remove html tag
4. remove re tag具体代码自己写正则匹配即可。
$s=file_get_contents('http://news.163.com/13/0411/08/8S5S40RU0001124J.html');
preg_match('/<div id="endText">(.+?)<\/div>\s*<\!-- 分页 -->/is',iconv('gbk','utf-8',$s),$m);
echo $m[1];
如果某些特殊需要就用curl