求助,关于php采集url地址 我想在如下网页采集所有的帖子url地址http://www.discuz.net/forum-10-1.html帖子格式为http://www.discuz.net/thread-3265731-1-1.html只要url链接,得出的结果一行一个 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 $url = 'http://www.discuz.net/forum-10-1.html';$ch = curl_init();curl_setopt($ch, CURLOPT_URL,$url);curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.2) Gecko/20100115 Firefox/3.6 (.NET CLR 3.5.30729)');$htmls = curl_exec($ch);curl_close($ch);$doc = new DOMDocument();libxml_use_internal_errors(true);$doc->loadHTML($htmls);$xpath = new DOMXPath($doc);$nodeList = $xpath->query('//a/@href');for ($i = 0; $i < $nodeList->length; $i++) { if(preg_match('@\/thread\-@',$nodeList->item($i)->value,$match)){ echo $nodeList->item($i)->value. "<br/>"; }} 跪求,给网站加一淘搜索索引,Feed接入 (散分)这段代码把我整疯了——闲着无聊就来看看这问题吧 netbeans下xdebug调试ci框架程序 浏览器显示forbidden php 基础问题 很奇怪的一个php代码加密优化的问题 jquery ajax 无法传递 “>>”? 什么样的代码嵌入在别人网站的页面中可以获得访问量--在线等待 php新手问题 在线等待!!!!php4.39的form传不了值,是php.ini中的那个参数啊 有几个问题? 关于codeigniter中整合ck的一些问题 求指点 练习php文件下载:提示打不开图片文件,因为此文件可能已经损坏,或者过大
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL,$url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.2) Gecko/20100115 Firefox/3.6 (.NET CLR 3.5.30729)');
$htmls = curl_exec($ch);
curl_close($ch);
$doc = new DOMDocument();
libxml_use_internal_errors(true);
$doc->loadHTML($htmls);
$xpath = new DOMXPath($doc);
$nodeList = $xpath->query('//a/@href');
for ($i = 0; $i < $nodeList->length; $i++) {
if(preg_match('@\/thread\-@',$nodeList->item($i)->value,$match)){
echo $nodeList->item($i)->value. "<br/>";
}
}