请教 寻找PHP采集大量网页高效可行的方法 本帖最后由 oasisxp 于 2014-08-25 13:45:08 编辑 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 本帖最后由 PhpNewnew 于 2014-08-27 22:09:20 编辑 应该是xiami.com服务器有限制,禁止采集吧1,每个url请求只采10-20打,然后做个跳转在继续采集,这样也可以防止页面超时,如果你在虚机上运行,长时间点用cpu,进程可能会被kill.2,每次url请求header中的user-agent,cookies,最好都能改一下。3,如果还不行,用火车头试试吧!4,如果火车也不行,那就放弃这个站吧! 把foreach拆分成循环执行同一页面。第一次浏览器或者cronrab定时执行 http://localhost/caiji.php?num=1 每次完成后,$_GET['num']+1;curl 重复l执行同一脚本,当$_GET['num']==1000后,退出,不再执行curl。if($_GET['num']){$url = 'http://www.xiami.com/song/'.$_GET['num'];//你的代码$_GET['num'])++;}if($_GET['num']<1001){ $ch = curl_init(); curl_setopt($ch, CURLOPT_URL,"http://localhost/caiji.php?num=".$_GET['num'])); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_CONNECTTIMEOUT ,2); curl_setopt($ch, CURLOPT_TIMEOUT ,2); curl_exec($ch); curl_close($ch);}else{ exit;} 求php从一段字符串中截取指定内容的正则表达式代码 页面是GB2312,表单要设置成UTF8,怎么弄? 路径问题?高手们出来帮忙了!!!!完事给分 discuz分页函数,逻辑控制太强了。请高手指点!! 如何在PHP WEB页面点击链接执行SHELL脚本 取和GET值问题 如何根据给出的年及第几个星期得出是几月几日到几月几日?? phplib 大家来找茬 PHP连接SQL SERVER突然不行了:( PHP初学者,请教关于从数据库读取后输出会乱码的情况 php如何接收json
第一次浏览器或者cronrab定时执行 http://localhost/caiji.php?num=1 每次完成后,$_GET['num']+1;curl 重复l执行同一脚本,当$_GET['num']==1000后,退出,不再执行curl。if($_GET['num']){
$url = 'http://www.xiami.com/song/'.$_GET['num'];
//你的代码
$_GET['num'])++;
}
if($_GET['num']<1001){
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL,"http://localhost/caiji.php?num=".$_GET['num']));
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT ,2);
curl_setopt($ch, CURLOPT_TIMEOUT ,2);
curl_exec($ch);
curl_close($ch);
}else{
exit;
}