信息采集,也叫抓取程序,也叫小偷程序给个例子
解决方案 »
- 那个用storm的大手呢?
- 那里有PHP的学习资料啊?
- mysql数据库里的数据是date类型的,取出来后怎么计算
- 关于Template循环问题比如<table><tr><td>{mycontent}</td></tr></table>非常感谢
- (顶者有分)如何向生成的word文档中加入图片?
- PHP中如何取得变量的名称?或数组的名称也行.
- 请教!!!PHP支持zend?如何解决?
- windows下配PHP的多不多?
- 请高手帮忙,php用socket和smtp发送邮件,smtp服务器需认证。急急急急急
- 一个PHP FTP上传的问题????????
- 一个简单的表达式问题。
- 将网站从WINDOWS下面转移到Ubuntu下面数据库访问出错,急!!!
#2.去学习正则或者xml dom吧,抓下来还得会取才行
// 初始化一个 cURL 对象
$curl = curl_init();
// 设置你需要抓取的URL
curl_setopt($curl, CURLOPT_URL, 'http://news.163.com/11/0608/08/760TU2NJ00014AED.html');
// 设置header
curl_setopt($curl, CURLOPT_HEADER, 1);
// 设置cURL 参数,要求结果保存到字符串中还是输出到屏幕上。
curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
// 运行cURL,请求网页
$data = curl_exec($curl);
echo $data;
// 关闭URL请求
curl_close($curl);
// 显示获得的数据
eregi("<ul class=\"day_tabs\">(.*)</ul>",$data,$arr);
echo $arr;可以吧!?
1.获取该地址上的源码,这个方法很多,file_get_contents/fopen/curl 等等
2.根据一定的规很去获取需要的信息,就是在一个字符串中获取一段出来了,方法也有很多,str_split,explode,最常用的是正则