用socket采集网页信息?? 现在要做一个采集系统,就是个人注册人才网后,可以选择把自己的简历从别的人才网导过来。以前没做过socket,用这个要怎么做了??给点思路,或者例子,谢谢了 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 不需要写socket 只要用 HTTP_client 模拟登入其他网站,打开显示简历的页面从返回的html 中取得资料就可以所以每个不同网站都要写一个module 用 HTTP_client 模拟登陆??没做过,能在说清楚点么 用Curl扩展可以实现,其实fsockopen是最灵活的了。 在Google搜索很多的,你看看这个:http://www.phpchina.com/html/99/1099-2092.html 基本的原理就是机器人读取HTML然后做截取字段,但是不同的网站要有不同的截取方式 http://topic.csdn.net/u/20080824/07/0125890f-9a98-4296-ad84-c5c748c17581.html看看这位兄弟的采集程序。应该可以帮到你的。 用firebug 看网页登入时的 post,get, header再用HTTP_client发相同的东西就可以了返回的内容就是登入后的内容 socket_open这个系列的函数也很好用啊, fsockopen等函数还是建议用cURL 新手站长请教问题! PHP目录遍历 vtigercrm二次开发 那位大虾用php操作过数字证书了 php 报错。。。。 php大文件上传,百兆文件上传,有进度条,有上传速度 请教研究过discuz的高手。 The mysql extension is deprecated and will be removed in the future,这是什么原因啊? php做SDK的数据统计和分析 laravel 时间区间问题,求大佬帮忙滴滴滴!!!! 查找()中的逗号并替换为空的正则表达式 用帝国ECMS 5.1 UTF8版本整合PHPwind论坛后登录时需要输入两次用户名和密码才能进入
只要用 HTTP_client 模拟登入其他网站,打开显示简历的页面
从返回的html 中取得资料就可以所以每个不同网站都要写一个module
http://www.phpchina.com/html/99/1099-2092.html
再用HTTP_client发相同的东西就可以了
返回的内容就是登入后的内容
还是建议用cURL