用socket采集网页信息?? 现在要做一个采集系统,就是个人注册人才网后,可以选择把自己的简历从别的人才网导过来。以前没做过socket,用这个要怎么做了??给点思路,或者例子,谢谢了 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 不需要写socket 只要用 HTTP_client 模拟登入其他网站,打开显示简历的页面从返回的html 中取得资料就可以所以每个不同网站都要写一个module 用 HTTP_client 模拟登陆??没做过,能在说清楚点么 用Curl扩展可以实现,其实fsockopen是最灵活的了。 在Google搜索很多的,你看看这个:http://www.phpchina.com/html/99/1099-2092.html 基本的原理就是机器人读取HTML然后做截取字段,但是不同的网站要有不同的截取方式 http://topic.csdn.net/u/20080824/07/0125890f-9a98-4296-ad84-c5c748c17581.html看看这位兄弟的采集程序。应该可以帮到你的。 用firebug 看网页登入时的 post,get, header再用HTTP_client发相同的东西就可以了返回的内容就是登入后的内容 socket_open这个系列的函数也很好用啊, fsockopen等函数还是建议用cURL apache的httpd.conf配置咨询? CKEditor 3.3 开启文件上传功能?请教! PHP难点开发求助高手们 求一款PHP开源文档管理系统 求 PHP视频网站制作教程 ajaxFileUpload.js上传文件怪异问题求解,急急急 求最大右行路径 求助一个rewrite写法 谷歌地图调用API独立文件能显示但是加到自己首页后就无法显示了! PHP数组混写输出HTML代码 查找()中的逗号并替换为空的正则表达式 用帝国ECMS 5.1 UTF8版本整合PHPwind论坛后登录时需要输入两次用户名和密码才能进入
只要用 HTTP_client 模拟登入其他网站,打开显示简历的页面
从返回的html 中取得资料就可以所以每个不同网站都要写一个module
http://www.phpchina.com/html/99/1099-2092.html
再用HTTP_client发相同的东西就可以了
返回的内容就是登入后的内容
还是建议用cURL