网络爬虫 - 调试易

网络爬虫

急需网络爬虫代码!!!!!!

解决方案 »

免费领取超大流量手机卡，每月29元包185G流量+100分钟通话, 中国电信官方发货

爬虫如果自己玩
那就动手写一个么
原理也很简单
从某一个地址开始，
用httpclient or urlconnection访问之
将得到的html文件分析，
找出里面的链接
再递归爬之
主要是记录哪些链接已经爬过了
哪些没爬过
以免造成死循环
实际要用的话，还得考虑一些更新的问题
我也求代码 [email protected]
HTMLParse 用这个框架去解析页面
求  代码[email protected]