急需网络爬虫代码!!!!!!

解决方案 »

  1.   

    爬虫如果自己玩
    那就动手写一个么
    原理也很简单
    从某一个地址开始,
    用httpclient or urlconnection访问之
    将得到的html文件分析,
    找出里面的链接
    再递归爬之
    主要是记录哪些链接已经爬过了
    哪些没爬过
    以免造成死循环
    实际要用的话,还得考虑一些更新的问题
      

  2.   


    我也求代码 [email protected]
      

  3.   

    HTMLParse 用这个框架去解析页面
      

  4.   

    求  代码[email protected]