获取该网站http://www.cnproxy.com/proxy1.html
所有的代理ip地址、端口、和区域。存放到数据库中。
要求能自动翻页遍历所有的信息。

解决方案 »

  1.   

    用inte循环下载网页源代码,用正则分析出需要的数据,如果是嵌套网页,还需要进一步分析,很麻烦
      

  2.   

    很简单,我前一段时间正好写了个。
    实现功能:
    1、查找网站http://www.cnproxy.com/proxy1.html指定日期的代理IP(默认为当前系统日期)。
    2、设定响应时间(默认小于等于2秒)。
    3、显示符合要求的IP数量。
    4、导出到文本,格式如下:
       14:119.148.6.246   , 8080 , 1.005
       15:200.143.104.10  , 3128 , 0.996
       16:186.125.60.2    , 3128 , 1.999
       17:96.31.93.111    , 3128 , 0.999
    5、可以支持查找全站的IP(默认为仅查找当天的最新IP)。
    说明:可以按要求改写导出格式,并可自动导入数据库。
    如需要,加QQ:309363537讨论……