不是蜘蛛, 是单位的网站要升级, 以前的数据还要保留, 以前的数据有HTML的,有ASP的, 就是想把这些数据导入到新网站里.

解决方案 »

  1.   

    呵呵,ASP的也有数据库哦!别那么麻烦了
      

  2.   

    还有HTM页呢.
    主要是HTML页多.
      

  3.   

    有耐心做就好,没什么难点的。或者你试试使用webzip自动下载,再批量替换掉原来的文件中的不需要的内容,只保留title与body
      

  4.   

    自己写吧,这个其实就类似于采集了.用这个file_get_contents .
      

  5.   

    顶!!!
    和GOOGLE BAIDU 的搜索用的网络蜘蛛方法一样.
      

  6.   

    大致如此define('MAX_DEEP', 10); //嵌套深度
    $url_dict = array(); //url历史function get_url($url, $deep=0) {
      global $url_dict;
      $buf = get_href($url); //读取url并提取连接到数组
      foreach($buf as $u) {
        if(! in_array($u, $url_dict)) {
          $url_dict[] = $u;
          get_url($u, $deep+1);
        }
      }
    }
    }
      

  7.   

    我写了一段代码,请大家给看看:
    http://zsss.blog.sohu.com/16703046.html