[200分求源码] 做一个读入网页的PHP程序? - 调试易

[200分求源码] 做一个读入网页的PHP程序?

不是蜘蛛, 是单位的网站要升级, 以前的数据还要保留, 以前的数据有HTML的,有ASP的, 就是想把这些数据导入到新网站里.

解决方案 »

免费领取超大流量手机卡，每月29元包185G流量+100分钟通话, 中国电信官方发货

呵呵，ASP的也有数据库哦！别那么麻烦了
还有HTM页呢.
主要是HTML页多.
有耐心做就好，没什么难点的。或者你试试使用webzip自动下载，再批量替换掉原来的文件中的不需要的内容，只保留title与body
自己写吧,这个其实就类似于采集了.用这个file_get_contents .
顶!!!
和GOOGLE BAIDU 的搜索用的网络蜘蛛方法一样.
大致如此define('MAX_DEEP', 10); //嵌套深度
$url_dict = array(); //url历史function get_url($url, $deep=0) {
  global $url_dict;
  $buf = get_href($url); //读取url并提取连接到数组
  foreach($buf as $u) {
    if(! in_array($u, $url_dict)) {
      $url_dict[] = $u;
      get_url($u, $deep+1);
    }
  }
}
}
我写了一段代码,请大家给看看:
http://zsss.blog.sohu.com/16703046.html