[200分求源码] 做一个读入网页的PHP程序? 不是蜘蛛, 是单位的网站要升级, 以前的数据还要保留, 以前的数据有HTML的,有ASP的, 就是想把这些数据导入到新网站里. 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 呵呵,ASP的也有数据库哦!别那么麻烦了 还有HTM页呢.主要是HTML页多. 有耐心做就好,没什么难点的。或者你试试使用webzip自动下载,再批量替换掉原来的文件中的不需要的内容,只保留title与body 自己写吧,这个其实就类似于采集了.用这个file_get_contents . 顶!!!和GOOGLE BAIDU 的搜索用的网络蜘蛛方法一样. 大致如此define('MAX_DEEP', 10); //嵌套深度$url_dict = array(); //url历史function get_url($url, $deep=0) { global $url_dict; $buf = get_href($url); //读取url并提取连接到数组 foreach($buf as $u) { if(! in_array($u, $url_dict)) { $url_dict[] = $u; get_url($u, $deep+1); } }}} 我写了一段代码,请大家给看看:http://zsss.blog.sohu.com/16703046.html TP从模板跳转到另一个控制器 使用Installshield 2010 premier,生成错误,错误ID:7108 求高手指点!!! url传递参数的问题,请教高手 单选按钮和复选框的数据库应用问题?? 急!!! fsockopen ssl:// 出现0 (操作成功完成。 )问题 急,MySQL5.0版本的数据,怎样才能导出数据。在MySQL4版本也能用? 请问高手如何在按button 刷新之后,页面能够保持在原来的位置 救命,我快疯了的问题 一个低级问题,会的请回答。 php怎样显示mysql的warning信息? 跨站cookie问题 招聘开发工程师
主要是HTML页多.
和GOOGLE BAIDU 的搜索用的网络蜘蛛方法一样.
$url_dict = array(); //url历史function get_url($url, $deep=0) {
global $url_dict;
$buf = get_href($url); //读取url并提取连接到数组
foreach($buf as $u) {
if(! in_array($u, $url_dict)) {
$url_dict[] = $u;
get_url($u, $deep+1);
}
}
}
}
http://zsss.blog.sohu.com/16703046.html