如题,我想用PHP编一个爬行程序,比如把一个PHP博客站点的所有页面都下载到本地,并且把原本的动态后缀.php改成.html,实现导出成静态网页?比如网页访问的是page.php?id=2
保存到本地变成page-2.html然后原来在其他页面上的超链接href=page.php?id=2也改成page-2.html求大神!!

解决方案 »

  1.   

    简单点的
    $html=file_get_contents($url);//如 http://127.0.0.1/page.php?id=2
    $html=preg_replace("/page\.php\?id=(\d+)/i",'page-$1.html',$html);
    file_put_contents("/home/web/page-$id.html",$html);//$id $url 中id的值
      

  2.   

    抓取网站有专门的工具,比如 Teleport Pro、WebZip。简单快捷
    php 可做,但不适合做此类事情
      

  3.   

    使用curl采集,然后正则分析,写入db。
    不过php做这个效率不高,可考虑使用软件完成。