相当于你自己写一个搜索引擎,一个页面一个页面的去抓,把别人的网址替换成你本地给抓取存放目录配置好的地址.  抓取过程中需要判断别人的图片 js 等等其他信息,然后远程保存到你数据库并更改抓取的html代码  然后重新建立关联.

解决方案 »

  1.   

    专业的搜索引擎技术提供商(磐志搜索),访问www.panzhi.net了解详细介绍。第一,提高搜索速度,0.005秒;
    第二、提高搜索准确性,专业的中文分词;  
    第三,智能分析关键词,纠错,相关词提取等;  
    第四、方法搜索 关键词的关系(与 或 非)等;
      

  2.   

    通过 file_get_contents()后,再进行正则匹配分析后获取想要的数据