已经把页面成功抓取到,但是查看源代码内容,有些内容却不显示,显示为:………………/>文件加载中……</p>,请问不显示的内容,是不是在缓存中,如何获取到,急!

解决方案 »

  1.   

    我通过PHP的socket下载了网页,打开跟浏览器访问是一样的啊。
    你对比看一下浏览器直接访问得到的源码有什么区别,如果没有区别,那说明你下载成功了,但是他里面用了ajax。
      

  2.   

    使用 firebox浏览的firebug分析网页
      

  3.   

    页面有ajax加载 ,要分析抓取页 
      

  4.   

    ajax分析所抓页 找到ajax源,向ajax源发模拟请求,获取返回,显示。
      

  5.   


    页面中有ajax请求,分析AJAX请求,模拟发送请求获取数据,替换页面中AJAX部分的HTML即可