一些网站的内容是调用JS生成展示的,无法抓取其内容请问如何解决?

解决方案 »

  1.   

    搜索引擎的工程师那么N13都不去采集js生成的内容。
      

  2.   

    http://topic.csdn.net/u/20091103/16/4262bdf8-1db5-4a36-b78c-9d9c34ec06da.html
      

  3.   

    要求不高的话,可以用 webbrowser 读取网页,等 js 执行完,用 IHtmlElement2 来读 OuterHtml
      

  4.   

    抓这些干嘛?甚至连html也不需要全部抓取,你只要抓取HttpRequest以字节流方式在前3秒钟得到的内容就行了。
      

  5.   

    这个要具体分析一下它的JS代码.
    是直接document.write()
    还是通过 obj.innerHTML=
    还是通过ajax以及其它方式.一句话:对症下药,辨证医治
      

  6.   

    en ,有哪个大神对动态内容代码分下类。比如动态内容是用Ajax,js,asp动态得到,谁能解释下这几种格式的原理及特点