问题: 网页中的文字内容是用jcript从数组里获取的内容,以table显示出来的,我读取网页的源文件,里面没有jscript显示出来的文字,我改怎样获取这些文字信息呢?

解决方案 »

  1.   

    可以通过过滤JS脚本,来得到JS中的内容
      

  2.   

    网页显示完后,可以在IE点击查找菜单中找到这些动态文本(html源文件里没有)。
    所以我觉得我要找的字符肯定是放在内存里了,想直接通过字符查找函数来找,不知道行得通不?
      

  3.   

    就好比sina的博客上的内容怎么样获取呢,
    把网页的源文件代码复制出来,发现里面都没有博客的内容,怎么样才能获取这些动态文本呢?
      

  4.   

    像这样的脚本,<jscrpit src=“***.js">,在网页上的文本信息都是通过***.js动态的显示的,
    该怎样获取这些文本呢?难道pdoc2->get_scrtipt(pElementAll),
    pElementAll->..
    pelement...该怎么样弄呢?
      

  5.   

    1、可以用SOCKET写一个下载程序去打开JS文件,这样返回的就是JS的内容。
    2、参考http://blog.csdn.net/lion_wing/archive/2006/06/27/839134.aspx写一个Javascript的MimeFilter。例子中MimeFilter的类型是text/html,楼主需要改为application/javascript。
      

  6.   

    第一种方法可以用CInternetSession来吧
    比socket简单吧!
    呵呵!