如题,如何读取网页里的内容?例如插件或是脚本信息
公司给我分了个活,让我做个IE插件,用来捕获网页里的插件和脚本信息,
我想了想,遇到的问题如下:
1.用VC做一个什么样的插件,
我想既然是捕获用插件捕获插件,我做的插件就不能是ActiveX插件了吧,是不是应该做一个BHO插件?2.如何读取网页里的信息,主要是插件和脚本信息,
我找了个带插件的网页,用记事本打开后,发现插件的信息是
<object classid="clsid:72AEDCEB-85D6-457E-8FD1-BE75316F59B0" id="Dean" name = "Dean"  codebase="d:/HTUSB.CAB#Version=1,0,0,1">
</object>
我想知道是不是所有的插件是不是这种形式的代码
<object ......>
</object>
脚本是不是这样的
<SCRIPT ...>
</SCRIPT>3 用那种方式读取网页的信息,正则表达式?还是字符串匹配,不知道还有没有其他的办法
大家帮帮忙

解决方案 »

  1.   

    1、对,做BHO
    2、网页中的ActiveX都是用Object标签的,可以用IHTMLDocument2::get_embeds或者IHTMLDocument2::get_plugins或者IHTMLDocument3::getElementsByTagName获得控件的集合。注意脚本中通过new ActiveXObject加载的对象不属于此列,无法获取。用IHTMLDocument2::get_scripts获得脚本元素的集合。
    3、使用DOM操作网页时最好的方法。
      

  2.   

    2楼能再具体些吗?
    我没做过这方面的东西,对COM和ActiveX不是很熟
      

  3.   

    能获取,每个Object对象都有classid属性,获得CLSID后直接从注册表中查,可以得到控件的所有信息。