如题,如何读取网页里的内容?例如插件或是脚本信息
公司给我分了个活,让我做个IE插件,用来捕获网页里的插件和脚本信息,
我想了想,遇到的问题如下:
1.用VC做一个什么样的插件,
我想既然是捕获用插件捕获插件,我做的插件就不能是ActiveX插件了吧,是不是应该做一个BHO插件?2.如何读取网页里的信息,主要是插件和脚本信息,
我找了个带插件的网页,用记事本打开后,发现插件的信息是
<object classid="clsid:72AEDCEB-85D6-457E-8FD1-BE75316F59B0" id="Dean" name = "Dean" codebase="d:/HTUSB.CAB#Version=1,0,0,1">
</object>
我想知道是不是所有的插件是不是这种形式的代码
<object ......>
</object>
脚本是不是这样的
<SCRIPT ...>
</SCRIPT>3 用那种方式读取网页的信息,正则表达式?还是字符串匹配,不知道还有没有其他的办法
大家帮帮忙
公司给我分了个活,让我做个IE插件,用来捕获网页里的插件和脚本信息,
我想了想,遇到的问题如下:
1.用VC做一个什么样的插件,
我想既然是捕获用插件捕获插件,我做的插件就不能是ActiveX插件了吧,是不是应该做一个BHO插件?2.如何读取网页里的信息,主要是插件和脚本信息,
我找了个带插件的网页,用记事本打开后,发现插件的信息是
<object classid="clsid:72AEDCEB-85D6-457E-8FD1-BE75316F59B0" id="Dean" name = "Dean" codebase="d:/HTUSB.CAB#Version=1,0,0,1">
</object>
我想知道是不是所有的插件是不是这种形式的代码
<object ......>
</object>
脚本是不是这样的
<SCRIPT ...>
</SCRIPT>3 用那种方式读取网页的信息,正则表达式?还是字符串匹配,不知道还有没有其他的办法
大家帮帮忙
解决方案 »
- 模拟按键无法连续重复不正常问题
- 紧急求助:VC 读取name.res(资源文件)中的图片 并保存到指定目录中去!
- 有朋友写过用于生成.cab文件的.inf文件吗?一个小问题请教
- 小问题,如何显示
- 请问CTreeCtrl节点图象问题?
- Win32 API之上的一层是指什么呀?
- vector&父类子类的问题
- 急求!用CArchive读写文件的问题
- 取得当前时间,如何插入数据库,COleDateTime oleDateStart = COleDateTime::GetCurrentTime();
- 请问各位高手有没有办法访问Word的对话框资源?
- 如果用Unicode版本 用什么类型的缓冲区存储字符串?
- 程序编译出现如下错误,请假如何解决。
2、网页中的ActiveX都是用Object标签的,可以用IHTMLDocument2::get_embeds或者IHTMLDocument2::get_plugins或者IHTMLDocument3::getElementsByTagName获得控件的集合。注意脚本中通过new ActiveXObject加载的对象不属于此列,无法获取。用IHTMLDocument2::get_scripts获得脚本元素的集合。
3、使用DOM操作网页时最好的方法。
我没做过这方面的东西,对COM和ActiveX不是很熟