我在htmlview里面用GetHtmlDocument得到了网页的源文件(确切说是XML的源文件)
可是得到的尽是这样的代码:
< H T M L > < H E A D > < T I T L E > d I L A S 纇"}觺済< / T I T L E > < L I N K h r e f = " . . / s t y l e . c s s " r e l = s t y l e s h e e t t y p e = t e x t / c s s >
< S C R I P T >
v a r c u r r e n t p o s , t i m e r ;
......
存起来没法看啊,怎么变换可以使用呢?希望给出源码,我把里面的0x00换掉了也不行啊。
可是得到的尽是这样的代码:
< H T M L > < H E A D > < T I T L E > d I L A S 纇"}觺済< / T I T L E > < L I N K h r e f = " . . / s t y l e . c s s " r e l = s t y l e s h e e t t y p e = t e x t / c s s >
< S C R I P T >
v a r c u r r e n t p o s , t i m e r ;
......
存起来没法看啊,怎么变换可以使用呢?希望给出源码,我把里面的0x00换掉了也不行啊。
you can do like this.first, from IHTMLDocument2, get body (IHTMLElement)
then get innerText.