使用webbrowse得到网页的htmldocument,怎么转他转成xml

解决方案 »

  1.   

    IHTMLElement p = htmldocument.body;
    string str = p.OutHtml;
    剩下的用File类把这个string存为xml即可
      

  2.   

    转成xmldocument还是xml文件html本身就是xml
      

  3.   

    hdt(倦怠) 
    转换出来的文件不符号xml标准,有错误
    我是直接使用
    htmldocument.body.outhtml
    ====
    lovefootball(蟑螂) 
    html本身是xml但有很多网页不是按照标准来写的。所以先得到网页的htmldocument再转xml
    转成xmldocument还是xml文件 无所谓,也可以转成流
      

  4.   

    如果html不符合xml,你没法转
      

  5.   

    但htmdocument对象已经是结构化的呀。
      

  6.   

    http://www.codeplex.com/Wiki/View.aspx?ProjectName=htmlagilitypack
      

  7.   

    一般html不是标准的xml,比如<p>这样不封闭的标记在xml里是错误的,但是在html里面则是合法的。先看看你要转换的html文档是否合法再说。
      

  8.   

    http://www.gotdotnet.com/Community/UserSamples/Details.aspx?SampleGuid=B90FDDCE-E60D-43F8-A5C4-C3BD760564BC
    可以实现html到xml的转化