虽说都是标记语言
但是html的并不严禁
比如
html中允许
<b>...<I>...</b>..</I>
而这种语法在xml中绝对不允许的
在比如
html中允许
<p>
但不写</p>
这在xml中也是不允许的因此,你的这个想法不是不可以
只不过很麻烦
要把html中所有这些违反xml格式的标记都修改正确
不过,反过来,就很简单了
因为,xml格式一定符合html的要求
要按照html格式显示
只要写一个xslt就可以了

解决方案 »

  1.   

    对你的认识我表示认同,现在关键怎样实现html-xml的转换?
      

  2.   

    个人觉得不是一个好做的事情建议
    只在html中摘取你需要的关键数据
    然后,写到规定格式的xml中去然后再为这种格式的xml定义一个xslt
    应该就可以达到你的要求不过,写文件相信不是问题
    最头痛的应该,要摘取那些数据
    最好越少越好(会方便一点)顺便问一下,是学习研究做这个事情
    还是,有这种需求啊?
    (纯属好奇)
      

  3.   

    tidy: http://tidy.sourceforge.net/
    managed tidy: http://www.mattstan.pwp.blueyonder.co.uk/tidy/tidycs.html
    可以用于把Html保存成XHTML格式。