<html>
    <title>test dom4j</title>
    <script></script>
<body>
    <div>这个div没有结束标签
    <div id = "div1" style = "border:1px solid red">this is div1</div>
    <div id = "div2" style = "border:1px solid blue">this is div2</div>  
</body>
</html>上面的HTML脚本中没有结束标签的改如何处理?

解决方案 »

  1.   

    任何解析xml的方法都是建立在xml文档结构良好的基础上
      

  2.   

    这个容错也太差了吧,如果把<br/>写成了<br>整个程序就玩完了
      

  3.   

    试试,我记得cyberneko是会自动修改错误的标签的
      

  4.   

    对HTML用HTMLparser
    别用XMLparser开源的HTMLparser 很多的。
      

  5.   


    xml也有不规范的?不规范的xml也能叫xml?
      

  6.   

    Schema 或者 DTD 先检查,要想容错是不可能的。<br> 绝对不会被认为是 <br /> 的。你知道是因为你看得懂 HTML。而且现在流行 xhtml 了,写 HTML 也必须按照 XML 的要求来走,不允许出现 <br> 这种东西。