怎么用java来解析html文件?
想到把HTML当做XML,然后用XML相关的类来解析,但HTML的语法比较松散,太不严格了,一个<BR>还要跟一个</BR>才行,这样根本解析不了~
大家有什么解决方法,请附上例子~~~

解决方案 »

  1.   

    你去搜索一个开源的工具,叫HtmlParse,功能非常强大,并且很简单,全部是以节点的方式进行解析的。
    另外如果你只是需要提取html里面的内容的话,建议通过JAVA的IO操作,将html读取为字符串之后通过正则表达式解析就可以完成了。
      

  2.   

    可以发个例子吗??或者帮助文档??到我邮箱也行[email protected]
    谢谢
      

  3.   

    在信息化高速发展的今天,在网上找一个例子应该很简单吧
    外事找googel,内事找baidu.
    相比学会某项技术。学会自己解决未知问题才是最重要的