faint, 我想要得是java编的可以parse html的类库,不是html编写工具阿!

解决方案 »

  1.   

    我知道xerces可以,但是它的文档说它的html parse是基于xml的,所以只对well formed html可以保证结果阿.
      

  2.   

    python的更多,我给你找过,java的好像确实没有
    至于Xerces的,必须是XHTML
      

  3.   

    好了,给你找到了一个,不过是简单解析器,C++源码,你可以自己移植到Java上
    但是好用稳定我不敢保证,因为我没用过,只是看大家都找不到,先给你吧:)
    http://61.144.25.119/gate/big5/www.w3.org/Library/src/HTML.html
      

  4.   

    hehe, 谢谢.
    其实我找到了java的,不过都比较老,想看看大家有没有新的好用的推荐一下,看来是没什么人用过. 
    我找得在这里:http://www.innovation.ch/java/HTTPClient/
      

  5.   

    Html的解析器确实很少有人用到