因为需要读取HTML标签里的内容进行处理不知道哪位大虾有处理HTML的程序或者类包

解决方案 »

  1.   

    我们在做项目中使用过dom包,他把html当成一个数来对待,你想要的文本信息通常被认作为叶子节点,可以比较容易的便利得到,另外还有过一点sax包,两者主要区别就是sax随机加载文件,而dom一次性加载。具体的使用网上搜下有很多的
      

  2.   

    有个开源软件叫HtmlParser,好像可以,自己也没有用过,lz可以到java开源大全查下