给你一点儿思路:
javax.swing.text.html包 和javax.swing.text.html.HTMLEditorKit.*
可以做到你的要求!
处理方式类似于sax方法,但是是解析html文件!

解决方案 »

  1.   

    me!用此作过一个spider!
    你要的话给你!但是要给分!
    很早以前写的,虽然不怎么样,但是可以抛砖引玉!
      

  2.   

    很早就有老外写的tidy,你去google一下,专门解析html的
      

  3.   

    呵呵,adolfdi(牛肉火锅)兄,发来看看,不管结果怎么样,我都给分我的E_Mail 是[email protected]想写个信息搜索的东东,也不是为了买钱,只是用来作为炒股的工具,^_^