正则啦中,网上找找html解析的正则表达式

解决方案 »

  1.   

    看了半天也没发现DOMParser这个类的定义,其实,sun的工具类里就有网页解析的类,看一看javax.swing.html.HTMLEditorKit这个类,这个类里有两个内部类Parser和ParserCallback,用这两个类可以完成网页内容解析:
    public class ParserGetter extends HTMLEditorKit {
        public HTMLEditorKit.Parser getParser() {
            return super.getParser();
        }
    }public class Stripper extends HTMLEditorKit.ParserCallback {    //这里覆盖HTMLEditorKit.ParserCallback的handleText、handleComment、handleStartTag、handleEndTag、、handleSimpleTag、handleError及flush函数来进行网页解析,具体baidu或google一下}
    ......
    //将一个网页输入字符流和一个ParserCallback的实例传给Parser的parse方法就可以:
    HTMLEditorKit.Parser parser = new ParserGetter().getParser;
    InputStreamReader r = new InputStreamReader(new URL("http://topic.csdn.net").openStream());
    parser.parse(r,new Stripper(),false);