想解析下HTML,找到了nekohtml这个工具,网上给的例子如下:package com.ctlok.pro;
 
import java.io.IOException;
 
import org.cyberneko.html.parsers.DOMParser;
import org.dom4j.Document;
import org.dom4j.Node;
import org.dom4j.io.DOMReader;
import org.xml.sax.SAXException;
 
public class Main {
 
    /**
     * @param args
     */
    public static void main(String[] args) {
        try{
            String url = "http://hk.finance.yahoo.com/q?s=0005.HK";
            
            DOMParser parser = new DOMParser();
            parser.parse(url);
            
            org.w3c.dom.Document document = parser.getDocument();
            DOMReader domReader = new DOMReader();  
            Document doc = domReader.read(document);
            
            //Element name should be upper case
            Node name = doc.selectSingleNode("//DIV[@id='quote-bar-latest']/*/H2/node()");
            Node buy = doc.selectSingleNode("//DIV[@id='quote-bar-trade-info']/TABLE/TBODY/TR[1]/TD[2]");
            Node sell = doc.selectSingleNode("//DIV[@id='quote-bar-trade-info']/TABLE/TBODY/TR[2]/TD[2]");
            
            System.out.println(name.getText());
            System.out.println("Buy: " + buy.getText().substring(2));
            System.out.println("Sell: " + sell.getText().substring(2));
        } catch (SAXException e) {
            System.out.println(e.toString());
        } catch (IOException e) {
            System.out.println(e.toString());
        }
    }
}可是我在网上下到的nekohtml各种版本里,在DOMParser类中都没有parser()方法和getDocument()方法,有谁用过吗?头都大了!