想解析下HTML,找到了nekohtml这个工具,网上给的例子如下:package com.ctlok.pro;
import java.io.IOException;
import org.cyberneko.html.parsers.DOMParser;
import org.dom4j.Document;
import org.dom4j.Node;
import org.dom4j.io.DOMReader;
import org.xml.sax.SAXException;
public class Main {
/**
* @param args
*/
public static void main(String[] args) {
try{
String url = "http://hk.finance.yahoo.com/q?s=0005.HK";
DOMParser parser = new DOMParser();
parser.parse(url);
org.w3c.dom.Document document = parser.getDocument();
DOMReader domReader = new DOMReader();
Document doc = domReader.read(document);
//Element name should be upper case
Node name = doc.selectSingleNode("//DIV[@id='quote-bar-latest']/*/H2/node()");
Node buy = doc.selectSingleNode("//DIV[@id='quote-bar-trade-info']/TABLE/TBODY/TR[1]/TD[2]");
Node sell = doc.selectSingleNode("//DIV[@id='quote-bar-trade-info']/TABLE/TBODY/TR[2]/TD[2]");
System.out.println(name.getText());
System.out.println("Buy: " + buy.getText().substring(2));
System.out.println("Sell: " + sell.getText().substring(2));
} catch (SAXException e) {
System.out.println(e.toString());
} catch (IOException e) {
System.out.println(e.toString());
}
}
}可是我在网上下到的nekohtml各种版本里,在DOMParser类中都没有parser()方法和getDocument()方法,有谁用过吗?头都大了!
import java.io.IOException;
import org.cyberneko.html.parsers.DOMParser;
import org.dom4j.Document;
import org.dom4j.Node;
import org.dom4j.io.DOMReader;
import org.xml.sax.SAXException;
public class Main {
/**
* @param args
*/
public static void main(String[] args) {
try{
String url = "http://hk.finance.yahoo.com/q?s=0005.HK";
DOMParser parser = new DOMParser();
parser.parse(url);
org.w3c.dom.Document document = parser.getDocument();
DOMReader domReader = new DOMReader();
Document doc = domReader.read(document);
//Element name should be upper case
Node name = doc.selectSingleNode("//DIV[@id='quote-bar-latest']/*/H2/node()");
Node buy = doc.selectSingleNode("//DIV[@id='quote-bar-trade-info']/TABLE/TBODY/TR[1]/TD[2]");
Node sell = doc.selectSingleNode("//DIV[@id='quote-bar-trade-info']/TABLE/TBODY/TR[2]/TD[2]");
System.out.println(name.getText());
System.out.println("Buy: " + buy.getText().substring(2));
System.out.println("Sell: " + sell.getText().substring(2));
} catch (SAXException e) {
System.out.println(e.toString());
} catch (IOException e) {
System.out.println(e.toString());
}
}
}可是我在网上下到的nekohtml各种版本里,在DOMParser类中都没有parser()方法和getDocument()方法,有谁用过吗?头都大了!
解决方案 »
- 无法打开登录 'StudentManage' 中请求的数据库。登录失败。这是什么原因?
- 关于在JSP页中插FLASH后播放的问题
- 各位高手请帮帮小弟吧 看看是什么错误这是 十分感谢啊
- 请教用JSP作网页开发的时的一些配置问题
- cas问题
- 急,高分求:Tomcat中如何配置与IP对应的虚拟主机
- 在武汉的兄弟进来看下~~(送50分)
- 如何将一个字符串转化为一上数组?
- 求教异常getOutputStream() has already been called for this response
- 请问这是什么错误(数据源应该没问题),分虽然少,但一定给,只要您是前5命回复者中恢复最好的一位!?java.sql.SQLException: [Microsoft][ODBC SQL Server Driver]COUNT 栏位不正确
- ssh框架整合时出了问题
- 求一个纯粹用struts2写的操作数据库的小项目
parser.parse(url);
org.w3c.dom.Document document = parser.getDocument();这两个方法在我现在到的jar包里都没有,为什么呢!!