我想抓个网站,http:www.espn.com,抓取espn足球部分数据,想用nekohtml来解析,但是小弟对网页定位不是很了解,比如我想抓取url为http://soccernet.espn.go.com/?cc=4716,网页中排名数据,
Portuguese Liga
May 18, 2009 GP PT
FC Porto 29 69
Sporting Lisbon 29 63
Benfica 29 56
CD Nacional de Madeira 29 52
Braga 29 49
Leixoes 29 42
Académica de Coimbra 29 39
Maritimo 29 37
Guimaraes 29 35
Estrela Amadora 29 34
Paços de Ferreira 29 31
Naval 1º Maio 29 28
Rio Ave 29 27
Vitoria Setubal 29 25
Belenenses 29 24
Trofense 29 23
就是这部分,有人能给我个完整的例子吗?我现在不清楚怎么能够定位到这部分,然后取出内容
Portuguese Liga
May 18, 2009 GP PT
FC Porto 29 69
Sporting Lisbon 29 63
Benfica 29 56
CD Nacional de Madeira 29 52
Braga 29 49
Leixoes 29 42
Académica de Coimbra 29 39
Maritimo 29 37
Guimaraes 29 35
Estrela Amadora 29 34
Paços de Ferreira 29 31
Naval 1º Maio 29 28
Rio Ave 29 27
Vitoria Setubal 29 25
Belenenses 29 24
Trofense 29 23
就是这部分,有人能给我个完整的例子吗?我现在不清楚怎么能够定位到这部分,然后取出内容
解决方案 »
- 有人用过jfreechart0.9.21版本的画过仪表图么?[
- 新手求教
- crystalReport2008 web for java----passResultSet issue
- 在strues2中 s:textfield中的label如何改变风格
- 急求文件上传代码!在线等
- 2000分求助,关于dsoframer装载的EXCEL文件提交到服务端接收时,时有文件损坏的问题,分不够再开贴给分,项者有分
- 紧急在线2小时(如何配置iis泛域名解析,在iis如何设置,有现成的配置方案个好)【项目很急请高手帮忙】
- 请问如何再页面中显示一个是或否的对话框???
- <s:if test 调用Java类的方法的问题
- 如何把数据保存到一个文本文件中,并且如何从文本文件中读出数据?
- md5crypt 密码验证问题????????
- 通过地址传中文参数乱码问题
import java.net.HttpURLConnection;
import java.net.URL;
import org.cyberneko.html.parsers.DOMParser;
import org.w3c.dom.Document;
import org.w3c.dom.Node;
import org.xml.sax.InputSource;public class Test {
public static void main(String[] argv) throws Exception { URL url = new URL(
"http://topic.csdn.net/u/20090521/11/db336c07-2dbc-4732-8229-cb99fcb9d10e.html");
HttpURLConnection connection = (java.net.HttpURLConnection)url.openConnection();
connection.connect();
InputStream stream = connection.getInputStream();
DOMParser parser = new DOMParser();
parser.setProperty("http://cyberneko.org/html/properties/default-encoding","utf-8");
parser.parse(new InputSource(stream));
Document doc = parser.getDocument();
Node kokobox = doc.getElementById("reply57194353_body");
print(kokobox, "");
} public static void print(Node node, String indent) {
System.out.println(node.getTextContent());
} }