解决方案 »
- 如何让一个类能在不调用的情况下就先执行呢?
- 关于red5服务端配置的问题
- Java 有类似Adobe Framework的Class Diagram类图海报吗?
- 求助:Java 文本写入问题
- JTable 背景色 为透明
- 高分请教:如何在JTable中创建JTree
- 上传图片到server,是传到database中,还是传到server的磁盘文件?
- jsp里如何输出<html>这个这符串
- 请教一个对象内存释放的问题:一个数据集对象rowset在使用完后,使用rowset.close()方法还是使用rowset.close();rowset=null;方法?这两
- JAVA线程命名不成功
- 求助!java文件排序代码报错,改了两天了,都没有解决!!
- java_关于构造方法的问题
Elements links = doc.getElementsByTag("a");
for(Element link : links) {
String linkHref = link.attr("href");
String linkText = link.text();
System.out.println(linkHref+"---->"+linkText);
}
没有递归的找出相应的子urI
有遗漏吗?比如?
你就解析当前页,http://bbs.csdn.net/topics/390767869。我看下,谢谢。
Document doc = Jsoup.connect("http://bbs.csdn.net/topics/390767869").get();
Elements links = doc.getElementsByTag("a");
for(Element link : links) {
String linkHref = link.attr("href");
String linkText = link.text();
System.out.println(linkHref+"---->"+linkText);
}
你只是将http://bbs.csdn.net/topics/390767869页面中的链接提取出来了,但是我要的是还要将其子链接再次提取出来。
比如说:/help#user_criterion是该页面的一个子链接,我现在也要递归的提取/help#user_criterion页面下的链接,一直这么递归的去提取。
你一样递归再调用
Document doc = Jsoup.connect("http://bbs.csdn.net/help#user_criterion").get();
Elements links = doc.getElementsByTag("a");
for(Element link : links) {
String linkHref = link.attr("href");
String linkText = link.text();
System.out.println(linkHref+"---->"+linkText);
}
不过要处理下递归跳出的条件。防止溢出。