你的目的是要图片,还是要内容,如果只是要内容的话可以这样Parser parser = new Parser(url);
parser.setEncoding("gbk");//页面编码每次根据爬的网页进行修改
// 得到所有经过过滤的标签
NodeList list = parser.extractAllNodesThatMatch(new NodeClassFilter(LinkTag.class));
for (int i = 0; i < list.size(); i++) {
Node tag = list.elementAt(i);
if (tag instanceof LinkTag)
// linktag是 <a> 标签,还有其他的标签,比如div,image什么的
{
LinkTag link = (LinkTag) tag;
String linkUrl = link.getLink()+"/line1";
//把符合条件的url存到list中
String name = link.getLinkText();
System.out.println(linkUrl + "**********" + name);
}
}
parser.setEncoding("gbk");//页面编码每次根据爬的网页进行修改
// 得到所有经过过滤的标签
NodeList list = parser.extractAllNodesThatMatch(new NodeClassFilter(LinkTag.class));
for (int i = 0; i < list.size(); i++) {
Node tag = list.elementAt(i);
if (tag instanceof LinkTag)
// linktag是 <a> 标签,还有其他的标签,比如div,image什么的
{
LinkTag link = (LinkTag) tag;
String linkUrl = link.getLink()+"/line1";
//把符合条件的url存到list中
String name = link.getLinkText();
System.out.println(linkUrl + "**********" + name);
}
}
解决方案 »
- 代理模式讨论
- [满意答案给100分]设计模式 Command模式求教
- 我们老师让我们做一个题(见贴子),我看了很久,写了些类,但真的想不到该咋处理了。
- could not find PropertyAccessor class: method是一个什么错误?怎么解决?
- 关于struts2,更改本地系统语言原可用系统报错问题!
- 智力面试题
- 求教,hibernate beginTransaction() 死锁
- 100分求助:关于Apache Tomcat/4.0.6 - HTTP Status 404 - /………的问题
- 用什么方法吧Int转换成String 或者char!!?
- J2EE的范畴太广了,大家说说,主要该学什么才好???
- poi读取docx文档时出现问题
- hibernate注解配置集合映射list
http://topic.csdn.net/u/20080819/13/b737953f-a449-45a4-bd2c-0270a7ddb0a3.html