关于JSP抓取网页 有两个文件,在同一目录下,主要功能是A.JSP要抓取B.jsp编译后的内容.现在我知道的一个方法是java.net.URL("http://localhost:8080/web/B.jsp"),这样的确可以,但是我在想在同一目录下有必要通过HTTP吗?是否有更合适的命令或思路?还有,如果我想把抓到的内容的某个特定DIV里的内容单独取出来一般是怎么个思路? 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 java.net.URL这样是最直观的,别的方法会很麻烦。提取div这种要解析html里的内容,一般用DOM http://qichunren.javaeye.com/blog/208984 我是这样理解你的问题,如果你的b.jsp页面里面写的全部都是html代码,没有java代码,那么你可以通过读取文件去得到b.jsp页面中的内容,如果你的页面中又java代码(比如说通过查询数据库显示),那么你就只能够通过httpConnection这样的方式去得到! 同意,不过建议用字符串切割更好。有些网站的html不规范可能导致dom出错。 至于你想把某个div里面的内容单独列出来,一般都是用正则表达式去匹配! 能具体点吗?对于DOM来解析出内容一点概念也没有 dom就是解析xml的工具;觉得用 int start= string.indexof("<div");int end=string.indexOf("</div>");resutl=string.subString(start,end);获得 div内容。 我知道这样很无耻,但是还是想最后最个问题~~matcher.group()出内容后,是什么类型的?我可以把matcher.group()的值付给字符型,但是却不能把它转换成整型,(提取的内容都是数字的);这是什么原因?String ww; ww = matcher.group(); out.println(ww); int j = Integer.parseInt(ww); 如何配置负载均衡 急求:action获取隐藏表单的信息 struts插‘中文数据’到SQLSERVER中遇到的问题! jsp里实现打印功能 有人知道如何使用ibatis实现复合条件查询吗? 济南的进来看看 问一个Java开发网站的问题 如何控制SESSION的生命周期 请问那里有ASP、JSP的免费空间?(无内容) 浏览器如果把cookie禁用了,怎么使用session呢? 利用SchemaExport导数据库出错 xml格式字符串解析后,插入数据库
能具体点吗?对于DOM来解析出内容一点概念也没有
觉得用 int start= string.indexof("<div");
int end=string.indexOf("</div>");
resutl=string.subString(start,end);
获得 div内容。
matcher.group()出内容后,是什么类型的?我可以把matcher.group()的值付给字符型,但是却不能把它转换成整型,(提取的内容都是数字的);这是什么原因?
String ww;
ww = matcher.group();
out.println(ww);
int j = Integer.parseInt(ww);