关于JSP抓取网页

有两个文件,在同一目录下,主要功能是A.JSP要抓取B.jsp编译后的内容.现在我知道的一个方法是java.net.URL("http://localhost:8080/web/B.jsp"),这样的确可以,但是我在想在同一目录下有必要通过HTTP吗?是否有更合适的命令或思路?还有,如果我想把抓到的内容的某个特定DIV里的内容单独取出来一般是怎么个思路?

解决方案 »

免费领取超大流量手机卡，每月29元包185G流量+100分钟通话, 中国电信官方发货

java.net.URL这样是最直观的，别的方法会很麻烦。提取div这种要解析html里的内容，一般用DOM
http://qichunren.javaeye.com/blog/208984
我是这样理解你的问题，如果你的b.jsp页面里面写的全部都是html代码，没有java代码，那么你可以通过读取文件去得到b.jsp页面中的内容，如果你的页面中又java代码（比如说通过查询数据库显示），那么你就只能够通过httpConnection这样的方式去得到！
同意，不过建议用字符串切割更好。有些网站的html不规范可能导致dom出错。
至于你想把某个div里面的内容单独列出来，一般都是用正则表达式去匹配！
能具体点吗？对于DOM来解析出内容一点概念也没有
dom就是解析xml的工具；
觉得用 int start= string.indexof("<div");
int end=string.indexOf("</div>");
resutl=string.subString(start,end);
获得 div内容。
我知道这样很无耻，但是还是想最后最个问题~~
matcher.group()出内容后，是什么类型的？我可以把matcher.group()的值付给字符型，但是却不能把它转换成整型，（提取的内容都是数字的）；这是什么原因？
String ww;
      ww = matcher.group();
          out.println(ww);
  int j = Integer.parseInt(ww);