有两个文件,在同一目录下,主要功能是A.JSP要抓取B.jsp编译后的内容.现在我知道的一个方法是java.net.URL("http://localhost:8080/web/B.jsp"),这样的确可以,但是我在想在同一目录下有必要通过HTTP吗?是否有更合适的命令或思路?还有,如果我想把抓到的内容的某个特定DIV里的内容单独取出来一般是怎么个思路?

解决方案 »

  1.   

    java.net.URL这样是最直观的,别的方法会很麻烦。提取div这种要解析html里的内容,一般用DOM
      

  2.   

    http://qichunren.javaeye.com/blog/208984
      

  3.   

    我是这样理解你的问题,如果你的b.jsp页面里面写的全部都是html代码,没有java代码,那么你可以通过读取文件去得到b.jsp页面中的内容,如果你的页面中又java代码(比如说通过查询数据库显示),那么你就只能够通过httpConnection这样的方式去得到!
      

  4.   

    同意,不过建议用字符串切割更好。有些网站的html不规范可能导致dom出错。
      

  5.   

    至于你想把某个div里面的内容单独列出来,一般都是用正则表达式去匹配!
      

  6.   


    能具体点吗?对于DOM来解析出内容一点概念也没有
      

  7.   

    dom就是解析xml的工具;
    觉得用 int start= string.indexof("<div");
    int end=string.indexOf("</div>");
    resutl=string.subString(start,end);
    获得 div内容。
      

  8.   

    我知道这样很无耻,但是还是想最后最个问题~~
    matcher.group()出内容后,是什么类型的?我可以把matcher.group()的值付给字符型,但是却不能把它转换成整型,(提取的内容都是数字的);这是什么原因?
    String ww;
          ww = matcher.group();
              out.println(ww);
      int j = Integer.parseInt(ww);