本帖最后由 java2000_net 于 2008-08-04 20:54:50 编辑

解决方案 »

  1.   

    HTTPREQUEST是可以获取页面的HTML代码的,分析就是对HTML代码分析
      

  2.   

    URL url = new URL("http://www.yahoo.com");
    DataInputStream in = new DataInputStream(url.openStream());
    String input;
    while((input = in.readLine()) != null)
    {
    System.out.println(input);
    }
    in.close();and use regular express in String "input"
      

  3.   

    HTMLParser之类的开源的类库还是很多的.
      

  4.   

    http://htmlparser.sourceforge.ne
    这个解析还不错,用过一点点感觉很非常强大
      

  5.   

    解析工具很多这也是一个: http://www.jspx.net/help/jtxml/index.html