接下来我们要介绍的就是使用 JAVA 语言如何简单快速的攫取 HTML 中包含的数据。我们会借助一些现有的成熟 API 来完成这件事,因为如果仅仅是为了实现这个功能,完全没有必要自己去实现 HTML 的语法分析器。我们引入了一个开源的项目-- HTML Parser ,这是一个在 SourceForge.net 上比较活跃的项目之一,目前的最新版本是 1.4 发行版。有如 HTML Parser 网站的自我介绍: HTML Parser 是一个对现有的 HTML 进行分析的快速实时的解析器,事实上在应用过程中你更为惊叹于 HTML Parser 给你带来一些周到的处理。http://www-900.ibm.com/developerWorks/cn/java/l-html-parser/index.shtml

解决方案 »

  1.   

    还有javax.swing.text.html.HTML 里有很多类,可以试试看
      

  2.   

    我现在就是URL类不能对这个网址进行解析。其他的网址我都可以实现了,特别是一般的HTML网页。不过我不知道这个网页是否很特别
      

  3.   

    看看这几个包中的类,有你想要的
    import java.net.URL;
    import java.net.MalformedURLException;
    import javax.swing.text.*;
    import javax.swing.text.html.*;
    import java.io.*;主要是HTMLParser.Parser类,你看看吧
      

  4.   

    如果你需要分析Google的结果,那么你应该使用它所提供的Web Service接口。这样根本不需要进行什么解析之类的。可以看看这个网址:http://www.google.com/apis/
      

  5.   

    你们还是一没有听明白我的意思啊,我这个程序对其他的网页都可以的,但是就对google这个地址不行啊
      

  6.   

    我用过webservice,但是google的web service只有前面10项结果。我要100项
      

  7.   

    但是google的web service你可以继续向后取阿!
    最近google的web service从我们学校无法访问
      

  8.   

    没有啊,我用过的,无法取啊,wjsfr,你能留下你的msn或qq吗?
      

  9.   

    google不支持非正式地获得它的结果页面以便用于解析,如果只是在程序中通过URL类利用浏览器上显示的连接地址去连接它的网页,它会返回给你一个出错页面。要想利用它的结果只能是通过它提供的web service或者是模拟浏览器的功能去接受它的验证。但是好像google提供的这种web service已经停掉了,没法访问到。