接下来我们要介绍的就是使用 JAVA 语言如何简单快速的攫取 HTML 中包含的数据。我们会借助一些现有的成熟 API 来完成这件事,因为如果仅仅是为了实现这个功能,完全没有必要自己去实现 HTML 的语法分析器。我们引入了一个开源的项目-- HTML Parser ,这是一个在 SourceForge.net 上比较活跃的项目之一,目前的最新版本是 1.4 发行版。有如 HTML Parser 网站的自我介绍: HTML Parser 是一个对现有的 HTML 进行分析的快速实时的解析器,事实上在应用过程中你更为惊叹于 HTML Parser 给你带来一些周到的处理。http://www-900.ibm.com/developerWorks/cn/java/l-html-parser/index.shtml
import java.net.URL;
import java.net.MalformedURLException;
import javax.swing.text.*;
import javax.swing.text.html.*;
import java.io.*;主要是HTMLParser.Parser类,你看看吧
最近google的web service从我们学校无法访问