package com.sydica;import org.htmlparser.Parser;
import org.htmlparser.visitors.HtmlPage;/**
* @author water
*
*/
public class HtmlParserTool {
public static void main(String[] args) throws Exception{
String filePath="http://bangyan2003.javaeye.com";
ParseFunction(filePath);
} public static void ParseFunction(String content) throws Exception{
Parser parser = new Parser(content);
parser.setEncoding("GBK");
HtmlPage visitor = new HtmlPage(parser);
parser.visitAllNodesWith(visitor);
String parseTitle = visitor.getTitle();
System.out.println(parseTitle); }
}
import org.htmlparser.visitors.HtmlPage;/**
* @author water
*
*/
public class HtmlParserTool {
public static void main(String[] args) throws Exception{
String filePath="http://bangyan2003.javaeye.com";
ParseFunction(filePath);
} public static void ParseFunction(String content) throws Exception{
Parser parser = new Parser(content);
parser.setEncoding("GBK");
HtmlPage visitor = new HtmlPage(parser);
parser.visitAllNodesWith(visitor);
String parseTitle = visitor.getTitle();
System.out.println(parseTitle); }
}
解决方案 »
- 请教关于spring事务管理的怪问题,事务没有自动提交。大哥们请帮帮忙!
- org.apache.jasper.JasperException: Unable to compile class for JSP
- onclick 跳转 双击表格任一行,获取该行所有列的值 并且怎么把值传递给frameset设定的另外一个frame
- 关于class类的问题``````!!
- memcached里的weights是做什么的,有什么用处
- struts中html:checkbox更改记录时自行选中或不选
- spring+hibernate+struts任务调度的问题!
- 需一名java网站设计人员
- EJB中有关序列的问题!
- 如何在hibernate下使用复合主键,需要注意什么问题,请大家各个小例子作参考好吗?有些着急
- 关于用struts框架验证的问题
- step中的permission跟 action中的restrict-to 之间的含义和关系
这里主要是把protected static final String DEFAULT_CHARSET = "ISO-8859-1";
修改成protected static final String DEFAULT_CHARSET = "gb2312";
--因为采用默认的字符集"ISO-8859-1"对含有中文的html文件进行分析的时候就会出现乱码。必须进行new String(str.getBytes("ISO-8859-1"),"GB2312")的转换工作。对于修改好的htmlparser工具包,需要重新压缩成.jar文件,放到jdk的工作环境中。