正则啦中,网上找找html解析的正则表达式
解决方案 »
- spring + hibernate 存储Blob类型数据 违反读取顺序
- java EE学习(开始)
- datagrid 返回函数刷新问题 本人小白啊求高手指点
- 数据库更新后,java怎么知道更新了哪些数据?
- Itext生成PDF的问题,表格和图片错位重叠
- MyEclipse 中写struts程序路径的问题, 急急急!!!
- ibatis 里的可以执行多个SQL语句吗?
- 匈牙利命名是否被淘汰了!
- getJdbcTemplate().queryForList的返回值取值问题
- 现在公司做项目还有uml建模么?
- 使用 hibernate 分页查询的效率疑问
- 公司一般使用哪种应用服务器(除了tomcat外)
public class ParserGetter extends HTMLEditorKit {
public HTMLEditorKit.Parser getParser() {
return super.getParser();
}
}public class Stripper extends HTMLEditorKit.ParserCallback { //这里覆盖HTMLEditorKit.ParserCallback的handleText、handleComment、handleStartTag、handleEndTag、、handleSimpleTag、handleError及flush函数来进行网页解析,具体baidu或google一下}
......
//将一个网页输入字符流和一个ParserCallback的实例传给Parser的parse方法就可以:
HTMLEditorKit.Parser parser = new ParserGetter().getParser;
InputStreamReader r = new InputStreamReader(new URL("http://topic.csdn.net").openStream());
parser.parse(r,new Stripper(),false);