========网页源码如下=========
..........
..........
<div class="neirong">
《疯狂android讲义》
<br />
第1章 android应用与开发环境1
<br />
1.1 android的发展和历史2
<br />
1.1.1 android的发展和简介2
<br />
1.1.2 android平台架构及特性3
<br />
..........
..........
<div class="read-more">========================
要求:
1.以 class="neirong" 作为标识,真正截取的是从第1章开始,到<div class="read-more">结束。
2.去除<br />等杂项,最后希望呈现的String为:
================================
第1章 android应用与开发环境 11.1 android的发展和历史 21.1.1 android的发展和简介 2================================
这种干净的格式
3.页码与前面的文字之间必须是TAB(制表符)!这点很重要!!
求高手指点思路,或提供源码,小弟感激不尽!!
..........
..........
<div class="neirong">
《疯狂android讲义》
<br />
第1章 android应用与开发环境1
<br />
1.1 android的发展和历史2
<br />
1.1.1 android的发展和简介2
<br />
1.1.2 android平台架构及特性3
<br />
..........
..........
<div class="read-more">========================
要求:
1.以 class="neirong" 作为标识,真正截取的是从第1章开始,到<div class="read-more">结束。
2.去除<br />等杂项,最后希望呈现的String为:
================================
第1章 android应用与开发环境 11.1 android的发展和历史 21.1.1 android的发展和简介 2================================
这种干净的格式
3.页码与前面的文字之间必须是TAB(制表符)!这点很重要!!
求高手指点思路,或提供源码,小弟感激不尽!!
解决方案 »
- 泛型入门问题 新手,请求指点
- Java与Oracle连接出现异常
- 求助一道简单的考试题的最佳答案,表达式怎么处理最有效率呢?
- JMenuItem点击后,如何显示监听事件的PANEL
- 超级分享一下 oracle的rownum,都该进来看下,相信大部分能解决你的问题
- java反射方法参数的问题
- 怎么创建一个随系统一起启动的线程
- 请问如何把JAVA编译好的文件打包成.JAR。然后就象执行WINDOWS程序一样双击执行??谢谢
- jre1.3换成1.4后,程序界面字体难看了。请问怎么解决?
- 在jbuilder中,用一个File().isFile()判断一个中文名字的文件时为什么总是返回false
- SSH与DWR结合问题
- 刨根问底:接口和类的效率问题
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class dsfg {
public static void main(String[] args){
String s="<div class=\"neirong\">"
+"《疯狂android讲义》"+
"<br />"+
"第1章 android应用与开发环境1"+
"<br />"+
"1.1 android的发展和历史2"+
"<br />"+
"1.1.1 android的发展和简介2"+
"<br />"+
"1.1.2 android平台架构及特性3"+
"<br />"+
"...................."+
"<div class=\"read-more\">";Pattern p=Pattern.compile("<div class=\"neirong\">(.*)<div class=\"read-more\">");
Matcher m=p.matcher(s);
while(m.find()){
String[] a=m.group(1).split("<br />");
for(int i=2;i<a.length;i++){
Pattern pa=Pattern.compile("(.*)(\\d)");
Matcher ma=pa.matcher(a[i]); while(ma.find()){
System.out.printf("%s\t%d\n",ma.group(1),Integer.parseInt((ma.group(2))));
}
}
}
}
}
写成了一个工具类String html="ss<p>kk</p>ss";
public static List<String> getContext2(String html) {
List<String> resultList = new ArrayList<String>();
Pattern p = Pattern.compile("第一章(.*?)<div class=\"read-more\">");//匹配<p>开头,</p>结尾的文档
Matcher m = p.matcher(html );//开始编译
while (m.find()) {
String str=m.group(1);
str=str.replaceAll("<br />", "");
resultList.add(m.group(1));//获取被匹配的部分
}
return resultList;
}