public static List<String> parser(String html, String rex) { List<String> l = new ArrayList<String>(); Pattern p = Pattern.compile(rex); Matcher m = p.matcher(html); while (m.find()) { if (m.group(1)!=null){ l.add(m.group(1)); } } return l; }html 是你要解析的内容 rex是需要的截取的内容匹配正则
可以用正则表达式String s = "<img src="xxxx.[jpg,bmp,png...]" >"; Pattern p = Pattern.compile("<img.*?>"); Matcher m = p.matcher(s); while (m.find()) { System.out.println(m.group()); }
使用String类的indexOf(),substring()方法,截取jpg,bmp,png...字符串
再使用StringTokenizer类来解析就行了
List<String> l = new ArrayList<String>();
Pattern p = Pattern.compile(rex);
Matcher m = p.matcher(html);
while (m.find()) { if (m.group(1)!=null){
l.add(m.group(1));
}
}
return l;
}html 是你要解析的内容 rex是需要的截取的内容匹配正则
Pattern p = Pattern.compile("<img.*?>");
Matcher m = p.matcher(s);
while (m.find()) {
System.out.println(m.group());
}
<img alt="" src="http://localhost:80/zhj/huangcan/document/1000/0/20111011092323_95.png" width="200" height="200" />
只取20111011092323_95.png而已
2.通过String.lastIndexOf('/')和String.lastIndexOf('"')获取文件名。
String[] strs1 = str.split("/");
String[] strs2 = strs1[strs1.length-2].split("'");
System.out.println(strs2[0]);
}