就是 等号+中文等号是英文的等号,后面可以跟多个中文<a href="......" name=你好>你好啊</a>我想只保留“你好啊”
去掉其他东西匹配 =中文字符用 [(=)(\u4e00-\u9fa5)+] 或者 [=(\u4e00-\u9fa5)+]
但是java理解为 = 或者 中文
就把想保留的也去掉了还有中括号是什么意思啊?
写成 =(\u4e00-\u9fa5)+
就什么都匹配不上但是写成 =
就能匹配上 =
去掉其他东西匹配 =中文字符用 [(=)(\u4e00-\u9fa5)+] 或者 [=(\u4e00-\u9fa5)+]
但是java理解为 = 或者 中文
就把想保留的也去掉了还有中括号是什么意思啊?
写成 =(\u4e00-\u9fa5)+
就什么都匹配不上但是写成 =
就能匹配上 =
试试这个
Pattern p = Pattern.compile("<a [^>]+>([=\u4e00-\u9fa5]+)</a>");
String str = "<a href=\"......\" name=你好>你好啊=</a> ";
Matcher m = p.matcher(str);
while(m.find()){
System.out.println(m.group(1));
}
}
=[(\u4e00-\u9fa5)]+
这样写就可以了,呵呵