1.需求
现在有一个字符串内容:"日本語教師求人情報:スペースアルク324234Af#$SDFSDF日本語多読 "
2.代码
String regExp = "[^\u4E00-\u9FA5\uf900-\ufa2d]";
retVal=retVal.replaceAll(regExp,"");3.返回值
"日本語教師求人情報日本語多読"4.问题
虽然上述的正则能拍出非中文字符,但是对于繁体中文,它不能排除掉,如果我的需求只是要获得简体中文呢,应该如何怎么办?
根据你们的经历和经验,是否有什么好用的开源jar能帮上忙,请指教.5.帖尾
请高手指教,小生在此感谢了。临帖涕零,不知所言!
现在有一个字符串内容:"日本語教師求人情報:スペースアルク324234Af#$SDFSDF日本語多読 "
2.代码
String regExp = "[^\u4E00-\u9FA5\uf900-\ufa2d]";
retVal=retVal.replaceAll(regExp,"");3.返回值
"日本語教師求人情報日本語多読"4.问题
虽然上述的正则能拍出非中文字符,但是对于繁体中文,它不能排除掉,如果我的需求只是要获得简体中文呢,应该如何怎么办?
根据你们的经历和经验,是否有什么好用的开源jar能帮上忙,请指教.5.帖尾
请高手指教,小生在此感谢了。临帖涕零,不知所言!
String str = "日本語教師求人情報:スペースアルク324234Af#$SDFSDF日本語多読";
CharsetEncoder ce = Charset.forName("GB2312").newEncoder();
char[] chs = str.toCharArray();
for(int i = 0; i < chs.length; i++) {
if(chs[i] >= '\u4e00' && chs[i] <= '\u9faf' && ce.canEncode(chs[i])) {
System.out.println(chs[i]);
}
}
}
}