1.需求
现在有一个字符串内容:"日本語教師求人情報:スペースアルク324234Af#$SDFSDF日本語多読 "
2.代码
String regExp = "[^\u4E00-\u9FA5\uf900-\ufa2d]";
retVal=retVal.replaceAll(regExp,"");3.返回值
"日本語教師求人情報日本語多読"4.问题
虽然上述的正则能拍出非中文字符,但是对于繁体中文,它不能排除掉,如果我的需求只是要获得简体中文呢,应该如何怎么办?
根据你们的经历和经验,是否有什么好用的开源jar能帮上忙,请指教.5.帖尾
请高手指教,小生在此感谢了。临帖涕零,不知所言!

解决方案 »

  1.   

    http://www.google.com.hk/search?hl=zh-CN&newwindow=1&safe=strict&q=java+%E7%AE%80%E7%B9%81%E4%BA%92%E6%8D%A2&aq=f&aqi=&aql=&oq=&gs_rfai=
      

  2.   

    import java.nio.charset.CharsetEncoder;public class Test {    public static void main(String[] args) throws ClassNotFoundException {
            String str = "日本語教師求人情報:スペースアルク324234Af#$SDFSDF日本語多読";
            CharsetEncoder ce = Charset.forName("GB2312").newEncoder();
            char[] chs = str.toCharArray();
            for(int i = 0; i < chs.length; i++) {
                if(chs[i] >= '\u4e00' && chs[i] <= '\u9faf' && ce.canEncode(chs[i])) {
                    System.out.println(chs[i]);
                }
            }
        }
    }