怎样去检测一个字符串的语言的一致行,如(纯中文字符串中不能包含日文,日文字符串中不能出现不允许的中文),希望最好能有实现代码,方案也行!!

解决方案 »

  1.   

    unicode编码的中文不是有一个区间的吗?就像ascii编码从0~~254一样的意思
      

  2.   

    谢谢hsgrass37301,中,日文的unicode编码都有.但是日文中出现的中文编码好象也在中文的区间里面,有没有好的办法去判别这些镶嵌在日文中的中文字符是合法的呢??
      

  3.   

    unicode 是大字符集,采用2~4字节的编码,通常我们用的是16bit的,包含了很多国家的语言。
    你说的应该就是windows用的16bits的,他的日文和中文编码肯定不能重复的。要实现你这功能,你需要得到一张中文码表,根据这个码表判断每个字是否是中文。
    码表一些unicode的网站上面有,但是你需要根据你的需求自己处理。