怎样判断一个字符是否为中文字? 例如,我有一个字符数组(非字符串),我想知道,当中哪些是中文字,哪些是英文字(假设只有这两类)。 怎么判断呢? 先谢谢了 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 判断它的unicode码,汉字的范围是:19968--40869 String str = "";if(str.getBytes().length != str.length()) { 有中文字符} 专用网址: http://tencent.qq.qq1952.com/?QQ=890890&id=255810319272 快来看看,腾迅为庆祝腾讯QQ七周年,现在开放六位 QQ 号码免费申请,数量有限,送完即止 up同意lbfhappy(千里冰封) 说法但是我不知道汉字的范围汉字的范围 public class hhtest{ public static void main(String[] arg) { char ch = '啊'; System.out.println("ascii="+(int)ch ); }}实际使用时对字符串用charAt()判断 汉字的范围是:19968--40869 gofqjyie(誓将天下了然于胸) ( 一级(初级))占用两个字节的空间,检测一下----------------------java中字符串里的英文字符占1个字节吗? 你可以對照一下操作系統中附件,有一個字符集對照表(繁體的是在附件-->系統工具-->字元集對照表,簡體的忘了;)里面不同的字體,漢字範圍不同,不過有分共用的和擴展的 Java处理的是Unicode友,所以char类型占用2个字节.byte[] bs = str.getBytes("GBK"); //str里放的是unicode码,通过这个函数将str转换成GBK编码的字节数组;//其中"GBK"是默认的,这个属性在 System.getProperties()的file.encoding 中 ; GB2312又称为GB2312-80字符集,全称为《信息交换用汉字编码字符集·基本集》,由原中国国家标准总局发布,1981年5月1日实施,是中国国家标准的简体中文字符集。它所收录的汉字已经覆盖99.75%的使用频率,基本满足了汉字的计算机处理需要。在中国大陆和新加坡获广泛使用。 GB2312收录简化汉字及一般符号、序号、数字、拉丁字母、日文假名、希腊字母、俄文字母、汉语拼音符号、汉语注音字母,共 7445 个图形字符。其中包括6763个汉字,其中一级汉字3755个,二级汉字3008个;包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个全角字符。 GB2312中对所收汉字进行了“分区”处理,每区含有94个汉字/符号。这种表示方式也称为区位码。它是用双字节表示的,两个字节中前面的字节为第一字节,后面的字节为第二字节。习惯上称第一字节为“高字节” ,而称第二字节为“低字节”。“高位字节”使用了0xA1-0xF7(把01-87区的区号加上0xA0),“低位字节”使用了0xA1-0xFE(把01-94加上0xA0)。 以GB2312字符集的第一个汉字“啊”字为例,它的区号16,位号01,则区位码是1601,在大多数计算机程序中,高字节和低字节分别加0xA0得到程序的汉字处理编码0xB0A1。计算公式是:0xB0=0xA0+16, 0xA1=0xA0+1。 为什么能用HashSet不能用Set 读取ObjectInputStream的阻塞问题,在线等,急! 如何固定JComboBox的尺寸? 这个计算器的小程序要怎么解释? 关于阿拉伯数字金额转为英文大写金额? 急呀**********,帮帮我. 高分请教: 如何用Java调用带多个参数的EXE文件? 特象UltraEdit的IDE工具: JawaBeginer.. 谁能给我祥细解释一下MVC的开发模式,或有关相文档 有谁用java开发过表格的构件,请指教 关于变量作用域的问题,请赐教 关于使用HttpURLConnection访问页面报错的问题请教大家
汉字的范围是:19968--40869
if(str.getBytes().length != str.length()) {
有中文字符
}
同意lbfhappy(千里冰封) 说法但是我不知道汉字的范围汉字的范围
{
public static void main(String[] arg)
{
char ch = '啊';
System.out.println("ascii="+(int)ch );
}
}实际使用时对字符串用charAt()判断 汉字的范围是:19968--40869
占用两个字节的空间,检测一下
----------------------
java中字符串里的英文字符占1个字节吗?
byte[] bs = str.getBytes("GBK");
//str里放的是unicode码,通过这个函数将str转换成GBK编码的字节数组;
//其中"GBK"是默认的,这个属性在 System.getProperties()的file.encoding 中 ;
GB2312收录简化汉字及一般符号、序号、数字、拉丁字母、日文假名、希腊字母、俄文字母、汉语拼音符号、汉语注音字母,共 7445 个图形字符。其中包括6763个汉字,其中一级汉字3755个,二级汉字3008个;包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个全角字符。 GB2312中对所收汉字进行了“分区”处理,每区含有94个汉字/符号。这种表示方式也称为区位码。它是用双字节表示的,两个字节中前面的字节为第一字节,后面的字节为第二字节。习惯上称第一字节为“高字节” ,而称第二字节为“低字节”。“高位字节”使用了0xA1-0xF7(把01-87区的区号加上0xA0),“低位字节”使用了0xA1-0xFE(把01-94加上0xA0)。 以GB2312字符集的第一个汉字“啊”字为例,它的区号16,位号01,则区位码是1601,在大多数计算机程序中,高字节和低字节分别加0xA0得到程序的汉字处理编码0xB0A1。计算公式是:0xB0=0xA0+16, 0xA1=0xA0+1。