一个100M的GBK文件,随意跳到任意一个字节,如何判断该字节是否是某双字节字符的后半个字符呢,如果有对常用字符概率高的判断算法也行。
解决方案 »
- 编译时提示非法的开始表达式
- 高手救命..关于JTable和数据库的....
- 怎样获取文件的创建时间???????????
- 抛出异常,但在类型前面有一个L字母。不明白L代表什么意思。
- 请问在servlet里面可以获取session中的值吗?
- 在JTabel上作出JComboBox的问题
- 谢谢大家的帮助,最后需要简化一步,可是不知道怎么简化
- 请问static和final的区别?!(请路过的前辈赐教!!!)
- 关于throw+throws+catch谁能给出一个简短(越短越好)而且简单(不要涉及太多别的知识点),还要完整的程序?
- 请问oicq的原理是什么,运行机制是什么?用java的socket能实现吗?需要了解那些基本协议?看那些书呢?
- 在服务器上如何将客户端上传过来的io流封装成文件?
- java代码优化问题
int cp = str.codePointAt(i);
Character.isSupplementaryCodePoint(cp);//确定指定字符(Unicode 代码点)是否在增补字符范围内。
try {
byte[] temp="汉A1字".getBytes("GBK");
System.out.println("字节长度:"+temp.length+",字节与1000 0000(0X80)位与操作, 如果是0X80,就是汉字的半个字节,如果是0X00,就是ASCII");
for (int i=0;i<temp.length;i++){
byte b=temp[i];
System.out.println(i+"\t0x"+Integer.toHexString(b&0x80));
}
} catch (UnsupportedEncodingException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}