"文"的 GB2312 编码是 CEC4 还是 4636?通过以下代码得到的是 CEC4byte[] array = str.getBytes("GB2312");但是, 我在网上查到的有两个, 是怎么回事?1. 4636
出处: http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=%E6%96%872. CEC4
出处: http://www.knowsky.com/resource/gb2312tbl.htm
出处: http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=%E6%96%872. CEC4
出处: http://www.knowsky.com/resource/gb2312tbl.htm
<root>文</root>
之后用UE,16进制下看到的是CE C4
为什么http://www.unicode.org/cgi-bin/GetUnihanData.pl 上查到的不是这个呢?
46 = 0x2E, 36 = 0x24
0xA0 + 0x2E = 0xCE
0xA0 + 0x24 = 0xC4
所以得到了 CEC4 这个编码Thank you all the same.
http://zh.wikipedia.org/wiki/EUC