"文"的 GB2312 编码是 CEC4 还是 4636?通过以下代码得到的是 CEC4byte[] array = str.getBytes("GB2312");但是, 我在网上查到的有两个, 是怎么回事?1. 4636
出处: http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=%E6%96%872. CEC4
出处: http://www.knowsky.com/resource/gb2312tbl.htm 

解决方案 »

  1.   

    xml spy,编辑<?xml version="1.0" encoding="GB2312"?>
    <root>文</root>
    之后用UE,16进制下看到的是CE C4
      

  2.   

    CEC4, 这是UE的结果.
    为什么http://www.unicode.org/cgi-bin/GetUnihanData.pl 上查到的不是这个呢?
      

  3.   

    CEC4是正解   gb2312中有4636?好奇
      

  4.   

    根据 GB2312 的编码规则, 4636 是"文"的 GB2312编码, 而 CEC4 是 它的 EUC 形式, 关系如下:
    46 = 0x2E, 36 = 0x24
    0xA0 + 0x2E = 0xCE
    0xA0 + 0x24 = 0xC4
    所以得到了 CEC4 这个编码Thank you all the same.
      

  5.   

    EUC 的资料参: 
    http://zh.wikipedia.org/wiki/EUC
      

  6.   

    4636 是 Unicode 编码,而那个链接后面的 E6 96 87 是这个字的 UTF-8 编码。