unicode字符集只能表示65536个编码,为何说全世界都够用呢?中国的字符就几万个呀?
-----------------------------------------------
对 unicode 还是有点不解,资料上说,全世界都够用了,
但是我不明白,中国现在字符,就有几万个吧。
全世界这么多文字,难道65536真是够用了吗?

解决方案 »

  1.   

    http://d.download.csdn.net/down/2417395/zj0832自己看看
      

  2.   

    你自己找吧,反正肯定够用了,汉字的范围是4e00-9fa5
      

  3.   

    Unicode包含了超过十万个字符(在2005年,Unicode的第十万个字符被采纳且认可成为标准之一)、一组可用以作为视觉参考的代码图表、一套编码方法与一组标准字符编码、一套包含了上标字、下标字等字符特性的枚举等。
      

  4.   

    UTF-8 是用得比较多的,足以包含所有的字符了。所有语言中也就汉语字符多些,其他都没那么多。
      

  5.   

    真正标准的unicode是4字节的,2字节的unicode只包含了最常用的一个平面
      

  6.   

    中文unicode 4e00-9fa5
    begin = 19968; 
    end = 40869;
    确实就只有这些了这是经过了好多年的演变而得出的最终值
    如果有兴趣可以看看汉字编码发展历史
    http://bbs.unispim.com/viewthread.php?tid=254
      

  7.   

    Unicode 从 5.0 版本开始编码范围从 U+0000~U+10FFFF,可以容纳 1114112 个字符!Java 从 JDK 5 支持 Unicode 5.0 版本。你说够不够用?
      

  8.   

    谁跟你说 Unicode 只能表示 65536 个字符啊?Unicode 从 5.0 版本开始,使用增补代码点,也就是说 Unicode 的编码范围从 U+0000~U+10FFFF 这可以容纳 1114112 个字符。Java 从 JDK 5 就支持 Unicode 5.0 了。高于 U+FFFF 的 Unicode 字符称为增补字符,在 Java 中使用 Unicode 代理对的方式来表示增补字符,也就是说使用两个 char 来表示一个增补字符。
      

  9.   

    我一直认为unicode只是双字节表示,如果是双字节,那一定不会超过65536的。
    您这么说,那unicode应该是四字节了,是吗?
    可是据说 windows 内置的unicode字符,应该是双字节的吧。
      

  10.   

    据说的事情是不可信的!在 Word 中使用“方正超大字符集_宋体”的字体可以显示 Unicode 大于 FFFF 的汉字。
      

  11.   

    前面也说过了,双字节表示的字符的系统都会采用 Unicode 代理对的方式来表示一个增补字符,也就是采用四个字节来表示一个字符。Unicode 的代理对是有规定范围的,代理对所表示的 Unicode 字符仅能用于代理对中,不能用于其他表示。PS:高代理对的范围:U+D800~U+DBFF;低代理对的范围:U+DC00~U+DFFF这里有两个关于 Unicode 代理对的帖子,有兴趣的话可以去看看:求助!关于String的codePointCount方法和代码点……
    http://topic.csdn.net/u/20100715/13/af48b841-04a3-44af-8257-1f84b107b568.html关于codePointCount()的问题
    http://topic.csdn.net/u/20090704/21/35667c04-9b37-4d11-bc89-5eaf80c16408.html