unicode字符集只能表示65536个编码，为何说全世界都够用呢？中国的字符就几万个呀？

unicode字符集只能表示65536个编码，为何说全世界都够用呢？中国的字符就几万个呀？
-----------------------------------------------
对 unicode 还是有点不解，资料上说，全世界都够用了，
但是我不明白，中国现在字符，就有几万个吧。
全世界这么多文字，难道65536真是够用了吗？

解决方案 »

免费领取超大流量手机卡，每月29元包185G流量+100分钟通话, 中国电信官方发货

http://d.download.csdn.net/down/2417395/zj0832自己看看
你自己找吧，反正肯定够用了，汉字的范围是4e00-9fa5
Unicode包含了超过十万个字符（在2005年，Unicode的第十万个字符被采纳且认可成为标准之一）、一组可用以作为视觉参考的代码图表、一套编码方法与一组标准字符编码、一套包含了上标字、下标字等字符特性的枚举等。
UTF-8 是用得比较多的，足以包含所有的字符了。所有语言中也就汉语字符多些，其他都没那么多。
真正标准的unicode是4字节的，2字节的unicode只包含了最常用的一个平面
中文unicode 4e00-9fa5
begin = 19968;
end = 40869;
确实就只有这些了这是经过了好多年的演变而得出的最终值
如果有兴趣可以看看汉字编码发展历史
http://bbs.unispim.com/viewthread.php?tid=254
Unicode 从 5.0 版本开始编码范围从 U+0000～U+10FFFF，可以容纳 1114112 个字符！Java 从 JDK 5 支持 Unicode 5.0 版本。你说够不够用？
谁跟你说 Unicode 只能表示 65536 个字符啊？Unicode 从 5.0 版本开始，使用增补代码点，也就是说 Unicode 的编码范围从 U+0000～U+10FFFF 这可以容纳 1114112 个字符。Java 从 JDK 5 就支持 Unicode 5.0 了。高于 U+FFFF 的 Unicode 字符称为增补字符，在 Java 中使用 Unicode 代理对的方式来表示增补字符，也就是说使用两个 char 来表示一个增补字符。
我一直认为unicode只是双字节表示，如果是双字节，那一定不会超过65536的。
您这么说，那unicode应该是四字节了，是吗？
可是据说 windows 内置的unicode字符，应该是双字节的吧。
据说的事情是不可信的！在 Word 中使用“方正超大字符集_宋体”的字体可以显示 Unicode 大于 FFFF 的汉字。
前面也说过了，双字节表示的字符的系统都会采用 Unicode 代理对的方式来表示一个增补字符，也就是采用四个字节来表示一个字符。Unicode 的代理对是有规定范围的，代理对所表示的 Unicode 字符仅能用于代理对中，不能用于其他表示。PS：高代理对的范围：U+D800～U+DBFF；低代理对的范围：U+DC00～U+DFFF这里有两个关于 Unicode 代理对的帖子，有兴趣的话可以去看看：求助！关于String的codePointCount方法和代码点……
http://topic.csdn.net/u/20100715/13/af48b841-04a3-44af-8257-1f84b107b568.html关于codePointCount()的问题
http://topic.csdn.net/u/20090704/21/35667c04-9b37-4d11-bc89-5eaf80c16408.html