关于Unicode的一个小小疑问？

资料上都说Unicode支持世界的所有常用文字
Unicode只有16位，区区6万多，就能够表达世界上所有的文字了？？

解决方案 »

免费领取超大流量手机卡，每月29元包185G流量+100分钟通话, 中国电信官方发货

差不多吧，不使用拼音语言的，一共也没几个国家。
中国才1万多，日本有一些，但许多跟汉字一样，而假名就少的多了。韩国也有一些。
实际上Unicode编码中最重头的一部分也就是中日韩文字。
英语字母大小写加起来才52个，其他国家的，只要使用字母的，一般数量级都不会超过100。
当然，这只包含GBK的1万3千多汉字，如果非要连甲骨文都编进去，那么16位Unicode就不够了，不过也已经出来了，具体不太清楚，你可以到网上查查资料。
基本上是所有了，一些很小的语种可能Windows还没有支持呢！
unicode 是4字节的，分了好多的空间，平面啊。你用的只是其中的一个平面。
unicode 是4字节的，分了好多的空间，平面啊。你用的只是其中的一个平面。好像如此，希望有详细点的资料。
unicode主要针对中国，韩国，日本等语言国家，所以6万多应该差不多够了
哦？？MSDN上以及网上的相当部分资料都说Unicode是16位的请liuhua1982(壮士) 做稍微详细一点的介绍
Unicode采用两个字节编码来表示一个文字，而UCS--Universal Character Set世界通用字符集是采用4个字节编码，将世界上所有任何官定和商用的编码大小通吃、一网打尽。
    下面是我找到的一些资料，与大家共享：
    Unicode（统一码）：目的是将世界上几十种紊乱的文字编码整合在一起。不管是东方文字还是西方文字，每个字在Unicode中一律以两个bytes（字节）来表示，这样就至少有65536种不同的组合，足以应付目前绝大多数场合的需要。
    不过，康熙字典里的中文字就有4万7，如果再加上里面没有的简体字，和一些笔划写法不同的日文字，那么Unicode六万多字的分配空间，光用来编汉字就已不够了，更不用说泰文、阿拉伯文等几十种其它文字。针对这个问题：Unicode（UCS--Universal Character Set世界通用字符集也采用同样的方法）采用了所谓的“中日韩文整合（CJK Unification）”的解决方案，把中日韩文中笔划近似的汉字，尽量以一个单码来代表。例如草字头在繁体中文里是4划，但在简体中文及日文中只有3划，Unicode中忽略这种微小的差别，不再替所有带4划草字头的繁体字单独设置一个码。但是如果一个字简体、繁体差别比较显著，Unicode中会为简体、繁体两种版本分别编码。
    经过“中日韩整合”的汉字，在Unicode中称做Unihan（统汉字）。在Unicode 2.1及3.0标准中，共有2万多个统汉字（统汉字并不包括日常生活中罕见的汉字）。
Unicode-16 是双字节编
UTF-8 可达4字节