资料上都说Unicode支持世界的所有常用文字
Unicode只有16位,区区6万多,就能够表达世界上所有的文字了??

解决方案 »

  1.   

    差不多吧,不使用拼音语言的,一共也没几个国家。
    中国才1万多,日本有一些,但许多跟汉字一样,而假名就少的多了。韩国也有一些。
    实际上Unicode编码中最重头的一部分也就是中日韩文字。
    英语字母大小写加起来才52个,其他国家的,只要使用字母的,一般数量级都不会超过100。
    当然,这只包含GBK的1万3千多汉字,如果非要连甲骨文都编进去,那么16位Unicode就不够了,不过也已经出来了,具体不太清楚,你可以到网上查查资料。
      

  2.   

    基本上是所有了,一些很小的语种可能Windows还没有支持呢!
      

  3.   

    unicode 是4字节的,分了好多的空间,平面啊。你用的只是其中的一个平面。
      

  4.   

    unicode 是4字节的,分了好多的空间,平面啊。你用的只是其中的一个平面。好像如此,希望有详细点的资料。
      

  5.   

    unicode主要针对中国,韩国,日本等语言国家,所以6万多应该差不多够了
      

  6.   

    哦??MSDN上以及网上的相当部分资料都说Unicode是16位的请liuhua1982(壮士) 做稍微详细一点的介绍
      

  7.   

    Unicode采用两个字节编码来表示一个文字,而UCS--Universal Character Set世界通用字符集是采用4个字节编码,将世界上所有任何官定和商用的编码大小通吃、一网打尽。
        下面是我找到的一些资料,与大家共享:
        Unicode(统一码):目的是将世界上几十种紊乱的文字编码整合在一起。不管是东方文字还是西方文字,每个字在Unicode中一律以两个bytes(字节)来表示,这样就至少有65536种不同的组合,足以应付目前绝大多数场合的需要。
        不过,康熙字典里的中文字就有4万7,如果再加上里面没有的简体字,和一些笔划写法不同的日文字,那么Unicode六万多字的分配空间,光用来编汉字就已不够了,更不用说泰文、阿拉伯文等几十种其它文字。针对这个问题:Unicode(UCS--Universal Character Set世界通用字符集也采用同样的方法)采用了所谓的“中日韩文整合(CJK Unification)”的解决方案,把中日韩文中笔划近似的汉字,尽量以一个单码来代表。例如草字头在繁体中文里是4划,但在简体中文及日文中只有3划,Unicode中忽略这种微小的差别,不再替所有带4划草字头的繁体字单独设置一个码。但是如果一个字简体、繁体差别比较显著,Unicode中会为简体、繁体两种版本分别编码。
        经过“中日韩整合”的汉字,在Unicode中称做Unihan(统汉字)。在Unicode 2.1及3.0标准中,共有2万多个统汉字(统汉字并不包括日常生活中罕见的汉字)。
      

  8.   

    Unicode-16 是双字节编
    UTF-8 可达4字节