有点明白了。Unicode包含很多个字符,超过65535个。所以大多数字符由一个2字节的char表示就可以了。这16位的char可以称作是代码单元。但Unicode字符数量已经超过65535个,所以有些辅助字符就需要用4个字节来表示,也就是2个代码单元。这Unicode中的许许多多个字母,每个字符可以称作是一个代码点?一个代码点由int(4个字节)来表示?

解决方案 »

  1.   

    或者说,对于大多数普通字符来说,这个代码点和代码单元一样,都由一个双字节的char表示,对于有些特殊的辅助字符来说,这个代码点需要两个代码单元表示,也就是int?
      

  2.   

    http://blog.csdn.net/weizhaozhe/article/details/3909079仔细看了看这篇文章,基本明白。有人回帖接分吗?^_^,我好结贴。
      

  3.   

    lz,我觉得你看书看的很细致,很欣赏,赞一个!http://blog.csdn.net/weizhaozhe/article/details/3909079这篇文章也讲清楚了原因,谢谢分享,再赞一个!