不是UTF-8编码的16进制表示吗?难道UTF-8编码的汉字,需要3个字节?Unicode是2个字节啊。

解决方案 »

  1.   

    比如“蜗居”,转成“%E8%9C%97%E5%B1%85”
      

  2.   

    是的,汉字的utf-8大部分是占用三个字节.
      

  3.   

    主要的字符编码又三种
    1、Default(GB2312、GBK)
    一个汉字两个字节,一个字母一个字节,缺点就是会和其他编码冲突,没有国际通用性。2、Unicode
    任何一个字符都是两字节,具有国际通用性,但html传输中多数字符是字母,造成大量带宽浪费。3、Utf8(UCS transformation formats)
    一个汉字三个字节,一个字母一个字节
    这个是Unicode的升级版。
      

  4.   

    长知识了,我一直以为UTF8下的英文是2个字节……
      

  5.   

    查了一下,UTF-8编码为1-6个字节,比较方便的是多字节字符的每个字节都大于等128。