弄过java的人,经常为乱码问题困扰的,我们经常听说 gbk 转utf-8,或者其他的。
大家知道,java源文件编译后是unicode的
我一直以为所谓的gbk转到utf-8 ,我是这样理解的,先 gbk-->unicode 然后再unicode-->utf-8

解决方案 »

  1.   

    UNICODE 其实是指内存的编码格式, 例如 我 的unicode码=0xB1B2
    UTF8 是指实现UNICODE 编码时,如何具体到byte上
    具体的可以上网搜搜,有很多不错的文档
      

  2.   

    Unicode只是一个概念,UTF-8、UTF-16、UTF-32等是具体的编码方式,然后GBK、BIG5之类的和Unicode无关,所以GBK转UTF-8其实就是转Unicode,不过是按UTF-8的编码方式转,自然解码也要按UTF-8解,如果按照UTF-16来解就会出错,这是个人理解,楼下指正。