Unicode Transformation Formats: UTF-8

解决方案 »

  1.   

    UTF-8的定义:
    http://www.ietf.org/rfc/rfc2279.txt
      

  2.   

    www.2tigers.net
    下载“无废话XML”,内有详述
      

  3.   

    这些只是字符集的编码,在JAVA中可以通过String类中的函数对他做转换,在xslt的实现中也有相应的函数的。
      

  4.   

    ISO8859_1 类似于标准ASCII 8bit
    GB2312 16bit 包括大多数汉字的编码
    GBK 16bit 对GB2312的扩展
    UTF-8 在unix下安全的编码。不定长,如果是8bit则表示ASCII,与UNICODE可转换。汉字表示为24bit