现有几个文本文件,各个文件的编码方式是不确定的,有的是Ascii,有的是unicode等等,请如一下,有什么方法可以判断这些文件的编码方式呢? 

解决方案 »

  1.   

    Notepad(记事本)可以支持四种格式:ANSI/Unicode/Unicode   big   endian/UFT-8. 
      首先,不同编码的文本,是根据文本的前两个字节来定义其编码格式的。定义如下:     ANSI:        无格式定义; 
        Unicode:         前两个字节为FFFE; 
        Unicode   big   endian: 前两字节为FEFF;    
        UTF-8:          前两字节为EFBB;
      

  2.   

    历史性难题 = =
    连notepad都不能做到完全识别