建议先看看ansi,gb2312,gbk,gb18030,unicode,utf-8,unicode big endian编码的区别
简单的说就是:
开头两字节是FF FE,则为Unicode;若为FE FF,则为uncode big endian;若前三字节为EF BB BF,则为UTF-8。

解决方案 »

  1.   


    如果使用READFILE的话,它是直接返回TXT里面的内容啊.
    没有什么FF FE 什么的吧
      

  2.   


    如果使用READFILE的话,它是直接返回TXT里面的内容啊.
    没有什么FF FE 什么的吧
    如果一个文本里存的是"ABC",你觉得用READFILE读取后,会返回什么?
    等待赵老师说用WinHex查看文件的二进制。
      

  3.   

    给定一个串,理论上无法判断它所属的字符集,毕竟你可以按照任何字符集的规定来理解这个串windows提供了一个函数IsTextUnicode,可以从统计学的规律来告知这个串是否是unicode,样本集越大结果越准确,但是始终无法保证100%正确
      

  4.   

    总的来说很难.  计算机内部数字表示都是一些二进制数据.
    所以当你遇到一个字节.
    0xAB  你怎么判断它是什么编码类型呢?  ASCII ?   UTF-8 ? , UTF-16 ?
      

  5.   

    用 ue 看看 Hex 格式, 头3个 字节确定 文件的 格式,