通常,当一个软件打开一个文本时,它要做的第一件事是决定这个文本究竟是使用哪种字 符集的哪种编码保存的。软件有三种途径来决定文本的字符集和编码:最标准的途径是检测文本最开头的几个字节,如下表:开头字节 Charset/encodingEF BB BF UTF-8FE FF UTF-16/UCS-2, little endianFF FE UTF-16/UCS-2, big endianFF FE 00 00 UTF-32/UCS-4, little endian.00 00 FE FF UTF-32/UCS-4, big-endian.
你用记事本保存,一字节的文字,那么就是一字节,header存放在哪儿?那么header又是用的什么编码?
选择编码保存后只有用选择过的编码才能还原.
例如每一个字节都在0-127之间则可以判断为ascii文件。
比如utf-8的文件头三个字节是:0xef,0xbb,0xbf
unicode的头两个字节是:0xff,0xfe
嘿嘿,是的
符集的哪种编码保存的。软件有三种途径来决定文本的字符集和编码:最标准的途径是检测文本最开头的几个字节,如下表:开头字节 Charset/encodingEF BB BF UTF-8FE FF UTF-16/UCS-2, little endianFF FE UTF-16/UCS-2, big endianFF FE 00 00 UTF-32/UCS-4, little endian.00 00 FE FF UTF-32/UCS-4, big-endian.