一个大的文本中包含多种编码的文本段落,读取并将各段分别保存到其他文件,如何防止乱码

解决方案 »

  1.   

    是抓取的网页,不同网页有不同的编码,存在同一个txt文件中,因此打开txt时,必然有一部分是乱码的,现在需要把他们区分开来,全部转为gb2312
      

  2.   

    一个文本中不可能有多种编码方式啊,一个文本在保存的时候都是有一种存储方式的,要么是二进制文件,要么是字符文件。然后字符文件的编码有GBK ,UTF-8等,但只能是其中一种