一个文档里面的数据既有utf-8编码,又有gbk编码的汉字,要如何区分出来呢,数据很多 不要告诉我用肉眼识别。

解决方案 »

  1.   

    不太理解你的意思,文件内码应该是一致的吧,不可能一半是utf-8,一半是gbk吧?
      

  2.   

    可以拆分成不同文件:
      InputStreamReader r = new InputStreamReader(new FileInputStream(in));
      System.out.println(r.getEncoding());同一个文件:
    String a = new String(sentence.getBytes("ISO-8859-1"), 
                          "UTF-8");
    变完以后看和原来一样不一样。
      

  3.   

    文档的主体是utf-8编码,当然你可以手动的跟改其编码方式,有可能产生了乱码。
      

  4.   

    原本所有的都是utf-8,有部分被通过字节流转成了gbk,显示成了乱码。
      

  5.   

    这不可能,要么都是UTF-8编码,要么都是GBK编码,UTF-8是国际编码,GBK是国内编码,都支持汉字和英文
      

  6.   

    UTF-8和GBK编码是不同的,可以根据字节来查相应的编码表