public static void main(String[] args) {
String str = "中国";
System.out.println("系统默认编码:" + Charset.defaultCharset());
try {
//第一种情况
byte[] bytes1 = str.getBytes("GBK");
String newStr1 = new String(bytes1, "GBK");
System.out.println(newStr1);
//第二种情况
byte[] bytes2 = str.getBytes("UTF-8");
String newStr2 = new String(bytes2, "UTF-8");
System.out.println(newStr2);
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
}输出:都正常输出。字符编码不是很懂我感觉上面的两种情况应该有一种是乱码
JVM中的字符串都是Unicode编码,为什么得到GBK的字节数组和UTF-8的字节数组都可以重新正常输出呢?!
希望大家能解释一下这中间的原理啊。。
.getBytes("GBK"),按"GBK"的字符集返回某字符串在该编码下的byte数组表示,这时就和系统默认的UTF-8没有关系了。当只有没有指定用何种字符集时,会默认使用系统的字符集。