我获取某个网页的内容,然后在模拟器里显示,中文全部乱码。我再把编码转UTF-8,还是乱码!
注:我获取的网页表头是:<meta http-equiv="content-type" content="text/html; charset=GB2312">
或:<meta http-equiv="Content-Type" content="text/html; charset=GBK">请问高手怎么解决啊?
注:我获取的网页表头是:<meta http-equiv="content-type" content="text/html; charset=GB2312">
或:<meta http-equiv="Content-Type" content="text/html; charset=GBK">请问高手怎么解决啊?
re是网页返回的内容
GBK编码是一个中文2个字节,而UTF-8编码是一个中文3个字节,当我们调用getBytes("UTF-8")方法时,会通过计算来增加字节,使得从GBK的2个字节变成UTF-8对应的3个字节。
可以看看http://www.iteye.com/topic/1097560