我用CHttpFile抓取网页,发现UTF-8编码的网页会出现中文乱码的问题, 而GB2312大多正常 可是有少数如
www.sina.cn新浪手机网 查看源码是charset = GB2312 下载下来中文乱码。 请问这是怎么回事??? html源码上写的字符集不一定是真正的????