用HttpClient 4.0取页面的编码,下面是我的java代码:DefaultHttpClient hc = new DefaultHttpClient();
HttpGet get = new HttpGet("http://www.ip138.com/ips8.asp");
HttpResponse hr = hc.execute(get);
HttpEntity he = hr.getEntity();
System.out.println(EntityUtils.getContentCharSet(he));执行后打印出的是null,
打印出的Header如下:
Date: Fri, 03 Sep 2010 03:11:15 GMT
Server: Microsoft-IIS/6.0
X-Powered-By: ASP.NET
Content-Length: 7700
Content-Type: text/html
Set-Cookie: ASPSESSIONIDCSSTASSB=MJCCADHELAHGFPLPLFEMHOCD; path=/
Cache-control: private请问这是我的代码有问题吗?我红色的部分,其中为什么会没有了charset=gb2312。如果把URL换成http://www.baidu.com,这个contentCharSet就打印了出来,即gb2312
打印出的header如下:
Date: Fri, 03 Sep 2010 03:27:49 GMT
Server: BWS/1.0
Content-Length: 4185
Content-Type: text/html;charset=gb2312
Cache-Control: private
Expires: Fri, 03 Sep 2010 03:27:49 GMT
Set-Cookie: BAIDUID=6BAFD06CFCDFE3DE0B10C9B1F5A601DC:FG=1; expires=Fri, 03-Sep-40 03:27:49 GMT; path=/; domain=.baidu.com
P3P: CP=" OTI DSP COR IVA OUR IND COM "
Connection: Keep-Alive请哪位大侠帮我解释一下好吗?万谢