比如这个页面
http://rayallen117.spaces.live.com/?_c11_BlogPart_BlogPart=blogview&_c=BlogPart&partqs=amonth%3d11%26ayear%3d2007
我的JAVA代码是 String path = "C:/rayallen117.spaces.live.html"; //我已经把网页源码保存到这里,跟直接用httpconnection从网上下载这个网页一样
//里面的中文全部是乱码
StringBuffer sbStr = new StringBuffer();
BufferedReader reader = new BufferedReader(new FileReader(new File(path)));
String temp = "";
while((temp=reader.readLine())!=null)
{
sbStr.append(temp);
sbStr.append("\r\n");
}
reader.close();
String result = sbStr.toString();
System.out.println(result);为什么同样的代码去下载www.sina.com.cn这样的页面又不是乱码呢
怎样从下载的页面里取得这个页面的编码方式呢
http://rayallen117.spaces.live.com/?_c11_BlogPart_BlogPart=blogview&_c=BlogPart&partqs=amonth%3d11%26ayear%3d2007
我的JAVA代码是 String path = "C:/rayallen117.spaces.live.html"; //我已经把网页源码保存到这里,跟直接用httpconnection从网上下载这个网页一样
//里面的中文全部是乱码
StringBuffer sbStr = new StringBuffer();
BufferedReader reader = new BufferedReader(new FileReader(new File(path)));
String temp = "";
while((temp=reader.readLine())!=null)
{
sbStr.append(temp);
sbStr.append("\r\n");
}
reader.close();
String result = sbStr.toString();
System.out.println(result);为什么同样的代码去下载www.sina.com.cn这样的页面又不是乱码呢
怎样从下载的页面里取得这个页面的编码方式呢
还是乱码
关键是这个是个自动的程序,会下载不同的网页,有没有办法让程序自动判断其编码