读取百度网页源码,控制台输出,中文怎么成乱码了?读自己服务器上自己的jsp文件却没这问题,求大神解释

解决方案 »

  1.   

    我把源码读在StringBuffer变量里,控制台输出时乱码了,怎么设编码格式?
    StringBuffer sb=new StringBuffer();
    try 
    {
    URL url=new URL(urlName);
    URLConnection con=url.openConnection();
    con.connect();
    System.out.println(con.getContentEncoding());
    BufferedReader in=new BufferedReader(new InputStreamReader(con.getInputStream()));
    String str;

    while((str=in.readLine())!=null){
    //System.out.println(new String(str.getBytes("utf-8"),"utf-8"));

    sb.append(str);
    }
    }
    catch (Exception e) {
    // TODO Auto-generated catch block
    e.printStackTrace();
    }
    return sb.toString();
      

  2.   

    这样设置.
    new BufferedReader(new InputStreamReader(con.getInputStream(),"utf-8"));
      

  3.   

    这肯定设了编码格式是utf-8,我的说下,我读本地服务器自己的jsp文件没乱码问题,但读百度的就出现这问题