遇到几个问题,先请大家帮我解决一个,其它的我自己再琢磨.
1.我要抓取的网页是utf-8的编码格式的,我要抓下来然后生成gb2312编码的网页.我的JAVA程序跑在linux的服务器上,服务器的默认编码字符集是latin1.

解决方案 »

  1.   

    假设 InputStream is 为抓取网页得到的输入流
    这样:
            BufferedReader r =new BufferedReader(new InputStreamReader(is,"utf-8"));
            OutputStream os =new FileOutputStream("gb.html");
            BufferedWriter w =new BufferedWriter(new OutputStreamWriter(os,"gb2312"));
            String line;
            while((line=r.readLine())!=null){
                 w.append(line);
                 w.newLine();
            }
            r.close();
            is.close();
            w.close();
            os.close();
      

  2.   

    flushtime,你给我的代码例子是不是与操作系统的默认编码集无关的?我想知道
    BufferedReader r =new BufferedReader(new InputStreamReader(is,"utf-8"));
    然后line=r.readLine()读出来的line字符串已经是JAVA默认采用处理字符的unicode编码了吗?
      

  3.   

    flushtime,快回来回答我上面的问题撒,55555555555555,help~
      

  4.   

    new BufferedReader(new InputStreamReader(is,"utf-8"));
    就是指明用utf-8编码~
    API文档里面有详细的说明~