我写了一个程序想采集 逐浪首页的数据,但是逐浪的页面编码是utf-8的
所以页面的中文出现了乱码,求高手告诉下,谢谢了

解决方案 »

  1.   

    参考这个 试试。。、
            //System.out.println("\u6C49");
            FileOutputStream fos = new FileOutputStream(new File("D:/1.txt"));
            OutputStreamWriter osw = new OutputStreamWriter(fos, "UTF-8");
            BufferedWriter bw = new BufferedWriter(osw);
            bw.write("\u6C49");
            bw.write("\u6C49");
            bw.write("\u6C49");
            bw.close();        FileInputStream fis = new FileInputStream(new File("D:/1.txt"));
            InputStreamReader osi = new InputStreamReader(fis, "UTF-8");
            BufferedReader br = new BufferedReader(osi);
            String str = null;
            while ((str = br.readLine()) != null)
            {
                System.out.println(str);
            }
        }
      

  2.   


    URL url=new URL("http://sina.com.cn");
    URLConnection con=url.openConnection();
        InputStream in=con.getInputStream();
        byte[]a=new byte[1024];
        int c=0;
        OutputStream out=new FileOutputStream("D://sina.txt");
        while((c=in.read(a))!=-1){
         for(int i=0;i<c;i++){
         out.write(a[i]);
         }
        }
        in.close();
      

  3.   

    FileInputStream file = new FileInputStream(new File("D:/test.txt"));
            InputStreamReader is = new InputStreamReader(file, "utf-8");