如题,不是全部汉字,而是部分几个会变成??号,真搞不明白,请指点,源代码:
package ch01;import java.io.BufferedWriter;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileWriter;
import java.io.IOException;
import java.util.regex.Matcher;
import java.util.regex.Pattern;public class LogFile { /**
 * @param args
 */
public String downloadFile(File file){
StringBuilder sb=new StringBuilder();
String string=new String();
try {
FileInputStream fis=new FileInputStream(file);
        byte[] buf = new byte[1024];
       
        while((fis.read(buf))!=-1){
            sb.append(new String(buf,"utf-8"));    
            buf=new byte[1024];//重新生成,避免和上次读取的数据重复
}
} catch (FileNotFoundException e) {
// TODO 自动生成 catch 块
e.printStackTrace();
} catch (IOException e) {
// TODO 自动生成 catch 块
e.printStackTrace();
}
string=sb.toString();

return string;
}

public static void main(String[] args) {

LogFile lf=new LogFile();
String st=lf.downloadFile(new File("IMDB0100_MFC01.log"));


BufferedWriter bw;
try {
bw = new BufferedWriter(new FileWriter("foo.test"));

bw.write(st);
bw.close();
} catch (IOException e) {
// TODO 自动生成 catch 块
e.printStackTrace();
}


}}需处理的文件请参考附件

解决方案 »

  1.   


    FileInputStream fis=new FileInputStream(file);
                byte[] buf = new byte[1024];
               
                while((fis.read(buf))!=-1){//这里的问题
                  //如果有个中文字符,正好被你在1024这里分开了,那new String的时候,不是就解析不出来了么?
                    sb.append(new String(buf,"utf-8"));    
                    buf=new byte[1024];//重新生成,避免和上次读取的数据重复            
                }读取字符内容,要么全部按字节读取,然后转字符串,要么按字符流读取
      

  2.   

    按照字符流读取仍然出现? 请问是何原因,谁能提供正确的代码,我的代码如下package ch01;import java.io.BufferedReader;
    import java.io.BufferedWriter;
    import java.io.File;
    import java.io.FileInputStream;
    import java.io.FileNotFoundException;
    import java.io.FileReader;
    import java.io.FileWriter;
    import java.io.IOException;public class LogFile { /**
     * @param args
     */
    public String downloadFile(File file){
    StringBuilder sb=new StringBuilder();
    String string=new String();
    try {

    BufferedReader buffer=new BufferedReader(new FileReader(file));
    while((string=buffer.readLine())!=null){
    string=new String(string.getBytes(),"utf-8");
    sb.append(string);
    }

           
    } catch (FileNotFoundException e) {
    // TODO 自动生成 catch 块
    e.printStackTrace();
    } catch (IOException e) {
    // TODO 自动生成 catch 块
    e.printStackTrace();
    }
    string=sb.toString();

    return string;
    }

    public static void main(String[] args) {

    LogFile lf=new LogFile();
    String st=lf.downloadFile(new File("IMDB0100_MFC01.log"));


    BufferedWriter bw;
    try {
    bw = new BufferedWriter(new FileWriter("foo.test"));

    bw.write(st);
    bw.close();
    } catch (IOException e) {
    // TODO 自动生成 catch 块
    e.printStackTrace();
    }


    }}
      

  3.   

    BufferedReader br=new BufferedReader(new InputStreamReader(new FileInputStream(file),"utf8"));可以这样 读过后就不要在做转换了
      

  4.   

    piaopiao11 果然可以,这个方法不错,呵呵,谢谢,揭帖
      

  5.   

    我用lz的这个,自己写了个.log文件结果生成的新文件里面所有中文都是???????,把转码那改成gbk的就正常了,lz试试看