if ((n = infile.read(buff)) > 0) { // 从文件读取数据
                    String str = new String(buff, 0, n);
                    htmlStr.append(str);
                } else {
                    cont = false;
                }
这里可能有点问题,就是正好读的位置在把一个汉字的中间,把一个汉字分成了两半,你把这东东转成字符串,会出现乱码的