如何UTF-8转换为GB-2312? tr = new String(str.getBytes("UTF-8"),"GB2312"); 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 str = new String(str.getBytes("UTF-8"),"GB2312"); to tx18(华哥) : 你这是转换string 字符串的格式吧,我这是要将流的编码改变。 我用了:try { reader = new BufferedReader(new InputStreamReader(is, "GBK")); String d=new InputStreamReader(is, "GBK").getEncoding(); doc.add(Field.Text("contents", reader)); } catch (UnsupportedEncodingException e) { // TODO 自动生成 catch 块 e.printStackTrace(); System.out.println("格式转换不对"); }可用起来,还是不能检索(luncene)中文。 要用lucene检索中文,关键不在于此,作为一个数据流本身是没有什么编码的概念的,主要是这个数据流输入的原始数据是通过何种编码方式转成数据流的,你必需再用这种编码方式将它转回成原始数据。你要让lucene支持中文,最主要的是要有一个中文的词法分析器(Analyzer),这样就可以了 to:tigeryu(吴越小虎)lucene的1.3,standardAnalyzer不是就已经支持中文了吗?查询中文,能显示啊? 这是为什么啊? str = new String(str.getBytes("UTF-8"),"GB2312"); to: tigeryu(吴越小虎) 我用了weblucene的CJKanalyzer,可是还是不能查询中文?why? 你知道有哪些好用吗?该怎么用啊? 发到我信箱,ok? [email protected] 用fileReader--encoding =utf-8 将以文件的内容以utf-8的格式读出来,将其内容放在String str中,注意噢,java 中总是以unicode的编码方式来设置String的,所以就不用管str本身的编码方式拉. 那么现在str保存的就是file中的内容了。下面用GB2312的编码方式对 str中的内容进行解码byte b[]= str.getBytes("GB2312").OK! 以下是我的解决方案,中文能识别了,可是这样的转换,把“ < ” 解释为 &alt了, 我该怎么解决这个问题啊? Source source = new StreamSource(new FileInputStream(inFilename),"GBK"); FileOutputStream fout=null; Writer out =null; try { fout=new FileOutputStream(outFilename); out= new OutputStreamWriter(fout, "GBK"); } catch (UnsupportedEncodingException e1) { // TODO 自动生成 catch 块 e1.printStackTrace(); } CharsetCharsetEncoderCharsetDecoder在java.nio包里面enjoy~~ to freebyte(礁) 你的输入文件该不是XML吧 to yyfhz(火山): 输入是XML文件 数据绑定问题 问题出在哪啊? 最新!!!!!!!!!!!!!!!!!!!!!11 关于输入输出的问题 很简单的一段代码也编译不通过,郁闷? J2SE的类库和J2EE的类库是不是通用的? 一个奇怪的问题,和JDK编译版本有关? jbuilder8编辑器中光标乱跳,如何设置? MVC ? java 字符串有沒有 像 javascript 中 split() 的方法. tomcat作为应用服务器,怎么设置不让浏览目录 请问:“package javax.servlet does not exist”是怎么回事?
你这是转换string 字符串的格式吧,我这是要将流的编码改变。
我用了:try {
reader = new BufferedReader(new InputStreamReader(is, "GBK"));
String d=new InputStreamReader(is, "GBK").getEncoding();
doc.add(Field.Text("contents", reader));
} catch (UnsupportedEncodingException e) {
// TODO 自动生成 catch 块
e.printStackTrace();
System.out.println("格式转换不对");
}可用起来,还是不能检索(luncene)中文。
lucene的1.3,standardAnalyzer不是就已经支持中文了吗?查询中文,能显示啊?
这是为什么啊?
我用了weblucene的CJKanalyzer,可是还是不能查询中文?
why?
你知道有哪些好用吗?该怎么用啊?
发到我信箱,ok? [email protected]
注意噢,java 中总是以unicode的编码方式来设置String的,所以就不用管str本身的编码方式拉. 那么现在str保存的就是file中的内容了。
下面用GB2312的编码方式对 str中的内容进行解码
byte b[]= str.getBytes("GB2312").
OK!
FileOutputStream fout=null;
Writer out =null;
try {
fout=new FileOutputStream(outFilename);
out= new OutputStreamWriter(fout, "GBK");
} catch (UnsupportedEncodingException e1) {
// TODO 自动生成 catch 块
e1.printStackTrace();
}
CharsetEncoder
CharsetDecoder
在java.nio包里面
enjoy~~
你的输入文件该不是XML吧
输入是XML文件