下面是一个简单的代码,在windows下读取没有问题,但放在linux上却出现乱码
private void countName(String name) {
SAXReader reader = new SAXReader();
try {
Document document = reader.read(new File(name));
Element root = document.getRootElement();
List<Node> list = root.selectNodes("//offer/title");
for (int j = 0; j < list.size(); j++) {
Node node = list.get(j);
String title = node.getText();
System.out.println(title); }
} catch (Exception e) {
e.printStackTrace();
} // System.out.println("total offer: " + totalOffer);
}
title节点的内容是中文
我用的是dom4j解析的,请问大家有什么好的解决方法,我已经尝试过对title的如下处理:
new String(title.getBytes("ISO-8859-1"),"utf-8");XML文件是utf-8格式的在线等待........
private void countName(String name) {
SAXReader reader = new SAXReader();
try {
Document document = reader.read(new File(name));
Element root = document.getRootElement();
List<Node> list = root.selectNodes("//offer/title");
for (int j = 0; j < list.size(); j++) {
Node node = list.get(j);
String title = node.getText();
System.out.println(title); }
} catch (Exception e) {
e.printStackTrace();
} // System.out.println("total offer: " + totalOffer);
}
title节点的内容是中文
我用的是dom4j解析的,请问大家有什么好的解决方法,我已经尝试过对title的如下处理:
new String(title.getBytes("ISO-8859-1"),"utf-8");XML文件是utf-8格式的在线等待........
有对dom4j比较熟的吗??
在线等待!!!
reader.setEncoding("utf-8");用dom4j 1.6就可以解决了,呵呵!!