我获取的内容输出后,中文全部变成"?"了,找了半天没找到好的解决乱码的办法,求高手支招
public String parse(String url){
Parser ps = new Parser();
NodeList nodes = null;
try{
ps.setURL(url);
ps.setEncoding("gb2312");
nodes = ps.extractAllNodesThatMatch(new TagNameFilter("DIV"));
}catch(Exception ex){
} return nodes.toHtml();
}
public String parse(String url){
Parser ps = new Parser();
NodeList nodes = null;
try{
ps.setURL(url);
ps.setEncoding("gb2312");
nodes = ps.extractAllNodesThatMatch(new TagNameFilter("DIV"));
}catch(Exception ex){
} return nodes.toHtml();
}
改为utf8看看
你的文件格式是gbk吧
试试
ps.setEncoding("gbk");
一般来说中文的用这个基本就不会乱码了