java显示繁体字或者中文稀缺字问题 怎么样显示中文中的稀缺字或者繁体字呢 比如显示喆 蓢这样的字而不是乱码呢 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 mgstring = new String(myString.getStrings().getBytes("gb2312"),"GBK");这样只能解决标点符号问题 我也想知道,还有就是如何传递和保存不常见汉字呢?传递是指用form发送,用request读取用request.setCharacterEncoding("GBK")可以吗?HTML的编码又要设成什么呢?保存是指用request.getParameter读取后,保存至数据库中。 是不是要象cdsn论坛一样,采用unicode和utf-8? 偶把字符转换成字节流输出 可以解决标点问题 但是对于不常见汉字就会显示乱码utf-8好像是不行的样子 怎么指定jdk的 encoding呢? 没用的,默认编码是Unicode,中文就在 19968 - 40869 之间,你再好检查一下这个区间有没有你要的中文,如果没有的话,那些GBK也是假的,因为这里有20901个中文,比GBK定义的还要多 看一下jive,用的是ISO8859_1好样什么样的字符都可以显视 单纯的输入输出是没有问题的 繁体字也可以输出现在问题是我从网页上提取信息 如果网页里面有中文稀缺字 比如“喆“这样的字符就会出现乱码不晓得怎么回事我用的是eclipse3.0 這樣寫的 str = URL(in); StringBean myString = new StringBean(); myString.setLinks(false); myString.setReplaceNonBreakingSpaces(true); String errorException = ""; String ifSuccess = ""; String mgstring = ""; BufferedReader reader = new BufferedReader(new StringReader("")); boolean isSuccess = false; try { myString.setURL(str); mgstring = new String(myString.getStrings().getBytes( "gb2312"), "GBK"); reader = new BufferedReader(new StringReader(mgstring)); ifSuccess = "SUCCESS"; isSuccess = true; } catch (Exception e) { e.printStackTrace(); errorException = e.toString(); ifSuccess = "ERROR"; isSuccess = false; } 在网页中提取,你不要那样转换,你必须分析这个网页的meta,确定网页的语言,然后再转换,假如网页的编码是utf-8的,你却用mgstring = new String(myString.getStrings().getBytes( "gb2312"), "GBK");这样不出乱码就奇怪了,如果是gb2312的网页,就不要重新转换编码了,没必要,对于IE而言,就算是gb2312它也是按GBK来处理 网页原来是gb2312的 偶试过直接输出时是没有问题的 原来是htmlparser的问题 在寻找办法解决如果各位有办法 请教我 自己顶罢如果直接输出 Html文件不会有乱码出现 如果只用parser输出标准的html文件也不会有乱码 但是调用htmlparser转换成文本输出后一些不常用的字就会出现乱码 把htmlparser里面的 encoding改成gbk也没用 翻遍csdn也没找到答案 请各位达人帮忙了 小女子才疏学浅 htmlparser 是那个类来的,要看看才行,不过我自己正在写的一个html的解析类倒是有考虑这些问题. stringbean 类 考虑出来一顶记得告诉偶吖 反正偶是莫法度了 java源代码加壳问题(100分) js代码转JAVA带代码 Log4j问题,请高人指教!! 求一代码(在面板上实现播放声音和显示gif动画) 关于接口、抽像类在使用上的疑问 关于文件系统路径! (求助)神奇的java程序 Integer在那个包里面? 新手询问JAVA开发客户端的问题!!!! 是不是jdk1.3后就不包含com.sun.java.swing包了? 编码转换的超难问题? 关于JAVA里面导入类的基础问题
这样只能解决标点符号问题
utf-8好像是不行的样子
现在问题是我从网页上提取信息 如果网页里面有中文稀缺字 比如“喆“这样的字符就会出现乱码
不晓得怎么回事我用的是eclipse3.0
str = URL(in); StringBean myString = new StringBean();
myString.setLinks(false);
myString.setReplaceNonBreakingSpaces(true);
String errorException = "";
String ifSuccess = "";
String mgstring = "";
BufferedReader reader = new BufferedReader(new StringReader(""));
boolean isSuccess = false; try {
myString.setURL(str);
mgstring = new String(myString.getStrings().getBytes(
"gb2312"), "GBK");
reader = new BufferedReader(new StringReader(mgstring));
ifSuccess = "SUCCESS";
isSuccess = true;
} catch (Exception e) {
e.printStackTrace();
errorException = e.toString();
ifSuccess = "ERROR";
isSuccess = false;
}
"gb2312"), "GBK");
这样不出乱码就奇怪了,如果是gb2312的网页,就不要重新转换编码了,没必要,对于IE而言,就算是gb2312它也是按GBK来处理
翻遍csdn也没找到答案 请各位达人帮忙了 小女子才疏学浅