怎么样显示中文中的稀缺字或者繁体字呢  比如显示喆 蓢这样的字而不是乱码呢

解决方案 »

  1.   

    mgstring = new String(myString.getStrings().getBytes("gb2312"),"GBK");
    这样只能解决标点符号问题
      

  2.   

    我也想知道,还有就是如何传递和保存不常见汉字呢?传递是指用form发送,用request读取用request.setCharacterEncoding("GBK")可以吗?HTML的编码又要设成什么呢?保存是指用request.getParameter读取后,保存至数据库中。
      

  3.   

    是不是要象cdsn论坛一样,采用unicode和utf-8?
      

  4.   

    偶把字符转换成字节流输出 可以解决标点问题 但是对于不常见汉字就会显示乱码
    utf-8好像是不行的样子
      

  5.   

    怎么指定jdk的 encoding呢?
      

  6.   

    没用的,默认编码是Unicode,中文就在 19968 - 40869 之间,你再好检查一下这个区间有没有你要的中文,如果没有的话,那些GBK也是假的,因为这里有20901个中文,比GBK定义的还要多
      

  7.   

    看一下jive,用的是ISO8859_1好样什么样的字符都可以显视
      

  8.   

    单纯的输入输出是没有问题的 繁体字也可以输出
    现在问题是我从网页上提取信息 如果网页里面有中文稀缺字 比如“喆“这样的字符就会出现乱码
    不晓得怎么回事我用的是eclipse3.0
      

  9.   

    這樣寫的 
                   str = URL(in);                StringBean myString = new StringBean();
                    myString.setLinks(false);
                    myString.setReplaceNonBreakingSpaces(true);
                    String errorException = "";
                    String ifSuccess = "";
                    String mgstring = "";
                    BufferedReader reader = new BufferedReader(new StringReader(""));
                    boolean isSuccess = false;                try {
                        myString.setURL(str);
                        mgstring = new String(myString.getStrings().getBytes(
                                "gb2312"), "GBK");
                        reader = new BufferedReader(new StringReader(mgstring));
                        ifSuccess = "SUCCESS";
                        isSuccess = true;
                    } catch (Exception e) {
                        e.printStackTrace();
                        errorException = e.toString();
                        ifSuccess = "ERROR";
                        isSuccess = false;
                    }
      

  10.   

    在网页中提取,你不要那样转换,你必须分析这个网页的meta,确定网页的语言,然后再转换,假如网页的编码是utf-8的,你却用mgstring = new String(myString.getStrings().getBytes(
                                "gb2312"), "GBK");
    这样不出乱码就奇怪了,如果是gb2312的网页,就不要重新转换编码了,没必要,对于IE而言,就算是gb2312它也是按GBK来处理
      

  11.   

    网页原来是gb2312的 偶试过直接输出时是没有问题的 原来是htmlparser的问题 在寻找办法解决如果各位有办法 请教我
      

  12.   

    自己顶罢如果直接输出 Html文件不会有乱码出现 如果只用parser输出标准的html文件也不会有乱码 但是调用htmlparser转换成文本输出后一些不常用的字就会出现乱码 把htmlparser里面的 encoding改成gbk也没用 
    翻遍csdn也没找到答案 请各位达人帮忙了 小女子才疏学浅
      

  13.   

    htmlparser 是那个类来的,要看看才行,不过我自己正在写的一个html的解析类倒是有考虑这些问题.
      

  14.   

    stringbean 类 考虑出来一顶记得告诉偶吖 反正偶是莫法度了