本帖最后由 hansaiqun2010 于 2010-03-12 11:02:53 编辑

解决方案 »

  1.   

    string.replaceAll("<[^>]+>|&nbsp;","")去掉HTML标记,然后再用字符串的substring截取应该就能达到目的了
      

  2.   

         
     String value = "中文";
            Pattern pattern = Pattern.compile("[\u4E00-\u9FA5]");
            Matcher matcher = pattern.matcher(value);
            if(matcher.find()){
                //中文2个字节
            }
      

  3.   

    截取中文而又不出现汉字的两个字节只截取了一半而出现乱码 可以参考
    文章:http://www.gbsou.com/2010/01/20/1900.html