在统计单词数量时 我选择的分隔是.split(" "),
这样确实可以分出来,但是有时候分出来的单词或是下一形式的
'xx.    'xx'     "xx.    "xx".     xx.     xx,
还有的单词是 xx-zz 这形式的
还有可能在需要统计的单词中有数字我现在就是希望在碰到上面那些情况的时候有没有正则
让我就取 xx  其他的特殊字符就去掉
有xx-zz的时候就拆成两个单词
还有就是去掉数字.数字不属于单词 因此不需要统计.谢谢..呵呵

解决方案 »

  1.   

    java写了一段,不知道是不是你想要的
    public static void main(String[] args) {
    String s = "123Hi, 1how are you? 3I'm fine, thank you.";
    s = s.replaceAll("\\d+", "");
    String[] ss = s.split("(\\s+|-|')");
    System.out.println(ss.length);
    for(String str : ss){
    System.out.println(str);
    }
    }
      

  2.   


    String s = "123Hi, 1how are you? 3I'm fine, thank you.";
    s = s.replaceAll("\\d+", "");
    String[] ss = s.split("(\\s+|-|'|,|\\.|\\?)");
    for (String str : ss) {
    System.out.println(str);
    }楼主的要求没说清楚,如果是I'm这种缩写的情况怎么处理有些特殊符号应该不用统计在内的~上面代码稍微改了改,借花献佛了.