我有一段文本(String text=“。。”),是用空格分割的,文本中可能有汉字、字母和数字,甚至有标点符号,可能有重复的项出现,怎么能高效的把里面的文本项给切分出来,放到数字或哈希表中?用正则表达式的效率高吗?代码应该如何写?谢谢啊

解决方案 »

  1.   

    String s="ajb iae iwe";
    String[] ts=s.split(" ");
      

  2.   

    String s="ajb iae iwe";
    String[] ts=s.split("\\s");
      

  3.   

    "\\s"是空格吗?若有全角的空格怎么切分?
    下面的文本
    <[email protected]>
    "Zhao Nongming" <[email protected]>
    [email protected][email protected][email protected],[email protected][email protected][email protected]
    怎么能切分出:
    [email protected]
    Zhao Nongming  [email protected]
    [email protected]  [email protected]  [email protected]  [email protected]  [email protected]  [email protected]
      

  4.   

    str.replaceAll('\r\n',' ').replaceAll('<','').replaceAll('>','').split(",")
      

  5.   

    \\s是转义字符,代表包括空格、制表符、换页符等空白字符的其中任意一个
    如果有全角空格,用replaceAll("\\u3000"," ")替换为半角空格
      

  6.   

    str.replaceAll("\r\n"," ").replaceAll("<","").replaceAll(">","").split(",")
    上面的那个写错了