现在又一下文档大概是这样aaaaaajdkjfdkjdfkkfd
jkldfkjkdfksdf
jkldfklfdkaaaaaa
jkfdkjdfkjdfk
dfsdfsdsffds
fdsdsfdfs文档的大概样子是这样实际的文档很长大概有100多M。我需要取aaaaa 一下部分的内容分组进行处理。跪求各位大虾这该怎么做?

解决方案 »

  1. 你取aaaaaa以下部分的,其实不用正则也可以吧。你循环找aaaaaa,找到后就取当前aaaaaa到下一个aaaaaa中间的部分就可以了。
      

  2. 用String 类的split好像就可以了?
      

  3. 对不起各位。我刚才表述有误!那个aaaaa部分是不一样的!我想取aaaba或者caaaaa。反正每个标题都不一样。我想取他们一下的部分对其分别进行处理!谢谢各位了aaabbajdkjfdkjdfkkfd
    jkldfkjkdfksdf
    jkldfklfdkcaaaaa
    jkfdkjdfkjdfk
    dfsdfsdsffds
    fdsdsfdfs
      

  4. 如果不用正则表达式,怎样才能实现?我现在的做法是:按行提取,然后遇到空行就将一组存到ArrayList里面,然后统一处理。但是会出现outofmemory!文档才100多M
      

类似问题 »