项目中需要使用pdfbox提取文本信息,
比如pdf有如下文本信息:
name:sword.
work:code/programmer
.......//这里有一堆不相关的文本
address   message 
hangzhou   ok
tiantai    ok
要提取name:字段的,提取值应该为sword.同理,work:做为参数时,提取值应该是code/programmer
而当address做为参数时,提取结果应该是hangzhou 与 tiantai两个,如果下面还有的话,应该再加进去,所以应该是一个List对象刚接触pdfbox,也简单的看了一下pdf文本格式,有点迷惑,望达手指点迷津