关于使用pdfbox获取pdf内容

我需要用pdfbox获取pdf中的内容--我的需求是文字部分
当然页面还包含了图片，线条(把文字框起来看表格)等是一个稍微复杂的页面格式
按照
PDFTextStripper pts = new PDFTextStripper();
            pts.setStartPage(1);
            pts.setEndPage(1);
String result = pts.getText(document);
            System.out.println("文字部分:"+result );
关键就在result那里，
如果我用简单格式的pdf获取正常，
但一用需求的那个稍微复杂的页面格式的pdf
就会报大段的java.lang.NullPointerException
然后接着
*1234567892*
u
u
u
u
u
u这段u是什么意思？实在不懂
*1234567892*这段是条形码获取出来了
希望用过的朋友能告知

解决方案 »

免费领取超大流量手机卡，每月29元包185G流量+100分钟通话, 中国电信官方发货

mysql语句老出问题，高手帮我看下啊，谢谢！
hibernate search lucene搜索的用法
延迟加载问题
一天没解决了 Hibernate问题 ClassCastException
简单但困绕初学者的问题
JAVA类库电子书完整版在哪里下?
java ,xml ，webservice大家来参与讨论,入者有分
struts 文档，apache不提供下载，那里有下的？
后台怎样获得前端ognl表达式中checkboxlist的值？？
关于正则表达式
netbeans7有没有可视化开发工具？
请各位帮我看看这个程序