我需要用pdfbox获取pdf中的内容--我的需求是文字部分
当然页面还包含了图片,线条(把文字框起来看表格)等是一个稍微复杂的页面格式
按照
PDFTextStripper pts = new PDFTextStripper();
pts.setStartPage(1);
pts.setEndPage(1);
String result = pts.getText(document);
System.out.println("文字部分:"+result );
关键就在result那里,
如果我用简单格式的pdf获取正常,
但一用需求的那个稍微复杂的页面格式的pdf
就会报大段的java.lang.NullPointerException
然后接着
*1234567892*
u
u
u
u
u
u这段u是什么意思?实在不懂
*1234567892*这段是条形码获取出来了
希望用过的朋友能告知
当然页面还包含了图片,线条(把文字框起来看表格)等是一个稍微复杂的页面格式
按照
PDFTextStripper pts = new PDFTextStripper();
pts.setStartPage(1);
pts.setEndPage(1);
String result = pts.getText(document);
System.out.println("文字部分:"+result );
关键就在result那里,
如果我用简单格式的pdf获取正常,
但一用需求的那个稍微复杂的页面格式的pdf
就会报大段的java.lang.NullPointerException
然后接着
*1234567892*
u
u
u
u
u
u这段u是什么意思?实在不懂
*1234567892*这段是条形码获取出来了
希望用过的朋友能告知
解决方案 »
免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货