前段时间写了个word文档转化为pdf格式存储在指定路径的小程序
现在问题来了
如何能把转化的pdf文档内容读取出来捏?
我查了好多文章和资料,好像要用到pdfbox这个类库
但是大都说得模糊不清,看得我头晕脑胀
望各位用过的朋友指点一二啊!
ps:最简单的说法就是,怎样读取本地已存在的pdf文件内容。
如果方便的话,麻烦付个代码片段。
谢谢!!!
现在问题来了
如何能把转化的pdf文档内容读取出来捏?
我查了好多文章和资料,好像要用到pdfbox这个类库
但是大都说得模糊不清,看得我头晕脑胀
望各位用过的朋友指点一二啊!
ps:最简单的说法就是,怎样读取本地已存在的pdf文件内容。
如果方便的话,麻烦付个代码片段。
谢谢!!!
楼主【vamvin_55】截止到2008-07-08 17:59:31的历史汇总数据(不包括此帖):
发帖的总数量:4 发帖的总分数:65 每贴平均分数:16
回帖的总数量:4 得分贴总数量:0 回帖的得分率:0%
结贴的总数量:4 结贴的总分数:65
无满意结贴数:1 无满意结贴分:20
未结的帖子数:0 未结的总分数:0
结贴的百分比:100.00% 结分的百分比:100.00%
无满意结贴率:25.00 % 无满意结分率:30.77 %
敬礼!
import java.io.BufferedInputStream;
import java.io.BufferedReader;
import java.io.File;
import java.io.FileReader;
import java.io.FileOutputStream;
import java.io.InputStreamReader;
import java.io.StringWriter;import com.lowagie.text.*;
import com.lowagie.text.pdf.*;
public class Test {
public static void main(String[] args)throws Exception {
Document doc=new Document(PageSize.A4.rotate(), 10, 360, 280, 150);
System.out.println("test");
try {
File read = new File("c:\\java001.doc");
BufferedReader br = new BufferedReader(new FileReader(read));
PdfWriter.getInstance(doc, new FileOutputStream("c:/hello.pdf"));
doc.open();
System.out.println("test1");
BaseFont bfChinese = BaseFont.createFont("STSong-Light", "UniGB-UCS2-H", BaseFont.NOT_EMBEDDED);
Font FontChinese = new Font(bfChinese, 12, Font.NORMAL);
String content="";
String temp="";
while((temp=br.readLine())!=null){
content+=temp+"\r\n";
if(content.length()>400){
doc.add(new Paragraph(content,FontChinese));
content="";
}
else {
doc.add(new Paragraph(temp,FontChinese));
}
}
doc.close();
} catch (Exception e) {
e.printStackTrace();
}
System.out.println("test2");
String PATH_TO_XPDF="E:\\xpdf\\pdftotext.exe";
String filename="c:\\hello.pdf";
System.out.println("test3");
String[] cmd = new String[] { PATH_TO_XPDF, "-enc", "UTF-8", "-q", filename, "-"};
Process p = Runtime.getRuntime().exec(cmd);
System.out.println("test4");
BufferedInputStream bis = new BufferedInputStream(p.getInputStream());
InputStreamReader reader = new InputStreamReader(bis, "UTF-8");
StringWriter out = new StringWriter();
System.out.println("test5");
char [] buf = new char[10000];
int len;
while((len = reader.read(buf))>= 0) {
// out.write(buf, 0, len);
System.out.println("the length is"+len);
System.out.println("test"+ );
}
reader.close();
String ts=new String(buf);
System.out.println("the str is"+ts);
}
}
以上是简单代码
请教下,这个代码不能实现PDF输出
错在那里呢。