前段时间写了个word文档转化为pdf格式存储在指定路径的小程序
现在问题来了
如何能把转化的pdf文档内容读取出来捏?
我查了好多文章和资料,好像要用到pdfbox这个类库 
但是大都说得模糊不清,看得我头晕脑胀
望各位用过的朋友指点一二啊!
ps:最简单的说法就是,怎样读取本地已存在的pdf文件内容。
    如果方便的话,麻烦付个代码片段。
    谢谢!!!

解决方案 »

  1.   

    此回复为自动发出,仅用于显示而已,并无任何其他特殊作用
    楼主【vamvin_55】截止到2008-07-08 17:59:31的历史汇总数据(不包括此帖):
    发帖的总数量:4                        发帖的总分数:65                       每贴平均分数:16                       
    回帖的总数量:4                        得分贴总数量:0                        回帖的得分率:0%                       
    结贴的总数量:4                        结贴的总分数:65                       
    无满意结贴数:1                        无满意结贴分:20                       
    未结的帖子数:0                        未结的总分数:0                        
    结贴的百分比:100.00%               结分的百分比:100.00%                  
    无满意结贴率:25.00 %               无满意结分率:30.77 %                  
    敬礼!
      

  2.   


    import java.io.BufferedInputStream;
    import java.io.BufferedReader;
    import java.io.File;
    import java.io.FileReader;
    import java.io.FileOutputStream; 
    import java.io.InputStreamReader;
    import java.io.StringWriter;import com.lowagie.text.*;
    import com.lowagie.text.pdf.*;
    public class Test { 
        public static void main(String[] args)throws Exception {
           Document doc=new Document(PageSize.A4.rotate(), 10, 360, 280, 150);
           System.out.println("test");
           
           
           try {
               File read = new File("c:\\java001.doc");
               BufferedReader br = new BufferedReader(new FileReader(read));
               PdfWriter.getInstance(doc, new FileOutputStream("c:/hello.pdf"));
               doc.open();
               System.out.println("test1");
               BaseFont bfChinese = BaseFont.createFont("STSong-Light", "UniGB-UCS2-H", BaseFont.NOT_EMBEDDED);   
                Font FontChinese = new Font(bfChinese, 12, Font.NORMAL);
               String content="";
               String temp="";        
               while((temp=br.readLine())!=null){
               content+=temp+"\r\n";
               if(content.length()>400){
                    doc.add(new Paragraph(content,FontChinese));
                    content="";
               }
               else {
                    doc.add(new Paragraph(temp,FontChinese));
               }
            }
            doc.close();            
           } catch (Exception e) {
             e.printStackTrace();
           } 
           System.out.println("test2");
           String PATH_TO_XPDF="E:\\xpdf\\pdftotext.exe";
           String filename="c:\\hello.pdf";
           System.out.println("test3");
           String[] cmd = new String[] { PATH_TO_XPDF, "-enc", "UTF-8", "-q", filename, "-"};
           Process p = Runtime.getRuntime().exec(cmd);
           System.out.println("test4");
           BufferedInputStream bis = new BufferedInputStream(p.getInputStream());
           InputStreamReader reader = new InputStreamReader(bis, "UTF-8");
           StringWriter out = new StringWriter();
           System.out.println("test5");
           char [] buf = new char[10000];
           int len;
           while((len = reader.read(buf))>= 0) {
    //       out.write(buf, 0, len);
           System.out.println("the length is"+len);
           System.out.println("test"+ );
           }
           reader.close();
           String ts=new String(buf);
           System.out.println("the str is"+ts);
        }
    }
    以上是简单代码
    请教下,这个代码不能实现PDF输出
    错在那里呢。