在Acrobat工具栏中有个选则的按钮,对于有的文件是可以将文本复制的好象有些不可以,要看文件的扫描设置。(仅供参考)

解决方案 »

  1.   

    还有就是文档安全设置:你按Ctrl+Alt+S就会看到相关的设置了。有的允许读文本有的不可以。
      

  2.   

    我这有个可以提取文本的*.pdf.
    要不要看看????
      

  3.   

    那你就发给我吧!!谢谢
    [email protected]
    我说的是通过java程序来读取:)
    有没有这方面的API,我看多是生成PDF的API
    没有发现有读取的API自己读,发现格式好乱阿!!
    中文还乱码,是什么FlateDecede编码谁知道啊?
    期待中......
      

  4.   

    JPedal is a Java library released under the LGPL license for extracting text and images from pdf files. It also provides a rasterizer.Highlights include:- 100% Pure Java 
    Extract images (clipped and unclipped as jpegs or tiffs) 
    Extract text data from pdf as XML Elements with font information. 
    Rasterizer to generate pdf images. 
    Ability to enhance with custom grouping algorithms. 
    Actively developed. 
    Full source code and examples. 
    Proven use in commercial products download:
    http://prdownloads.sourceforge.net/jpedal/homepage:
    http://www.jpedal.org
      

  5.   

    what's the error message?
    Exception?
    Please post the detail.
      

  6.   

    the method readTrueTypeFont(boolean,String) in org.jpedal.fonts.PdfFontsData "类型为 java.awt.Font 名为 TRUETYPE_FONT 的字段未定义"the class org.jpedal.io.ObjectStore "导入引用了丢失的包:javax.media.jai.*" and "名为 RenderedOp 的类型未定义"