楼主想实现什么功能?
===================
在程序里轻松支持pdf,定做PDF相关dll(包括生成,阅读,转换),请联系 [email protected]或qq329969959(请注明PDF,否则一概不加)

解决方案 »

  1.   

    to:EasyPDF
    我想读Pdf文档(包含中文的PDF),能有细化到读table,Paragrap,Chunk的API更好,写的操作用iText搞定了,就是读找不到资料,xpdf好像有些文档能读,有些又不能读,真是急死了,请多多指教!
      

  2.   

    你是想把一个pdf读成一个数据结构吗?这个很难的,首先你要定义一个和pdf兼容的数据结构,欢迎你和我电子邮件讨论([email protected])
      

  3.   

    读不读成一个数据结构倒无所谓,关键是需要提取PDF里各种数据的API,比如getTable,getChunk等
      

  4.   

    看样子你不了解pdf。pdf里面没有getTable,getChunk这些东西,而且pdf里面也没有什么api,就像html语法一样,pdf只是一种语法,可以描述文本、图片等等元素
      

  5.   

    我不是说pdf里的Api,我是说我现在需要一个可以读pdf里面table,chunk这些元素的api,现在业界找不到切实可用的开源包,如果自己分析pdf的文档格式写解析工具时间上来不及了~~
      

  6.   

    是这样,客户要在Web上导入和另存多种格式的文档,其中包括PDF格式,这样的话系统肯定需要pdf的读取和生成功能,生成Pdf用itext足够了,但是导入pdf是要入数据库的,入数据库的话肯定不可能把整个pdf的内容全部作为文本字段存进去
      

  7.   

    现在市面上有这种读pdf格式的商业软件么?在网上没找到
      

  8.   

    我看到itext有PdfReader对象,里面有getCatelog()等方法,是否可根据Catalog->pages->page->Content此线索来一步步的访问到pdf页内容呢?但是itext又没有此类的sample,真是见鬼!!
      

  9.   

    Catalog->pages->page->Content这样的路线是对的,你好好研究研究,我对itext不熟