java 如何将pdf转成html或者word?

解决方案 »

  1.   

    http://www.open-open.com/34.htm
    试试PDFBox
    我昨天用着生成PDF文档,还行,挺好用,自带的example把基本的操作都说明了至于生成word,用POI;HTML的话,自己解析就可以了
      

  2.   

    自己直接构造生成html的字符串就行了啊
      

  3.   

    PDFBox是一个开源的可以操作PDF文档的Java PDF类库。它可以创建一个新PDF文档,操作现有PDF文档并提取文档中的内容。
    它具有以下特性:
    1.将一个PDF文档转换输出为一个文本文件。 
    2.可以从文本文件创建一个PDF文档。
    3.加密/解密PDF文档。
    4.向已有PDF文档中追加内容。
    5.可以从PDF文档生成一张图片。
    6.可以与Jakarta Lucene搜索引擎的整合
      

  4.   

    哇,Java还有这功能,长见识了..
      

  5.   

    那能不能直接把PDF转出成EXCEL格式的?
      

  6.   


    文本文件都出来了,做成word还有问题?
      

  7.   

    呵呵,pdf里面要是有图片专成文本那不是都丢失了?
      

  8.   


    5.可以从PDF文档生成一张图片。 
      

  9.   

    使用开源项目pdftohtmlhttp://pdftohtml.sourceforge.net/,需要gs811w32支持,上网下