viano(我爱十三妹子) 真有你的

解决方案 »

  1.   

    http://www.javajia.com/article.php?id=846
      

  2.   

    如果能找到Acrobat对应的读取PDF文件的dll,可以自己写一个对应的JNI来调用它
    可惜应用前景似乎不大,不然我也试着写一个
      

  3.   

    这个是支持PDF读写的:http://www.lowagie.com/iText/
    不过大多PDF文件都有作者的密码,修改是不可能的。当然创建自己的PDF是可以的!
      

  4.   

    to tomcatjava(小鱼儿),我没有找到IText抽取PDF文字内容的API,请指教
      

  5.   

    to  allenmaygu(竹人),pdf box-不支持中文,第二个提取的内容不是完全正确
      

  6.   

    PDFBOX是支持中文提取的,仔细研究下看就知道了,主要在于编码选择上,最新版本已经支持选择输出编码。
    另外一个非java版本的选择是使用xpdf
    感兴趣的朋友可以到我论坛详细讨论。
    touchpdf.our3.163.com