解决方案 »

  1.   

    你问的是两个问题:
    1.如何读取pdf并以文形式本保存到字符串类型的变量中(而不是图片)
    2.如何通过关键字找到某一行问题1:下载pdf的插件或dll
    问题2:字符串比较或正则
      

  2.   

    我用的dll是pdfbox,但是不知道怎样把含有关键字的行提取出来
      

  3.   

    我用的dll是pdfbox,但是不知道怎样把含有关键字的行提取出来
    你得先提取出来,才能比较到底是不是你要的啊.
    你以为是查询数据库呢?查询数据库是因为数据服务器帮你做了筛选工作,PDF文档自身可没有这个功能
    你打开PDF文档并能查找目标,那是因为PDF READER里做了功能,而不是文档本身有这个特性.
      

  4.   

    不管是TXT,WORD,EXCEL,还是什么
    都是编辑器在帮你匹配查找结果,而不是文档结构就能给你索引
    所以你想实现自己的查找,就得先都读取出来,然后用代码去匹配.