假如 有个pdf文件 里面的内容是:姓名:wdw  出生年月:1985/1/1 
 
在网上看了很多用PDFBox来读取,可是都是把全部内容都读取出来的现在要求只读取其中的 wdw 和 1985/1/1固定的那些 姓名和出生年月就不用读取了!可以实现吗? 还望高人指点一下!

解决方案 »

  1.   

    呵呵,郁闷了。
    现在的项目要求就是把PDF文件中的数据读取出来
    自动填写到表单当中去!
    哎……
      

  2.   

    貌似就是楼上说的,毕竟pdf不是xml,不能识别标签,只能对内容进行过流了。。
      

  3.   

    哎……
    我也这么想过啊!
    可惜pdf内容是日文啊!读取出来的纯文本如下:出力日 2009/10/20 15:40:28
    【楽天市場】※注意※ これは受注管理などに使用する店舗様向けの帳票です。お客様にお送りにならないよう、お気をつけください。
    ■ 受注管理情報 購入日時 2009年10月20日 4時15分 受注番号 250334-20091020-49094121
    発送日 入金日
    ひとこと
    メモ
    ■ 注文者 氏名 斎田 健一郎(サイタ ケンイチロウ)
    住所 〒 986-0011    宮城県石巻市湊字御所入105-1
    電話番号 080-1827-7845
    ■ 支払い情報 請求金額 143 円 総合計 2,570 円
    ポイント利用方法 全て ポイント利用額 -2,427 円
    お支払方法 クレジットカード 一括払い【VISA】
    ■ 配送情報 配送方法 宅配便(西濃運輸カンガルー便)
    配送区分
    お届け日指定 お届け時間帯
    受注明細票 決済方法 配送方法 送付先 ギフト
    ク 宅
    ■ 送付先 氏名 斎田 健一郎(サイタ ケンイチロウ)
    住所 〒 986-0011    宮城県石巻市湊字御所入105-1
    電話番号 080-1827-7845
    のし 発送番号
    ■ 備考 [配送日時指定:]9:00〜12:00■ 明細
    商品名/商品番号/項目:選択肢 個数 単価 小計
    サマーセール「メンズ」吸汗速乾・Tシャツ・半袖 22008
    サイズ:LL(XL) カラー:グレー 2 480 円 960 円
    サマーセール「メンズ」吸汗速乾・Tシャツ・半袖 22008
    サイズ:LL(XL) カラー:ブラック 2 480 円 960 円
    合計 消費税 送料 代引き手数料
    1,920 円 0 円 650 円 0 円
    総合計 ポイント利用額 請求金額
    2,570 円 -2,427 円 143 円
      

  4.   

    貌似就是楼上说的,毕竟pdf不是xml,不能识别标签,只能对内容进行过流了。。