将一个txt文档的内容以它的正确格式提取出来放入数据库,没有什么资料说明这个txt里面的具体格式,全靠人为观察,目前的想法是先人为的总结出来一些模板
主要的问题是:人为总结的模板要怎么保存入数据库,对这个模板认识的还很模糊,希望有经验的人解释一下

解决方案 »

  1.   

    你为什么要放在TExt里面 这样不专业啊。你应该放在EXCEL里面都好一点啊,假如要放在TXT里面 你就定义格式嘛 譬如说 */1* 代表是 字符串 。 */2*代表数字  日期等等类推吗 ,写一个读取的类 凡是读进去的内容就比对 ,记得一定要定义开头和结尾,和THML的思想差不多
      

  2.   

    不是我不想描述明白,是压根我也不怎么明白,他这东西本来是PDF文档,上面记录了一些东西,我这边是先用PDFBOX取出类容,然后提取,要求要电脑自学习识别。受伤!!!