lucene 3.0 索引 解析pdf 项目中用到 lucene 索引,要求把pdf中的词语 句子拿出来 存到数据库中使用过lucene 的朋友给点思路吧,最好有个demo什么的,谢谢了。 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 http://www.blogjava.net/dreamstone/archive/2007/06/14/124286.html 使用pdfbox是个好方法,我用过了挺好的,现在我需要的思路是,如何把一个文本中的句子和单词取出来持久化到数据库中,文档中内容就像课文似的,有单词、单词解释,句子、句子解释、语法等等。。 我不懂了,这不就是lucene干的事情吗?你是想把lucene的索引文件保存到数据库中? 其实我也不太明白,我是刚看lucene,我理解这个东西就是跟书本索引一样,有了索引查东西就快,不知道我理解的对不?还有分词起到什么作用。现在的项目需求是把pdf中的东西拿出来存到数据库中。还有个功能就是查词典,词库是一个pdf文件。 大家帮我解决一个问题 解决mysql数据库字符编码问题(latin1转换为gbk) java异常求助(急) nosuchmethod display标签中使用CSS的一个问题 我在整合hibernate和spring之后测试出错 200分求高人介绍grid中以java编写的前台程序 求大神帮忙servlet接收上传图片的问题 jboss3.2.0配置mssql2000 DataSource发生如下错误?????? java内存模型的问题 关于ibatis + spring 实现指定记录之间的查找 文本编辑器出错? 请各位帮帮忙
使用pdfbox是个好方法,我用过了挺好的,
现在我需要的思路是,如何把一个文本中的句子和单词取出来持久化到数据库中,
文档中内容就像课文似的,有单词、单词解释,句子、句子解释、语法等等。。
其实我也不太明白,我是刚看lucene,我理解这个东西就是跟书本索引一样,有了索引查东西就快,
不知道我理解的对不?
还有分词起到什么作用。现在的项目需求是把pdf中的东西拿出来存到数据库中。
还有个功能就是查词典,词库是一个pdf文件。