看到一篇文章,说:
Lucene默认分词结果:
org.apache.lucene.analysis.standard.StandardAnalyzer:
[搜] [索] [引] [擎] [的] [发] [展] [历] [史] [证] [明] [没] [有] [做] [不] [到] [只] [有] [想] [不] [到] [让] [人] [们] [更] [方] [便] [准] [确] [的] [获] [取] [信] [息] [是] [搜] [索] [引] [擎] [的] [使] [命]我不知道结果怎么体现出来,是不是输入“中人国”可以找到“中华人民共和国”呢?
我做了试验,但是没有成功,望指点,
是不是在建立索引文件的时候要做什么特殊处理?
Lucene默认分词结果:
org.apache.lucene.analysis.standard.StandardAnalyzer:
[搜] [索] [引] [擎] [的] [发] [展] [历] [史] [证] [明] [没] [有] [做] [不] [到] [只] [有] [想] [不] [到] [让] [人] [们] [更] [方] [便] [准] [确] [的] [获] [取] [信] [息] [是] [搜] [索] [引] [擎] [的] [使] [命]我不知道结果怎么体现出来,是不是输入“中人国”可以找到“中华人民共和国”呢?
我做了试验,但是没有成功,望指点,
是不是在建立索引文件的时候要做什么特殊处理?
不过lucene好像还有一个匹配度的问题,
如果匹配度不购的话,他就不显示.
这个也是他不同于数据库的全文检索的一方面.
具体的你就找找资料吧,我也正在学习中...
你可以找找别的切分词的包。