lucene是基于倒排索引的。我的理解是,在创建索引的时候,应该提取出来每篇文章的有效关键词了。但是我觉得他在创建索引的时候好像没有用到分词,是不是lucene内置了分词?lucene搜索的时候确实是分词了,我用了其他的分词组件,我的项目是这样,一直也能用,但是有几个特殊需求不能很好的实现。比如针对编号(字母、符号和数字)的各种模糊匹配。我现在的问题是:能不能查看,创建一篇文章索引时的倒排索引,都提取出哪些词了?或者我的理解是不是有什么问题?
这一直是我的一个困惑。