lucene paoding庖丁解牛对单个的汉字搜索、拆分问题(在开一帖)

中文分词主要目的,一是为了更加准确的搜索，二是为了减少索引文件的大小而加快搜索速度。
举例说明：生产和服务
分词后：生产服务
1. 准确：搜索生产，服务时，都能够正常搜索。要不搜索"和服“时也会匹配，这样的搜索是没有意义的；
2. 单字搜索：搜索”生“”产“”和“”服“”务“，好像意义不大，匹配程序不好。当然分词后根据搜索不到；
3. 如果确实需要这种搜索，那不要用分词。直接使用lucene自带的，CJK就好。是单字拆分，也注是每一个汉字都是一个词。这样就能满足你通过单字的搜索。
但会产生几个问题，1是搜索匹配可能不好，2是搜索速度会慢 3是索引文件很大。