解决方案 »

  1.   

    为森么没人回答呢 
    准备用mmseg4j又与Lucene-4.10.1各种不兼容
      

  2.   

    自定义分词器:)
    取巧的方式是  在现有的 分词器上 做 wrap, 加入自己的逻辑。
      

  3.   


    用的是HMMChineseTokenizerFactory怎么wrap,完全是Lucene小白啊,能给个代码段吗?
      

  4.   

    给不了,木兴趣折腾这东东。-_-bread the fucking code...