自己写了一个中文分词组件,觉得还算不错,大家帮忙测测嗯,自我感觉分词效率还可以提高。分词模式有三:最大,最小,歧义包含歧义包含:就是一句话进行多种切分。如:我是一个中国人可以分成:我是/一个/中国人我是/一个中国/人我是一个/中国/人词库来自于shootsearch压缩包中包含三个文件:Segment.dll是分词组件TestForm.exe是测试程序sDict.txt是词库文件先载入词,再进行分词源码整理一下再发布
http://zsea.blog.com.cn/archives/2007/2244504.shtml