并非广告贴,主要是想和大家讨论技术。
地址 http://search.mdbchina.com核心是Lucene 2.0,中文分词是我自己搞得,分词算法也是我自己独创的,有拼音搜索,兼容繁体中文搜索,错别字纠正,有搜索建议,还有相关搜索功能列出相关搜索关键词。我自己搞的分词主要有一下一些类
ChineseAnalyzer: 不是Lucene文档里的那个,是我自己堆出来的
ChineseTokenizer: 不是Lucene文档里的那个,我自己整的分词器
ChineseTokenizerConstants: 一看便知
ChineseTokenizerTokenManager: 对StandardTokenizerTokenManager的“补丁”
ChineseSimplificationFilter: 繁体转简体过滤器我没有使用公认的模式,即:中文分词->******Analyzer,我选择了更为底层的方法,创新出我自己的ChineseAnalyzer,请各位高人试用。
地址 http://search.mdbchina.com核心是Lucene 2.0,中文分词是我自己搞得,分词算法也是我自己独创的,有拼音搜索,兼容繁体中文搜索,错别字纠正,有搜索建议,还有相关搜索功能列出相关搜索关键词。我自己搞的分词主要有一下一些类
ChineseAnalyzer: 不是Lucene文档里的那个,是我自己堆出来的
ChineseTokenizer: 不是Lucene文档里的那个,我自己整的分词器
ChineseTokenizerConstants: 一看便知
ChineseTokenizerTokenManager: 对StandardTokenizerTokenManager的“补丁”
ChineseSimplificationFilter: 繁体转简体过滤器我没有使用公认的模式,即:中文分词->******Analyzer,我选择了更为底层的方法,创新出我自己的ChineseAnalyzer,请各位高人试用。
解决方案 »
- 如何在SVG文件中插入音频文件?
- 关于J2ee
- 求一js
- 关于JSF中的自定义验证器的问题!
- 求助:关于JSP的时间处理及JAVABEAN..
- 一个BTOB的电子商务网站,可以同时用JSP和ASP相结合做吗?
- ■■■■关于servlet显示中文出现乱码问题求助■■■■
- 小弟初来报到,听说这儿人气很旺,特奉上100分,希望大家能多多捧场,并问一个问题!!!!
- 请问各位,怎样让新建的文件放在指定的目录里?
- 用JB建了个EJB(一句代码也没添加),运行时出错,为什么?(好几天了,还没解决)
- 急!!!!!!!!!有哪位高手可以告诉我lucene返回的结果集对它进行排重和分页??
- 关于WEB应用中的Lucene多线程安全问题
-----------------
www.ruansou.com 小第做的搜索引擎
[email protected]
给我一份谢谢拉!