请描述java实现搜索引擎的原理,java的中文分词技术有哪些?请写一段java程序实现在下面的一组数组中搜索引擎方式最准确的搜索关键词“北京市燕莎奥特莱斯购物中心”
数组:
北京市朝阳区东四环南路9号燕莎奥特莱斯购物中心
北京市东四环南路9号燕莎奥特莱斯购物中心
北京市朝阳区燕莎奥特莱斯购物中心
北京市朝阳区东四环燕莎奥特莱斯购物中心
数组:
北京市朝阳区东四环南路9号燕莎奥特莱斯购物中心
北京市东四环南路9号燕莎奥特莱斯购物中心
北京市朝阳区燕莎奥特莱斯购物中心
北京市朝阳区东四环燕莎奥特莱斯购物中心
但是我知道最近JAVA的搜索引擎已经被公布出来了,开源的。。你可以去找找。。
CSDN的新闻里有的
中文分词:IKAnalyzer(支持lucene)
中文分词:IKAnalyzer(支持lucene)学习
String text = "北京市朝阳区东四环南路9号燕莎奥特莱斯购物中心。";
Analyzer analyzer = new IKAnalyzer();
TokenStream stream = analyzer.tokenStream("xxx", new StringReader(text));
while (true) {
Token token = stream.next();
if (token == null) {
break;
}
System.out.print("[" + token.termText() + "] ");
}
}