说实话,真是不报太大希望的一问,好像研究lucene的人很少
想实现这样的功能
从几个网站里搜索,建立索引的时候需要记录这个网页来自哪个网站.
搜索时,比如搜索"技术",要求能够把搜索到的网站和此网站包含多少个含有“技术”关键字的网页显示出来.
如:
搜索“技术”后显示
www.csdn.net 包含100条
www.sun.com 包含200条
......
我用lucene搜索的时候得到hits,然后遍历一边,记录每一条的网站名,可是由于要全部遍历,太费时间了。以前搜索出5000条也不过300毫秒,现在一下子就翻了10倍。
高手给点意见吧。