用lucene+heritrix做个局域网搜索引擎,那们大虾做过呢,给个思路,小弟在此先谢了

解决方案 »

  1.   

    Heritrix是可扩展的。在Extrator的层加上lucene的建索引模块。
    然后提过一个web UI 让用户搜索这时用到lucene的search模块。webUI 和Heritrix是两个相对独立的程序。 共享一个文件系统。P.S. nutch是一个完整的搜索引擎,包括抓取网页,用lucene索引,搜索。 可以一试~~
      

  2.   

    我上回就用了一下lucene.它的原理:
    1.生成索引文件
    2.查询页面,输入查询词
    3.查询页面,输出查询结果。官网:http://lucene.apache.org/