做java的全文搜索引擎Lucene + nutch和Lucene + Heritrix那个更好一些,人民邮电出了两本书《开发自己的搜索引擎——Lucene 2.0+Heritrix》和《Lucene+Nutch搜索引擎开发》,想买一本,买那本好呢?

解决方案 »

  1.   

    好像有本是我同学写的 如果初学看起来还是比较费劲的 介绍了一些源码的设计 我建议在网上先找点lucene或者搜索方面的资料和文章
    在看这些介绍实用和源码的书籍,因为无论是lucene还是hetrix或者nutch都是很不错的开源项目,理解他们的原理还是需要时间的。
      

  2.   

    之前有接触过lucene,现在想学Lucene + nutch或Lucene + Heritrix,请学过的或看过这两本书的提点建议
      

  3.   

    Lucene+Nutch搜索引擎开发 lucene讲的比较多一些
    这两本书都没有什么深度 
      

  4.   

    它也就四个部份,
    第一部份,也就是蜘蛛,一天不停的爬,
    第二部份,也就是垃圾箱,把垃圾倒进去,由它分类,做索引,再放到数据库中
    第三部份,就是垃圾回收车,从数据库中取也东西来再排好序,
    第四部份,就是用户界面了,排好的东西放橱窗上又成宝了。
    你说的那两本书我没看到,不过有一点可以肯定,做这个东西的难点就是,数据结构的知识。
    虽然说,JAVA把很的东西都封装好了,但是做搜索这东西,那些API就用不上了,因为这涉及很多的分析和排序。
    还有蜘蛛是和索引器是很耗资源的,同样,这些数据也是大的很离谱。平时做个BBS什么的,效率差一点,基本没有感觉
    搜索引擎不一样,运行起来,不用多久,就很明显。