寒假想学开发搜索引擎,请教过来人个问题 做java的全文搜索引擎Lucene + nutch和Lucene + Heritrix那个更好一些,人民邮电出了两本书《开发自己的搜索引擎——Lucene 2.0+Heritrix》和《Lucene+Nutch搜索引擎开发》,想买一本,买那本好呢? 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 好像有本是我同学写的 如果初学看起来还是比较费劲的 介绍了一些源码的设计 我建议在网上先找点lucene或者搜索方面的资料和文章在看这些介绍实用和源码的书籍,因为无论是lucene还是hetrix或者nutch都是很不错的开源项目,理解他们的原理还是需要时间的。 之前有接触过lucene,现在想学Lucene + nutch或Lucene + Heritrix,请学过的或看过这两本书的提点建议 Lucene+Nutch搜索引擎开发 lucene讲的比较多一些这两本书都没有什么深度 它也就四个部份,第一部份,也就是蜘蛛,一天不停的爬,第二部份,也就是垃圾箱,把垃圾倒进去,由它分类,做索引,再放到数据库中第三部份,就是垃圾回收车,从数据库中取也东西来再排好序,第四部份,就是用户界面了,排好的东西放橱窗上又成宝了。你说的那两本书我没看到,不过有一点可以肯定,做这个东西的难点就是,数据结构的知识。虽然说,JAVA把很的东西都封装好了,但是做搜索这东西,那些API就用不上了,因为这涉及很多的分析和排序。还有蜘蛛是和索引器是很耗资源的,同样,这些数据也是大的很离谱。平时做个BBS什么的,效率差一点,基本没有感觉搜索引擎不一样,运行起来,不用多久,就很明显。 java程序在winxp64位系统中不不能运行? 菜鸟请教OSGI 如何能实现页面打开时提示密码验证,验证不通过,直接页面关闭呢?急 jsp文件上传问题 关于jsf的常见的复合组件问题,高分求助 jsp新手:我想知道1.jsp页面如果连接上就显示该页面,否则不显示 Spring @Transactional使用错误 问个和HttpUnit里的WebRequest有关的问题。请熟悉它的大虾进来指点一下。谢谢!Up有分! 简单问题,高分求助! 判断一个字符串的内容是不是double类型的函数 getBytes乱码问题 [顶]治根又治本解决中文问题
在看这些介绍实用和源码的书籍,因为无论是lucene还是hetrix或者nutch都是很不错的开源项目,理解他们的原理还是需要时间的。
这两本书都没有什么深度
第一部份,也就是蜘蛛,一天不停的爬,
第二部份,也就是垃圾箱,把垃圾倒进去,由它分类,做索引,再放到数据库中
第三部份,就是垃圾回收车,从数据库中取也东西来再排好序,
第四部份,就是用户界面了,排好的东西放橱窗上又成宝了。
你说的那两本书我没看到,不过有一点可以肯定,做这个东西的难点就是,数据结构的知识。
虽然说,JAVA把很的东西都封装好了,但是做搜索这东西,那些API就用不上了,因为这涉及很多的分析和排序。
还有蜘蛛是和索引器是很耗资源的,同样,这些数据也是大的很离谱。平时做个BBS什么的,效率差一点,基本没有感觉
搜索引擎不一样,运行起来,不用多久,就很明显。