lunce,自己上网搜吧,资料很多的

解决方案 »

  1.   

    Lucene in Action中文版  "Lucene in Action"是Lucene最权威的指南!
    这本著作论述了然后索引数据,还介绍了搜索、排序、过滤以及高亮显示搜索结果等方面的内容。
    本书提供的实践方面的可重用示例以及一些中肯的建议,为您展示了一个奇妙的搜索世界。 【原 书 名】 Lucene in Action  
    【原出版社】 Manning Publications 
    【作  者】(美)Otis Gospodnetic;Erik Hatcher [同作者作品] [作译者介绍]  
    【译  者】 谭鸿;黎俊鸿;周鹏;高承山[同译者作品]  
    【丛 书 名】 Java搜索引擎指南 
    【出 版 社】 电子工业出版社      【书 号】 7121032171 
    【出版日期】 2007年1月     【开 本】 16开     【页 码】 393    
      

  2.   

    征服Ajax+Lucene构建搜索引擎【作  者】李刚 宋伟 邱哲 [同作者作品]  
    【丛 书 名】 征服Ajax系列丛书 
    【出 版 社】 人民邮电出版社      【书 号】 7115147078 
    【出版日期】 2006年4月     【开 本】 16开     【页 码】 369   
      

  3.   

    开发自己的搜索引擎--Lucene 2.0+Heritrix 【作  者】邱哲;符滔滔 [同作者作品]  
    【出 版 社】 人民邮电出版社      【书 号】 9787115160003 
    【出版日期】 2007年4月     【开 本】 16开     【页 码】 520   
    本书详细介绍了如何应用Lucene进行搜索引擎开发,通过学习本书,读者可以完成构建一个企业级的搜索引擎网站。.
    全书共分为14章,内容包括搜索引擎与信息检索基础,Lucene入门实例,Lucene索引的建立,使用Lucene构建搜索,Lucene的排序,Lucene的分析器,对Word、Excel和PDF格式文档的解析,Compass搜索引擎框架,Lucene分布式和Google Search API,爬虫Heritrix,综合实例之准备篇,综合实例之HTMLParser篇,综合实例之DWR篇,综合实例之Web编。..
    本书是国内第一本使用Lucene和Heritrix来讲解搜索引擎构建的书,通过详细的对API和源代码的分析,力求使读者在应用的基础上,能够深入其核心,自行扩展和开发相应组件,发挥想象力,开发出更具有创意的搜索引擎产品。本书适合Java程序员和从事计算机软件开发的其他编程人员阅读,同时也可以作为搜索引擎爱好者的入门书籍。
    由于目前市面上从技术层面介绍搜索引擎的书并不多,即使有,也大多停留在理论阶段,而非搜索引擎的开发过程。因此,可以说本书是国内第一本详细介绍搜索引擎开发过程的图书。
    (1)采用最新的Lucene 2.0。以前大家用的1.4.3版本,而最新的Lucene 2.0重写了很多API,内部的实现方法也有了很大优化。本书的代码都是在2.0版本下调试通过的,这样可以帮助读者了解Lucene的更多新功能。
    (2)配有一个完整的搜索引擎案例。这个案例有很强的实用价值,只需稍加修改,就能应用于实际项目,市场价值在30000元以上!
    (3)着重解决开发人员头痛的问题。本书的目的是指导项目实践,因此没有罗列各个API的用法,而是对常见的开发问题进行深入探讨,比如本书的第7章,是专门为解决“Word,Excel和PDF文件如何解析”这个问题而设置的。
    (4)内容新颖,前卫实用。本书介绍了Compass、Heritrix、DWR和HTMLParser等内容。在搜索引擎开发的过程中,这些均为相当重要且实用的技术,笔者经过自身实践将它们展现给读者,希望能让读者在学习Lucene的同时开拓视野。
      

  4.   

    《征服AJAX+LUCENE构建搜索引擎》高清PDF下载http://www.verycd.com/topics/145317/
      

  5.   

    《学术学位论文 搜索引擎专辑 》
    http://www.verycd.com/topics/94478/ 中文XML信息检索系统的研究.nh 详情  9.2MB 
     基于关系数据库的XML数据存储更新和检索.nh 详情  7.8MB 
     基于Web服务的多数据库集中查询系统的研究与应用.NH 详情  5.4MB 
     搜索引擎中的数据存储问题研究.NH 详情  4.4MB 
     基于Lucene的全文检索系统的研究与应用.NH 详情  3.7MB 
     中文全文检索技术研究.NH 详情  2.5MB 
     Search.Engine.rar 详情  50.9MB 
      

  6.   

    基于Lucene的全文检索系统的研究与应用.NH
    基于关系数据库的XML数据存储更新和检索.nh
    中文XML信息检索系统的研究.nh
    基于Web服务的多数据库集中查询系统的研究与应用.NH
    搜索引擎中的数据存储问题研究.NH
    中文全文检索技术研究.NH(NH为cnki专用格式,阅读器请在http://www.cnki.net/software/xzydq.htm 下载 CajViewer)这些论文在深入分析网页获取、索引生成、级别系统、索引检索等搜索引擎核心技术的基础上,设计并实现了一种新的搜索引擎.该搜索引擎使用分布式技术实现网页获取模块;通过词法分析、中文分词、无用词汇删除、词乾提取、索引词条选择和词典等技术建立索引数据库;该搜索引擎的级别系统使用了新的网络访问模型和级别计算模型,大大降低了搜索引擎对于计算机资源的要求.Cache技术的使用提高了用户访问效率.开放的体系结构使搜索引擎成为相关技术可靠和灵活的平台.在分析了众多优秀的网页排序算法的基础上,该文设计了新的网站级别系统.通过这个新的系统,搜索引擎能够实现更大规模的网页覆盖和更快的索引更新,从而提高更好的搜索服务.搜索引擎是建立在集群系统之上的,因此可以建立大规模的索引系统和提供高速用户访问的支持.搜索引擎的体系结构是开放的,相关技术能以它作为平台,实现灵活的集成.搜索引擎的各种配置和规则都是字典化的,它可以通过灵活的配置来实现扩展和伸缩.这个专辑包括的内容为:Web数据挖掘和个性化搜索引擎研究
    Web搜索与Web缓存的若乾关键问题研究
    基于Lucene的Web站内信息搜索系统
    基于多Agent的信息搜索引擎技术研究与应用
    基于多Agent的智能搜索引擎系统研究
    搜索引擎的研究与实现
    搜索引擎中的数据存储问题研究
    网络树形搜索引擎的设计及其验证
    遗传算法搜索能力和编码方式研究
    中文智能搜索引擎