本帖最后由 vbubble 于 2012-01-16 13:53:18 编辑

解决方案 »

  1.   

    作者: 王亮    [作译者介绍] 
    出版社:清华大学出版社 
    ISBN:9787302201472
    上架时间:2009-6-4
    出版日期:2009 年6月
    开本:16开
    页码:394
    版次:1-1
    价格:39.8
    提出了一套“网络数据挖掘”的完整理论,并给出一个实际的智能爬虫系统,通过理论与实际的完整呈现。
      通过对多个开源搜索引擎项目抽丝剥茧的细致分析,引出搜索引擎的一些基本原理与开发方法,并介绍了一个商业化搜索引擎的实例。
      

  2.   

    其实我觉得不管学什么,我提点个人意见你说要Java的。我感觉应该首先要看看搜索引擎原理方面的书,去当当上看看。原理懂了,开发语言都大差不差的。我对这个也蛮有兴趣的,可以互相交流
      

  3.   

    你可以找找关于 lucence 的资料 开源的
      

  4.   

    http://download.csdn.net/detail/qq931226110/3972771,很好的资源
      

  5.   

    http://download.csdn.net/detail/qq931226110/3972771,很好的资源:lucene
      

  6.   

    http://www.amazon.cn/%E6%90%9C%E7%B4%A2%E5%BC%95%E6%93%8E-%E4%BF%A1%E6%81%AF%E6%A3%80%E7%B4%A2%E5%AE%9E%E8%B7%B5-%E5%85%8B%E7%BD%97%E5%A4%AB%E7%89%B9/dp/B003RCK7YC/ref=sr_1_1?ie=UTF8&qid=1326852865&sr=8-1http://www.amazon.cn/%E6%B7%B1%E5%85%A5%E6%90%9C%E7%B4%A2%E5%BC%95%E6%93%8E-%E6%B5%B7%E9%87%8F%E4%BF%A1%E6%81%AF%E7%9A%84%E5%8E%8B%E7%BC%A9-%E7%B4%A2%E5%BC%95%E5%92%8C%E6%9F%A5%E8%AF%A2-%E8%8E%AB%E5%A4%AB%E7%89%B9/dp/B002DMLHPK/ref=sr_1_3?ie=UTF8&qid=1326852865&sr=8-3我学习跟现在工作中主要用到的就这两本