想问一下实现技术是怎么做的?还有就是,为什么会速度那么快。有没有朋友知道?

解决方案 »

  1.   

    李彦宏留美的时候一直在致力于搜索引擎的开发,并申请专利技术。技术立家的baidu真是实力派啊
      

  2.   

    百度的没开发技术说明,就不知道了。
    Google,据说是用了图的存储方式(网站互相链接的关系本来就是图嘛)。
    而图的存储中又建立索引,在搜索的时候只搜索索引部分,而实际的网页其他标签就不收录在索引中。
    换句话说。像这样
    <body>
    <table>
    <tr>
    <td><p style="text-align: center">我的内容页面</p></td>
    </tr>
    </table>
    测试的文字
    </body>而搜索引擎爬的收录内容仅仅只是:
    我的内容页面测试的文字这样简化了收录内容,而且呈现了收录的重要信息。
    再说,一个有64颗中央处理器的数据集群服务器,和内连有50G的速度的服务器组合,在性能与速度方面,是无法想象的。另外Google的程序使用的是C++编写的,服务器的数据库使用的是MySQL,这样精简的东西,再体现人工优化性能方面,Google真的做的很出色。当然百度也不例外。相关资料可以查阅:
    http://www.dreamlandcn.com/html/CPPlanguage/580/
    源代码搜索引擎
      

  3.   


     web 技术 哈哈
      

  4.   

    你用ajax控件和缓存技术看下,其中有一个控件好像是AutoC...开头的,在AjaxControlToolkit工具里面,你拖入并设置它的三个主要属性看下。
      

  5.   

    不一定,Google的技术早在几年前就公开了。
    曾经在这里看到过 http://www.codeproject.com/(英文的)
    好象是普林斯顿大学的科学家写的。我找不到那篇文章具体位置了,有兴趣的同志可以搜一下关于Search Engine的文章。