1,像现在的google把一些网页收录到自己数据库里,然后用户在搜索时找到自己想到的东西,但这些信息不是时时更新.
2.自己在做一些项目时,最多的就是操作数据库,检索信息.当然这肯定是时时更新了.以上说的两种实现检索的不同机制,针对不同的情况.我想问各位高手,有没有见过一个例子或自己做过一个同时用这两个东西的项目,或是怎么能找到这两种一个平衡点?请大家把自己的想法,或一些这方面文章发上来....大家share一下.谢谢!

解决方案 »

  1.   

    这类问题包含的概念太多了一般小型项目数据怎么采集 怎么查询 怎么处理都简单但是对于google以及其他搜索公司 所面临的是海量的 数据存储 查询 更新
    这就需要非常极端的数据库了
    而且是集群的概念架设
    同时分布式存储一个简单的查询在海量数据库中的操作都是非常谨慎的
    同时 数据库的簇概念 索引建设 多层索引 以及排序都是非常严格要求的同简单的小型项目有非常巨大的差别据说他们的数据库系统是是自己设计的
    分为各种索引 加快访问的效率
    同时使用分布式
    Master-Slave数据库模式
    Master 负责更新
    Slave负责查询并使用均衡器做分布式管理可以看看
    Mysql Cluster的源码 可能对你 有帮助
      

  2.   

    谢谢 huzhangyou 我是想知道关于这方面有什么新的技术??
      

  3.   

    http://www.libing.net.cn/  这是你的博客吧..不错