本人现在打算用luncene做搜索系统,用户量假设4000万,并发可能会很大。有几个问题没搞清楚:
1:luncene最大能够支持多大的索引文件(在性能没有太大影响的情况下)
2:luncene执行检索的时候是将索引文件完全加载到内存中,然后再查询吗?
3:当业务继续上升时,单台机器上的luncene很可能无法满足性能要求,采用哪种集群技术比较稳定,可靠呢?或者是有没有别的解决方案。
在网上搜了很多天,对于上面的问题还是没有满意的答案,希望各位有实际经验的同学和老师帮助解答一下。

解决方案 »

  1.   

    顶下 我也正愁呢 我现在1千万个文件都要50分钟··· 郁闷
    还没算增量 不过我们并发不严重 Lucene其实查询不慢 主要是建索引
      

  2.   

    compass+lucene
    并发倒不是很了解,
    期待大牛
      

  3.   

     目前我还没来得及考虑建立索引的速度呢,查询的性能应该更重要,现在也说不好将来实际会有多大的并发,但是今天下午测试了一下,在resin中并发2000已经很勉强了,将来如果业务量增加时,很容易突破这个数量级。所以,并发量突破2000是很有可能发生的,单台机器的性能永远都是一个限制,使用lvs, ngnix的或许也可以,但是我想早一个别的一种方案。还有一个问题,luncene的索引文件在多大容量下不会导致查询性能下降呢?