用lucene全文检索,每天/月一个库?

解决方案 »

  1.   

    一天1000W 数据很大 别用mssql了  用非关系型的数据库吧 
      

  2.   

    具体解决方案呢?Lucene索引还是直接数据表索引?还是其他更好的办法
      

  3.   

    这东西不适合关系型数据库,更不适合NoSQL。可以考虑使用实时数据库或者直接写文件。
      

  4.   

    实时数据库处理的是可不是字符型数据,也不是关键字检索。
    关系数据库处理不了这么大的量,只能是lucene类的全文检索。
      

  5.   

    最好采用lucene,在数据库上做文章已经没意义了
      

  6.   

    在关键字检索方面,数据库的选择意义不大。
    lucene可以用来解决一般性问题。
    如果lucene出现性能问题,最后还是得自己学习 trie图+分词,自己DIY了。
      

  7.   

    不可能用关系型数据库解决这个问题数据持久化可以考虑 HBase或者Cassandra
    如果不需要数据随机访问,可以直接用HDFS这个需求和RDBMS中“索引”扯不上关系
    分词---〉倒排---〉统计