我有一个hashmap
key是从key1到key200000,
而每一个key对应的value一个是1到10000的中随机的30个数字,不重复,
比如这样:key1:数组[1,2,3,....30]
key2:数组[2,4,5,6,9,100,33 共30个数字]前提是我现在要查询是通过key来找那个数组现在的vaule应该是重复存储,有没有办法不怎么降低查询速度的情况下降低存储需要的空间,请各位支招,谢谢!

解决方案 »

  1.   

    value值,从1~1W,可以考虑,用short型来保存value值,比采用int型,节省一半的空间。
    key值,从1~20W,如果每个key是从1连续排列到20W ,那么,可以不使用hashmap而直接使用数组;
          映射关系由键值对变成下角标。
      

  2.   


    其实value数组的值现在 最大是 20万 ,最小是几万,不连续 以后会递增 key值,从1~20W, 这个不连续 现在是20万个
      

  3.   

    嗯关键是不能使得 没用的资源占着不能被当做垃圾收回,你的程序内存就很容易泄露了(heap over)
      

  4.   

    随机数据本身没有办法压缩了,使用short可以改善单个数据的占用,但是不能从根本上解决问题。
    建议使用key-value型的内存数据库,如berkeley db,或者SQLite之类的嵌入式数据库。
    如果对性能要求不高,也可以考虑利用memory-mapping file自己构建一个工具。最好是使用key-value型的内存数据库,我自己就是这么处理的。