HASH散列，怎样更高效，召唤数学达人

在JAVA里面生成的hashCode都是整数有2的32次方那么大
比如我只有10w条记录。我用这么大的hashcode是不是很浪费呢。
如果我用小一点的会不会更快，会快多少呢？

解决方案 »

免费领取超大流量手机卡，每月29元包185G流量+100分钟通话, 中国电信官方发货

hash只要不重复，效率应该是一样的
mashmap是非同步的，而hashtable则是
貌似是没什么影响的
声明int i = 1；的时候不会因为 int 太大了
这么声明影响效率还是用 byte 吧
不浪费。而且不会更快。举个例子来说HashMap的默认大小是16，根据key.hashCode计算位置，当存放内容大于一个阈值后，才会自增，并重新计算所有entry的位置。所以，在容器存放空间上，不会很浪费。其次，对于hashCode本身来说10w > Short(16bit)的总容量65536，难道你想用17bit？或者24bit？这样，空间节省了些。但是你要算另外一笔账，按照24bit算，总的10w条记录，也就节省了大概100k内存，而为了这100k内存，你需要分别手工计算byte[3]各个byte的值，代码复杂易错不说，反而没有直接用int位运算快。
补充一点，hashCode只是计算位置的一个依据，并不是说hashCode Xbit，整个存储空间也能存放2^X条记录
我是想问在hash表中查找重复的时候hashCode的长度对查找的速度是否有影响
没有影响。hashCode ---> position 基本上都是基于位操作的。比如，HashMap:
    /**
     * Applies a supplemental hash function to a given hashCode, which
     * defends against poor quality hash functions.  This is critical
     * because HashMap uses power-of-two length hash tables, that
     * otherwise encounter collisions for hashCodes that do not differ
     * in lower bits. Note: Null keys always map to hash 0, thus index 0.
     */
    static int hash(int h) {
        // This function ensures that hashCodes that differ only by
        // constant multiples at each bit position have a bounded
        // number of collisions (approximately 8 at default load factor).
        h ^= (h >>> 20) ^ (h >>> 12);
        return h ^ (h >>> 7) ^ (h >>> 4);
    }    /**
     * Returns index for hash code h.
     */
    static int indexFor(int h, int length) {
        return h & (length-1);
    }
hash是把对象的hashCode变成自己的hash，indexFor是把hash变成对应的position。现在几乎找不到32位以下系统了，32位系统，数据带宽都是32bit的，CPU一次能处理32位，也就是4个字节的数据。把int换成short，在32bit系统下，用到的指令和时钟周期也是完全一样，只不过short浪费了2个车道而已。
这也就是为什么short x = 100; short y = 200; x ^ y 的类型自动是int的缘故
不要说 10w 了，就算数值是 0 也需要占用 4 个字节。这 4 个字节一般是按 CPU 寻址系统中的字长为依据的。与 CPU 寻址字长一样处理速度是最快的。少于 4 个字节的整数类型，比如 byte, short, char 在内存中实际上是占用 4 个字节的，32 位系统中 4 个字节是最小的占用。理论上 byte 只有 true 和 false 占用 1 位就可以了，但实际远比我们想象得复杂，其占用了 4 个字节 32 位。PS：Java 中的 int 在 HotSpot JVM 中是经过特别优化的，对于 int 的运算速度比 C 语言还快。
是不就像等于在问这两者效率差别int hashCode() {
    byte b = xxx;
    return b;
}int hashCode() {
    int i = xxx;
    return i;
}撇开程序级算法复杂度区别的影响，剩下的是不是就是硬件级处理的差别了