问题: 确定只装载10个元素, HashMap初始容量多少是最佳?
答案: 16
目的: 防止HashMap频繁扩容,影响性能
解析:
HashMap的底层数据结构是由 数组 和 单向链表 组成
扩容概念: 当所用数组的长度 大于 初始长度 * 0.75(负载因子)时,数组扩容
Map<String, String> map = new HashMap<String, String>();
等同于
Map<String, String> map = new HashMap<String, String>(16);
初始化容量默认为16,当数组使用超过 16 * 0.75 = 12 时(数组使用第13个元素时)扩容
举例:
map的初始容量为4,向map中放入6个元素,有可能扩容,有可能不扩容
如果所用数组长度小于 4 * 0.75 = 3,不扩容
不扩容,数据结构如下:
由于key的hash值相同,产生碰撞,放入到数组中的同一位置,形成单向链表
扩容的情况如下:
由于key的hash值不同,放入到数组中的不同位置,当放第四个元素时,HashMap扩容为8
扩容源码如下:
// ++ this.size = 4 this.threshold = 4 * 0.75 = 3
if (++this.size > this.threshold) {
this.resize();
}
假设10个元素寻址运算得到的index都不相同,初始容量应为 10 / 0.75 = 13.3向上取整,初始容量为14,此时不会扩容
通过阅读HashMap源码可知,容量大小为 2 的 n次方.所以应该取第一个大于14 的 2 的 n次方 值,为 16
新的问题: 容量大小为什么必须是 2 的 n次方?14为什么不行??
原因: 避免 哈希桶资源浪费
解析:
map.put("key","value")时,寻址算法为 length-1 & key.hash --> 13 & key.hash
length-1 : 00000000000000000000000000001101
key1.hash: 11111111111111110000111100000111
--------------------------------
00000000000000000000000000000101 = 5
如果容量为14 , length-1 = 13 , 13的二进制位1101,1101 与别的数值 进行 & 运算, 倒数第二位得到的永远是0,对空间造成浪费,同时会增大hash寻址得到的index相同的概率
所以length-1 的二进制 应当全部为1,将hash表的长度设为2的N次方
2的N次方 -1 的二进制全部为1,所有的哈希桶均有被使用的可能
避免了上述问题,所以初始容量应为16
其实无论你的HashMap(x)中的x设置为多少,HashMap的大小都是2^n。2^n是大于x的第一个数。因为HashMap的初始化代码中有以下这行代码:
static final int tableSizeFor(int var0) {
int var1 = var0 - 1;
var1 |= var1 >>> 1;
var1 |= var1 >>> 2;
var1 |= var1 >>> 4;
var1 |= var1 >>> 8;
var1 |= var1 >>> 16;
return var1 < 0 ? 1 : (var1 >= 1073741824 ? 1073741824 : var1 + 1);
}