HashMap在使用过程中,数据过多时会自动扩容。那么,在扩容之前最多可存多少数据呢?
用无参构造方法创建对象:
HashMap<String,String> hm = new HashMap<String,String>();
在JDK 7中
addEntry方法会先判断是否需要扩容。
size表示hashmap中已有的键值对数量,此时这个值还不包含即将插入新数据。
threshold是扩容阈值。无参构造方法,数组长度为16,加载因子是0.75,threshold=12。
扩容条件是(size >= threshold) && (null != table[bucketIndex]),表示不但要满足已有键值对数量达到扩容阈值,还得确定数组位置已存在数据,发生hash冲突。反过来说就是,如果数组位置是空的,即使达到阈值也不会扩容。也就是说,未达到阈值或未发生hash冲突时不扩容
插入数据后,再看一下createEntry方法:
键值对的数量会自增,size++;但是却不会重新扩容。
综上所述,可得出结论:
1、HashMap扩容的必要条件是:必须达到阈值且新增的key在数组位置发生hash冲突
2、新key未发生hash冲突,即使达到阈值,也不会扩容。此时hashmap中键值对数量会超过阈值。
既然会超过阈值,那么最多可存多少个键值对呢?
扩容之前,阈值不会被K-V数量影响,我们先让K-V达到阈值12。因为第12个key放入时,map中只有11个key,达不到阈值,不会扩容,所以这第12个key一定可以放入。现在,已经满足扩容的阈值条件了。要想在不扩容的条件下,放入更多的key,就要使新key不满足第二个条件,即不要发生hash冲突。只要数组中有尽可能多的空位,就能放入尽可能多的新key。因为map中已经有数据了,至少会占据一个位置,即12个key全部在同一个位置,那么就会剩下15个空位。新插入的key都不发生hash冲突的情况下,每个key占据一个空位,最多15个。再插入时就会hash冲突了。此时,map中key最多,总共有12+15=27个key
但在jdk8中,put方法调用的putVal方法,先放入key,再扩容。判断新增后的size是否达到阈值,超过阈值再扩容。与是否hash冲突无关。所以,jdk8中最多只能存与阈值相同个数key。
结论:
1、jdk 7,放入key之前先扩容,放入后不重新判断是否扩容。达到阈值且hash冲突时才扩容。不发生hash冲突,可超过阈值。最多存个数:threshold+table.length-1
2、jdk 8,放入key之后再判断扩容。最多存放key个数与阈值相同