Learn && Live
虚度年华浮萍于世,勤学善思至死不渝
前言
Hey,欢迎阅读Connor学Java系列,这个系列记录了我的Java基础知识学习、复盘过程,欢迎各位大佬阅读斧正!原创不易,转载请注明出处:,话不多说我们马上开始!
HashMap的put方法的执行过程
以JDK8为例,先上源码
public V put(K key, V value) {
// (1)
return putVal(hash(key), key, value, false, true);
}
final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) {
Node<K, V>[] tab;
Node<K, V> p;
int n, i;
// (2)
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
// (3)
if ((p = tab[i = (n - 1) & hash]) == null)
// 索引位置为空
tab[i] = newNode(hash, key, value, null);
// 索引位置不为空
else {
Node<K, V> e;
K k;
// (3)-1
if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k))))
e = p;
// (3)-2
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
// (3)-3
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
// 5
treeifyBin(tab, hash);
break;
}
if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
// (4)
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
(1)put方法内会先调用hash()方法计算key的哈希值,再将哈希值、key、value作为参数传入putVal方法
(2)懒加载,即通过构造器初始化HashMap时不会开辟空间,而是在第一次调用put时,若当前table为空,则调用resize分配空间
(3)通过 p = tab[i = (n - 1) & hash]
根据key的哈希值找到它在数组中的位置,判断当前下标位置是否已经存在元素。
- 若没有,则把key、value包装成Node节点,直接添加到此位置。
- 若有,分为三种情况
1.当前位置元素与新元素的哈希值、key值均相同,即为相同元素,则新值覆盖旧值
2.当前位置元素与新元素的key值不相等,且当前为红黑树结构,则把它加入到红黑树中
3.当前位置元素与新元素的key值不相等,且当前为链表结构。若链表中不存在哈希值、key值均相同的相同元素,则采用尾插法加入到链表中,若插入后链表长度超过了8则转化为红黑树;若链表中已存在与新元素相同的,则新值覆盖旧值
(4)插入成功后再次判断是否需要扩容
hash()计算原理
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
(1)key为null,哈希值为0,由此也可以看出HashMap的key可以为null
(2)key不为空,则先计算key的hashCode值,赋值给h,然后把h右移16位,并与原来的h进行异或处理,得到key的哈希值
我们都知道hashCode()方法得到的值也可以是唯一的、可区分的,那么为什么要这样做呢?这样做有什么好处?
可以看出,(h = key.hashCode()) ^ (h >>> 16)实际上是将h,也就是key的hashCode值的高16位保留下来,再将低16位与高16位混合得到新的低16位,这样可以尽量保留高16位的特征,且异或运算本身的随机性也较强,因此是可以降低发生散列冲突的概率的