Hashmap是一个存储key-value的映射表。

优点:

  • 索引数据快,查找一个数据对的时间复杂度是O(1)
  • 增加、删除一个数据的时间复杂度是O(1)
  • key不能重复,可以存储一个null值

存储:

  • 通过key的hashcode值存储在指定数组下标中
  • 用链表存储hashcode值一样,都是key不一样的数据,链表长度大于8时转换为红黑树(为了提高查询效率)

HashMap的内部结构

Hashmap封装了一个Node数组进行存储key-value的键值对,常用的get和put等都是对这个Node数组进行操作。

Node有四个属性:key、value、hash、next

  • hash:32位的整数,通过key的hashcode计算出来,hash&(数组长度-1) = 元素在数组的下标
  • next:指向Node节点的指针,不同的key计算出来的hash值可能是一样的,如果要存储的下标位置已经有值了,用链表将元素连起来

初始化HashMap:一开始HashMap内部是一个空的Node数组,插入数据后才会被创建

HashMap的常用操作

HashMap一开始的Node数组是空的,在第一次put元素后会默认创建一个长度为n = 16的数组

put一个key-value元素进入map中

计算key的hashcode值算出hash,得出index=hash&(长度-1),将元素存在数组[index]的位置。

有两种情况:

  • index这个位置已经有key了,比如当数组的长度是16时,33&(16-1) = 1. ,  1 & (16 - 1) = 1 ; key值不同,但是index一样。

    这里就用到了Node的next属性,让数组index下标所在的(最后一个)元素的next指向插入的元素,

  • 可以直接将元素存入数组中

通过key从map中get一个元素

计算key的hashcode值算出hash,得出index=hash&(长度-1)

有两种情况:

  • 如果数组[index]的值为null,就说明不存在这个元素
  • 不为null,还得比较key值,通过遍历链表(如果有的话),一个个比较key值,返回key相同的元素,或null

HashMap的优化操作

  • 数组长度n永远是2的幂:hash&(n-1)是元素在数组的下标,(2的幂-1)的二进制会是一连串的1,然后与hash值进行与运算
    • 与运算之后的结果永远不会超过数组的界限
    • 充分的利用了hash值二进制
  • 负载因子:hashmap设置了一个0.75的阈值,也就是数组中的元素数量大于数组长度的0.75时,进行数组扩容,扩展成原来的两倍
    • 当数组长度不够时,会出现很多的hash冲突,就是链表很长,检索效率慢,扩容后通过hash&(n-1)会让很长的链表散开
  • 链表转换成红黑树:链表长度大于8,但是数组元素数量没达到阈值,会选择将链表转换为红黑树,提高查询效率
    • 要求数组长度已经大于64,避免数组扩容和链表转红黑树的冲突
  • hash值的计算:hash值的前16位与key的hashcode一样,后16位由hashcode的前16位与后16位异或运算得到
    • 充分利用hashcode的值,增加随机性,减少hash冲突