字典和集合

字典在3.7+中被确认为有序;集合是无序的并且无法进行索引操作

字典和集合内部是哈希表

对于字典,这张表内部存储了哈希值、键和值

对于集合,哈希表中没有键和值配对,只有单一的元素

1、插入操作

每次向字典或集合插入元素时,python首先会计算其hash值,根据hash值计算出这个元素应该插入哈希表的位置

(1)如果此位置是空的,那么直接插入

(2)如果此位置被占用,则说明该位置被占用,python会比较这两个元素分别对应的哈希值和键是否相等。

若相等,说明该元素已存在,如果值不同,则更新值

若两者中有一不同,则说明发生哈希冲突,意思是这两个元素键不同但是哈希值相同。

解决哈希冲突的方法:

  • 更换哈希算法
  • 线性寻找:在这个位置开始,挨个寻找空余位置,直到找到位置为止
  • 单链表法

2、查找操作

python计算hash值,根据hash值找到其对应的位置,比较这个位置中元素的hash值和键与需要查找的元素的hash值和键是否相等,如果相等直接返回,如果不相等则继续寻找,直到找到空位或异常为止

3、删除操作

python会暂时对这个位置赋予一个特殊的值,等到重新调整哈希表的大小时,再将其删除

哈希冲突的发生,往往会降低字典和集合的操作速度。因此,为了保证高效性,字典和集合的哈希表,通常会保证其至少留有1/3的剩余空间。随着元素的不断插入,当剩余空间小于1/3时,python会重新获取更大的内存空间,扩充哈希表。不过,这种情况表中所有的元素位置都会被重新排放,会导致速度缓慢,但是发生情况较少。

平均情况下,插入、查找和删除的时间复杂度为O(1)。

字典和集合通常运用在对元素的高效查找、去重等场景。