之前一直不理解dict,廖雪峰老师的教程确实简单明了

dict

Python内置了字典:dict的支持,dict全称dictionary,在其他语言中也成为map,一说map,直接想到hash表,直接理解。使用键-值(key-value)存储,具有极快的查找速度。
例子,假设要根据同学的名字查找对应的成绩,如果使用list实现,需要两个list

names = ['abysmal', 'sea', 'wxy']
scores = [99,100,100]

这里我很喜欢python中使用复数和单数表示集合和单个元素
那么,给定名字,查找对应成绩,需要在names中找到对应位置,再在scores中找对应位置的成绩,很麻烦,且list越长,耗费时间越长。

这时,如果有名字和成绩对应的表,那么查找速度大大提升,此时map,噢在python中为dict,应运而生。

>>>d = {'abysmal':99, 'sea':100, 'wxy':100}
>>>d['wxy']
>100

同时注意,一个key对应一个value

由于一个key只能对应一个value,所以,多次对一个key放入value,后面的值会把前面的值冲掉:

>>> d['Jack'] = 90
>>> d['Jack']
90
>>> d['Jack'] = 88
>>> d['Jack']
88

key不存在,会报错

使用in方法判断key是否存在

>>> 'Thomas' in d
False

使用get方法,通过dict提供的get()方法,如果key不存在,可以返回None,或者自己指定的value:

>>> d.get('Thomas')
>>> d.get('Thomas', -1)
-1

注意:返回None的时候Python的交互环境不显示结果。
删除key则使用pop()方法:直接删除key-value

>>> d.pop('Bob')
75
>>> d
{'Michael': 95, 'Tracy': 85}

请务必注意,dict内部存放的顺序和key放入的顺序是没有关系的。

和list比较,dict有以下几个特点:
查找和插入的速度极快,不会随着key的增加而变慢;
需要占用大量的内存,内存浪费多。
而list相反:

查找和插入的时间随着元素的增加而增加;
占用空间小,浪费内存很少。
所以,dict是用空间来换取时间的一种方法。

dict可以用在需要高速查找的很多地方,在Python代码中几乎无处不在,正确使用dict非常重要,需要牢记的第一条就是dict的key必须是不可变对象。(就是说,key不能是list之类的可变对象)

这是因为dict根据key来计算value的存储位置,如果每次计算相同的key得出的结果不同,那dict内部就完全混乱了。这个通过key计算位置的算法称为哈希算法(Hash)。

要保证hash的正确性,作为key的对象就不能变。在Python中,字符串、整数等都是不可变的,因此,可以放心地作为key。而list是可变的,就不能作为key:

>>> key = [1, 2, 3]
>>> d[key] = 'a list'
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: unhashable type: 'list'

set

set和dict类似,也是一组key的集合,但不存储value。由于key不能重复,所以,在set中,没有重复的key。
set是无序的
add方法添加元素

>>> s.add(4)
>>> s
{1, 2, 3, 4}
>>> s.add(4)
>>> s
{1, 2, 3, 4}

remove方法删除元素

>>> s.remove(4)
>>> s
{1, 2, 3}

set和dict的唯一区别仅在于没有存储对应的value,但是,set的原理和dict一样,所以,同样不可以放入可变对象,因为无法判断两个可变对象是否相等,也就无法保证set内部“不会有重复元素”。试试把list放入set,看看是否会报错。

再议不可变对象

其中str是不变对象,而list是可变对象,对于可变对象调用自身方法比如:

>>>a = ['c', 'b', 'a']
>>>a.sort()
>>>a
>['a', 'b', 'c']

但是对于str,因为它是不变的对象

>>> a = 'abc'
>>> a.replace('a', 'A')
'Abc'
>>> a
'abc'

如果是这样:

>>> a = 'abc'
>>> b = a.replace('a', 'A')
>>> b
'Abc'
>>> a
'abc'

这里我觉得再次引出了面向对象的思想:replace实际上是创建了一个新的字符串对象,但是a并没有指向新的字符串对象Abc,仍然指向abc,但是b指向了Abc
所以不变对象调用自身的方法,是不会改变它指向的对象的,也就是说,不会改变变量值,除非改变了指向的对象。

tuple虽然是不变对象,但试试把(1, 2, 3)和(1, [2, 3])放入dict或set中,并解释结果。
(1, 2, 3)可以放
(1, [2, 3])不可以放,错误提示:

TypeError: unhashable type: 'list'

unhashable,因为list是可变对象