字典
1、 概述
字典是一个无序的数据集合,序列类型用有序的数字键做索引将数据以数组的形式存储。
在字典中能获得的有序集合只能是键的集合或者是值得集合,方法keys()或者value()返回一个列表,该列表是可以排序的,也可以使用items()方法得到包含键、值对的元组的列表来进行排序,字典本身是无序的。
哈希表拥有很好的性能,从而在使用键进行查询的时候,速度很快。
1.1 创建字典
创建字典有三种方法:
第一种直接使用大括号{}来进行创建并赋值,使用方法如下:
第二种使用工厂方法dict()来进行创建:
Diction= dict(([“x”,”y”],[1,2]))
第三种使用内建方法fromkeys()来创建默认的字典,字典元素中具有相同的值,当没有给出值得时候,默认为None:
Diction= {}.fromkeys((“x”,”y”),-1)
>>> diction = {"x":1,"y":2}
>>> diction
{'y': 2, 'x': 1}
>>> diction = dict(([1,2],["x","m"]))
>>> diction
{1: 2, 'x': 'm'}
>>> diction = {}.fromkeys(("x","y"),"abc")
>>> diction
{'y': 'abc', 'x': 'abc'}
>>>
|
1.2 访问字典中的值
访问字典中的值,可以直接使用key来进行访问,例如diction[“x”]
在进行遍历循环的时候,可以使用keys()来进行遍历,也可以直接对字典进行遍历:
>>> diction
{'y': 'abc', 'x': 'abc'}
>>> diction["y"]
'abc'
>>> for i in diction:
... print i,diction[i]
...
y abc
x abc
>>> for i in diction.keys():
... print i,diction[i]
...
y abc
x abc
>>> diction = {}.fromkeys(("x",1))
>>> diction
{'x': None, 1: None}
|
当在字典中不存在此键的时候,会返回一个错误,keyerror,在判断键是否在字典中,可以使用in或者是not in来进行判断:
>>> diction
{'x': None, 1: None}
>>> diction["kel"]
Traceback (most recent call last):
File "<stdin>", line 1, in ?
KeyError: 'kel'
>>> "kel" not in diction
True
>>> "x" in diction
True
|
1.3 更新字典
在修改字典的时候,可以直接添加一个新的数据项或者是新元素(一个键一个值),修改一个已经存在的数据项,或者删除一个已存在的数据项:
>>> diction
{'x': None, 1: None}
>>> diction["kel"] = "kel"
>>> diction
{'x': None, 'kel': 'kel', 1: None}
>>> diction["x"] = "change the string"
>>> diction
{'x': 'change the string', 'kel': 'kel', 1: None}
|
在进行print的时候,可以简化pring语句,如下:
>>> print "the x is %(x)s ,and the kel is %(kel)s" %diction
the x is change the string ,and the kel is kel
>>> diction
{'x': 'change the string', 'kel': 'kel', 1: None}
|
1.4 删除字典元素和字典
删除字典元素的例子如下:
>>> diction
{'x': 'change the string', 'kel': 'kel', 1: None}
>>> del diction["x"]
>>> diction
{'kel': 'kel', 1: None}
>>> diction.pop(1)
>>> diction
{'kel': 'kel'}
|
不要使用dict,list,file,bool,str,input,len这样的内建类型作为变量命名。
2、 字典操作符
字典可以喝所有标准类型操作符一起工作,但却不支持像拼接和重复这样的操作,这些操作队序列式有意义的,但是对字典类型不行。
字典可以进行比较,可以使用in或者not in来检查键是否存在于字典中。
在字典进行比较的时候,先比较字典的长度,然后比较字典的键,然后比较字典的值,当完全相同的时候,那么返回为0,也就是cmp函数的比较。
3、 字典相关函数
3.1 dict()
工厂函数用来创建字典,当不提供参数的时候,会生成空字典;当容器类对象作为一个参数传递给方法dict()的时候,必须是成对出现的。
>>> diction = dict(([1,2],[3,4]))
>>> diction
{1: 2, 3: 4}
>>> diction = dict(zip(("x","y"),(1,2)))
>>> diction
{'y': 2, 'x': 1}
>>> dict([("xy"[i-1],i) for i in range(1,3)])
{'y': 2, 'x': 1}
>>> diction = dict("1"=2,"3"=4)
SyntaxError: keyword can't be an expression
>>> diction = dict(x=2,y=4)
>>> diction
{'y': 4, 'x': 2}
|
3.2 sorted()
使用sorted内建函数得到一个有序的迭代:
>>> for eachKey in sorted(diction):
... print "diction key",eachKey,"has value",diction[eachKey]
...
diction key x has value 2
diction key y has value 4
|
3.3 update()
使用update方法将一个字典的内容添加到另外一个字典中,重复的将被覆盖,部存在的键将被添加到字典中,clear()方法用来删除字典中的所有条目:
>>> diction
{'y': 4, 'x': 2}
>>> dictionA = {}.fromkeys((1,"x"),("nothin","something"))
>>> dictionA
{1: ('nothin', 'something'), 'x': ('nothin', 'something')}
>>> diction.update(dictionA)
>>> diction
{'y': 4, 'x': ('nothin', 'something'), 1: ('nothin', 'something')}
>>> diction.clear()
>>> diction
{}
|
3.4 copy()
Copy方法返回一个字典的副本,在这个时候使用的是浅复制,get()方法和键查找操作符[]相似,不同的是它允许你为不存在的键提供默认值,如果该键不存在,并且没有给出默认值,那么将返回None,在这个时候不用担心因键不存在从而导致的异常。
>>> diction
{'y': 2, 'x': 1}
>>> dictionA = diction.copy()
>>> dictionA
{'y': 2, 'x': 1}
>>> dictionA.get("x")
1
>>> dictionA.get("kel")
>>> dictionA.get("kel","no such key")
'no such key'
>>> dictionA["kel"] = "kel"
>>> dictionA
{'y': 2, 'x': 1, 'kel': 'kel'}
>>> diction
{'y': 2, 'x': 1}
>>> diction["new"] = "new"
>>> diction
{'y': 2, 'x': 1, 'new': 'new'}
>>> dictionA
{'y': 2, 'x': 1, 'kel': 'kel'}
|
3.5 setdefault()
Setdefault方法主要用来检查字典中是否含有某键,如果键存在,那么取值;如果键部存在,那么将这个键进行复制,并返回值:
>>> diction
{'y': 2, 'x': 1}
>>> diction.setdefault("y","kel")
2
>>> diction
{'y': 2, 'x': 1}
>>> diction.setdefault("kel","setdefault")
'setdefault'
>>> diction
{'y': 2, 'x': 1, 'kel': 'setdefault'}
|
3.6 fromkeys()
Fromkeys主要用来创建字典,如下所示:
>>> {}.fromkeys("xyz")
{'y': None, 'x': None, 'z': None}
>>> {}.fromkeys(("kel","other"),True)
{'kel': True, 'other': True}
|
3.7 其他方法
Keys(),items(),values()方法的返回值都是列表,在数据集很大的时候会导致很难处理,从而出现了方法iteritems(),iterkeys(),itervalues(),使用这些方法的时候比较节省内存。