数学上,把set称做由不同的元素组成的集合,集合(set)的成员通常被称做集合元素。

集合有两种不同的类型,可变集合(set)和不可变集合(frozenset)。

对于可变集合,你可以添加和删除元素。对不可变集合则不允许这样做。

可变集合不是可hash的,不可变集合则正好相反,他们有hash值,下面我们会重点说一说可变集合。

可变集合有三大特性:无序、去重、可hash。

无序:集合既没有索引,也没有键,因此集合中的元素是随意摆放的。

去重:集合中的元素由于是可hash的,因此每个元素都是唯一的。

可hash:集合中的每个元素都可以利用hash()来查看它的hash值。hash值都是不可变的,不然你将无法找到它。

 

1.如何创建集合类型和给集合赋值

集合与列表和字典不同,没有特别的语法方法。只能用工厂方法set()和frozenset()进行创建。



>>> s = set('cheseshop')  #可变集合 可直接用其他数据转化
>>> s
{'c', 'p', 'h', 's', 'e', 'o'}
>>> t = frozenset('bookshop')   #不可变集合
>>> t
frozenset({'p', 'h', 's', 'k', 'b', 'o'})
>>> type(s)
<class 'set'>
>>> type(t)
<class 'frozenset'>
>>> len(s)
6
>>> len(s) == len(t)   #可以使用len()函数
True
>>> s == t
False



 



>>> set5 = {'kebi',True,[1,2,3,]}
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: unhashable type: 'list'    #必须是可hash,也就是不可变的



 

 

 

2.如何访问集合中的值

集合不像之前学到过的序列可以通过索引来获取元素,也不像字典可以通过键来直接查询。

集合只能查看所有成员或者通过成员资格检测来查看。



>>> 'k' in s
False
>>> 'k' in t
True
>>> for i in s:
...     print(i)
... 
c
p
h
s
e
o
>>> for i in t:
...     print(i)
... 
p
h
s
k
b
o



3.如何更新集合以及删除集合

add:添加单个成员

update:添加一组成员

remove:移除单个成员

pop:随机删除一个元素

clear:清空一个集合



>>> s.add('z')  #添加单个
>>> s
{'c', 'p', 'h', 's', 'z', 'e', 'o'}
>>> s.add('xx')
>>> s
{'c', 'p', 'h', 's', 'z', 'e', 'xx', 'o'}
>>> s.update('OMG')  #添加多个
>>> s
{'c', 'p', 'h', 's', 'z', 'e', 'M', 'xx', 'O', 'G', 'o'}
>>> s.remove('xx')  #移除单个
>>> s
{'c', 'p', 'h', 's', 'z', 'e', 'M', 'O', 'G', 'o'}
>>> s -=set('cphs')  #移除多个
>>> s
{'z', 'e', 'M', 'O', 'G', 'o'}



>>> s
{'c', 'p', 'h', 's', 'e', 'o'}
>>> s |=set('OMG')   #与update等价
>>> s
{'c', 'p', 'h', 's', 'e', 'M', 'O', 'G', 'o'}



 



>>> set1
{'kebi', 'maoxian', 'name'}
>>> set1.pop()      #随机删除一个元素,有返回值。
'kebi'
>>> set1.pop()
'maoxian'
>>> set1
{'name'}



>>> set1
{'kebi', 'name'}
>>> set1.clear()     #清空一个集合
>>> set1
set()

>>> set1
{'kebi', 'maoxian', 'name'}
>>> del set1                          #删除一个集合
>>> set1
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
NameError: name 'set1' is not defined



 

之前说过,只有可变集合可以修改



>>> t.add('z')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
AttributeError: 'frozenset' object has no attribute 'add'



可以使用del来删除集合,当集合的引用计数变为0时,便会被标记随后被内存空间回收。

 

4.利用集合的特性去重



>>> tuple1 = ('SKT','KT','SKT','SSG','KT')  #去除元祖中多余的
>>> set3 = set(tuple1)
>>> set3
{'SSG', 'KT', 'SKT'}

>>> list1 = [1,2,3,1,4,4,4,2]  #去除列表中多余的
>>> set2 = set(list1)
>>> set2
{1, 2, 3, 4}
>>> list1 = list(set2)
>>> list1
[1, 2, 3, 4]



>>> dict = {}.fromkeys(['kebi','maoxian'],'dasb')
>>> dict
{'kebi': 'dasb', 'maoxian': 'dasb'}
>>> set(dict)      只能对键去重,值是可变的
{'kebi', 'maoxian'}



 

 

 5.集合类型操作符

(1)成员资格检测:in 和  not in



>>> 'k' in s
False
>>> 'k' in t
True



(2).集合等价\不等价:== 和 !=

两个集合相等是指:当且仅当其中一个集合中的每个成员同时也是另一个集合中的成员。



>>> s == t
False
>>> s != t
True



(3).子集/超集

<或<=:判断子集

>或>=:判断超集



>>> set('shop') < set('cheeseshop')
True
>>> set('bookshop') >= set('shop')
True

>>> frozenset('shop') < set('cheeseshop')
True

>>> set('shop') < frosenset('cheeseshop')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
NameError: name 'frosenset' is not defined

>>> frozenset('shop') <= set('cheeseshop')
True



注意:3中放宽了对等号的限制

 (4)联合(|)

两个集合联合是一个新集合,该集合中的每个元素至少是其中一个集合的成员,与函数union()等价,生成的新的集合是可变集合



>>> s
{'c', 'p', 'h', 's', 'e', 'o'}
>>> t
frozenset({'p', 'h', 's', 'k', 'b', 'o'})

>>> s.union(t)
{'c', 'p', 'h', 's', 'k', 'e', 'b', 'o'}



>>> m =s | t    #谁在前,集成谁
>>> type(m)
<class 'set'>



 

(5)交集(&)

两个集合的交集是一个新集合,该集合中的每个元素同时需要是两个集合的成员,生成的集合为可变集合。



>>> s & t     #谁在前继承谁
{'p', 'h', 'o', 's'}

>>> s.intersection(t)
{'p', 'h', 'o', 's'}

>>> l = s.intersection(t)
>>> type(l)
<class 'set'>
>>> k = t.intersection(s)  #谁是主体,继承谁
>>> type(k)
<class 'frozenset'>



(6).差补/相对补集 -

s - c 的差补就是s中有,c中没有的;同理,c - s的差补就是c中有而s中没有的,与函数difference()等价



>>> s 
{'c', 'p', 'h', 's', 'e', 'o'}
>>> t
frozenset({'p', 'h', 's', 'k', 'b', 'o'})

>>> s - t  #谁是主体,继承谁的集合类型
{'c', 'e'}
>>> t -s
frozenset({'b', 'k'})



(7)对称差补 ^

对称差补是两个集合中的成员,但是不单独属于哪一个成员。就是s -c的差补加上c -s的差补。



>>> s ^ t
{'c', 'b', 'k', 'e'}
>>> w = s ^ t
>>> type(w)
<class 'set'>
>>> q = t ^ s   #谁在前,就继承谁
>>> type(q)
<class 'frozenset'>



6.集合类型的内建方法

(1)适合于所有集合的方法(通用)

方法名称

操         作

s.issubset(t)

如果s 是t 的子集,则返回True,否则返回False

s.issuperset(t)

如果t 是s 的超集,则返回True,否则返回False

s.union(t)

返回一个新集合,该集合是s 和t 的并集

s.intersection(t) 

返回一个新集合,该集合是s 和t 的交集

s.difference(t)

返回一个新集合,该集合是s 的成员,但不是t 的成员

s.symmetric_difference(t)

返回一个新集合,该集合是s 或t 的成员,但不是s 和t 共有的成员

s.copy()

返回一个新集合,它是集合s 的浅复制

 

 

 

 

 

 

 

 

(2)仅适合可变集合

方法名

操   作

s.update(t)

用t 中的元素修改s, 即,s 现在包含s 或t 的成员

s.intersection_update(t)

s中的成员是共同属于s 和t 的元素

s.difference_update(t)

s中的成员是属于s 但不包含在t 中的元素

s.symmetric_difference_update(t) 

s中的成员更新为那些包含在s 或t 中,但不 是s和t 共有的元素

s.add(obj)

在集合s 中添加对象obj

s.remove(obj)

从集合s 中删除对象obj;如果obj 不是集合s 中的元素(obj notin s),将引发KeyError 错误

s.discard(obj) 

如果obj 是集合s 中的元素,从集合s 中删除对象obj

s.pop()

删除集合s 中的任意一个对象,并返回它

s.clear()

删除集合s 中的所有元素