一.集合
集合(set)是一个无序的不重复元素序列。1,2,3,4,1,2,3 = 1,2,3,4
集合的创建格式:
1). 使用大括号 { } 或者 set() 函数创建集合;
2). 注意:
创建一个空集合必须用 set() 而不是 { }
{ } 是用来创建一个空字典。
# 1. 集合的创建
s = {1, 2, 3, 1, 2, 3} # {1, 2, 3}
print(s, type(s))
# 注意点1: 集合的元素必须时不可变数据类型。
# s = {1, 2, 3, [1, 2, 3]}
# print(s, type(s))
# 注意点2:空集合不能使用{}, 而要使用set()
# s = {} # {} 是用来创建一个空字典
# print(s, type(s))
s = set()
print(s, type(s))
# 2. 集合的特性:
# 不支持+,*, index(索引), slice(切片)(因为集合无序不重复的)
# 支持in和not in
print(1 in {1, 2, 3, 4})
# 3. 集合的常用操作
# 3-1). 增加
# add: 添加单个元素
# update: 添加多个元素
s = {1, 2, 3}
s.add(100)
print(s)
s = {1, 2, 3}
s.update({4, 5, 6})
print(s)
# 3-2). 删除
# remove: 如果元素存在,删除,否则报错
# discard: 如果元素存在,删除,否则do nothing
# pop: 随机
# 删除元素,集合为空则报错
s = {1, 2, 3}
s.remove(3)
print(s)
s = {1, 2, 3}
s.discard(100)
print(s)
s = {1, 66, 2,99, 78, 3}
s.pop()
print(s)
# 3-3). 查看
# 差集: s1 - s2
# 交集: s1 & s2
# 对称差分: s1 ^ s2
# 并集: s1 | s2
s1 = {1, 2, 3}
s2 = {1, 2}
print(s1 - s2) # {3}
print(s1 & s2) # {1, 2}
s1 = {1, 2, 3}
s2 = {1, 2, 4}
print(s1 ^ s2) # {3, 4}, {1, 2, 3, 4} - {1, 2} = {3,4} |-&=^
print(s1 | s2) # {1, 2, 3, 4}
print(s1.issubset(s2)) # False s2是s1的子集吗
print(s1.isdisjoint(s2)) # False, s1和s2没有交集吗?判断这句话是否正确
# 4. 拓展: frozenset不可变的集合
# set 集合中所有能改变集合本身的方法(如 add、remove、discard、xxx_update 等),frozenset 都不支持;set 集合中不改变集合本身的方法,fronzenset 都支持。
s = frozenset({1, 2, 3})
print(s, type(s))
"""
frozenset 的这些方法和 set 集合同名方法的功能完全相同。frozenset 的作用主要有两点:
当集合元素不需要改变时,使用 frozenset 代替 set 更安全。
当某些 API 需要不可变对象时,必须用 frozenset 代替set。比如 dict 的 key 必须是不可变对象,因此只能用 frozenset;再比如 set 本身的集合元素必须是不可变的,因此 set 不能包含 set,set 只能包含 frozenset
"""
练习:
明明想在学校中请一些同学一起做一项问卷调查,为了实验的客观性,他先用计算机生成了N个1到1000之间的随机整数(N≤1000),对于其中重复的数字,只保留一个,把其余相同的数去掉,不同的数对应着不同的学生的学号。然后再把这些数从大到小排序,按照排好的顺序去找同学做调查。请你协助明明完成“去重”与“排序”的工作(同一个测试用例里可能会有多组数据,希望大家能正确处理)。
二.字典
字典是另一种可变容器模型,且可存储任意类型对象。
键一般是唯一的,如果重复最后的一个键值对会替换前面的,值不需要唯一。
# 1. 字典的创建dict
# key-value对或者键值对
d = {"name":"westos", "age":18, "city":"西安"}
print(d, type(d))
d = {}
print(d, type(d))
# 2. 字典的特性
# 不支持+,*, index, slice(因为集合无序不重复的)
# 支持in和not in
d = {"name":"westos", "age":18, "city":"西安"}
print('name' in d) # True, 判断是否为所有key值得成员
print("westos" in d) # False
字典的增删查改:
增和改:
增加和修改
d = {"name":"westos", "age":18}
d['city'] = "西安" # key不存在就添加
print(d)
d['city'] = "北京" # key存在则修改value值
print(d)
d = {"name":"westos", "age":18}
d.setdefault('city', "西安") # key不存在就添加
print(d)
d.setdefault('city', "北京") # key存在,则do nothing
print(d)
删:
删除
d = {"name":"westos", "age":18}
d.pop('name')
print(d)
d = {"name":"westos", "age":18}
del d['name']
print(d)
查:
查看
"""
查看所有: keys, values, items
查看局部: d[key], d.get(key), d.get(key, default-value)
"""
d = {"name":"westos", "age":18, "city":"西安"}
print(d.keys()) # 查看字典所有的key值
print(d.values()) # 查看字典所有的value值
print(d.items()) # 查看字典所有的key-value值(item元素)
print(d['name']) # 查看key为name对应的value值
# print(d['province']) # 查看key对应的vlaue值,如果不存在会报错。
print(d.get('province')) # 查看key对应的vlaue值, 如果存在则返回,如果不在在则返回None.
print(d.get('province', "陕西")) # 查看key对应的vlaue值, 如果存在则返回,如果不在在则返回默认值.
拓展:defaultdict
collections.defaultdict类,本身提供了默认值的功能, 默认值可以是整形,列表,集合等.
defaultdict 是 dict 的子类。但它与 dict 最大的区别在于,如果程序试图根据不存在的 key 访问 value,会引发 KeyError 异常;而 defaultdict 提供default_factory 属性,该为不存在的 key 来自动生成生成默认的 value。
需求:
我们想要一个能将键(key)映射到多个值的字(即所谓的一键多值字典)
解决方案:
1). 字典是一种关联容器,每个键都映射到一个单独的值上。如果想让键映射到多个值,需要将这些多个值保存到容器(列表或者集合)中。
2). 利用collections模块中的defaultdict类自动初始化第一个值,这样只需关注添加元素.
from collections import defaultdict
# 默认字典,设置默认value
d = defaultdict(int)
d['views'] += 1
d['transfer'] += 1
print(d)
d = defaultdict(list)
d['allow_users'].append('westos')
d['deny_users'].extend(['user1', 'user2'])
print(d)
d = defaultdict(set)
d['love_movies'].add("黑客帝国")
d['dislike_movies'].update({'功夫熊猫', '电影xxxx'})
print(d)
三.内置数据结构总结
可变数据类型:可以增删改。可变数据类型,允许变量的值发生变化,即如果对变量进行append、+=等这种操作后,只是改变了变量的值,而不会新建一个对象,变量引用的对象的地址也不会变化,不过对于相同的值的不同对象,在内存中则会存在不同的对象,即每个对象都有自己的地址,相当于内存中对于同值的对象保存了多份,这里不存在引用计数,是实实在在的对象。
不可变数据类型:不可以增删改。python中的不可变数据类型,不允许变量的值发生变化,如果改变了变量的值,相当于是新建了一个对象,而对于相同的值的对象,在内存中则只有一个对象,内部会有一个引用计数来记录有多少个变量引用这个对象。