学习Python Day7 —— 集合和字符串
集合
集合是容器型数据类型,将{}作为容器的标志里面多个元素用逗号隔开:{元素1, 元素2, 元素3,…}
可变的;无序的
元素:不可变的数据;唯一的
空集合
dic1 = {} # 空字典
s1 = set() # 空集合
print(type(dic1), type(s1)) # <class 'dict'> <class 'set'>
集合内元素是唯一的
s2 = {10, 20, 30, 10, 10}
print(s2) # {10, 20, 30}
集合是无序的
print({1, 3, 5} == {5, 1, 3}) # True
集合的增删改查
查 —— 集合只能遍历
games = {"红警", "贪吃蛇", "扫雷", "我的世界", "侠盗飞车"}
for i in games:
print(i)
增
集合.add(元素) - 在集合添加指定元素
集合.update(序列) - 将序列中所有的元素添加到集合中
games = {"红警", "贪吃蛇", "扫雷", "我的世界", "侠盗飞车"}
games.add("英雄联盟")
print(games)
games.update({"亡者荣耀", "刺激战场"})
print(games)
删
集合.remove(元素) - 删除集合中指定的元素(元素不存在会报错)
集合.discard(元素) - 删除集合中指定的元素(元素不存在不会报错)
games = {"红警", "贪吃蛇", "扫雷", "我的世界", "侠盗飞车"}
games.remove("贪吃蛇")
print(games) # {'扫雷', '我的世界', '红警', '侠盗飞车'}
games.discard("红警")
print(games) # {'我的世界', '扫雷', '侠盗飞车'}
改
先删除原来的,再添加新的。
数学集合运算
python中的集合支持数学中的集合运算:&(交集)、|(交集)、-(差集)、^(对称差集)、>、<、>=、<=(判断集合包含关系)
set1 = {1, 2, 3, 4, 5, 6, 7}
set2 = {4, 5, 6, 7, 8, 9, 10}
# 1)集合1 & 集合2 - 求两个集合的公共部分
print(set1 & set2) # {4, 5, 6, 7}
# 2)集合1 | 集合2 - 合并两个集合产生一个新的集合
print(set1 | set2) # {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
# 3)集合1 - 集合2 - 集合1去掉包含在集合2中剩下的元素
print(set1 - set2) # {1, 2, 3}
print(set2 - set1) # {8, 9, 10}
# 4)集合1 ^ 集合2 - 将两个集合合并后去掉公共部分
print(set1 ^ set2) # {1, 2, 3, 8, 9, 10}
# 5)
# 集合1 > 集合2 - 判断集合2是否是集合1的真子集
# 集合1 < 集合2 - 判断集合1是否是集合2的真子集
# 集合1 >= 集合2 - 判断集合2是否是集合1的子集
# 集合1 <= 集合2 - 判断集合1是否是集合2的子集
字符串
字符串是容器型数据类型,将’’、" “、’’’ ‘’’、”"""""作为容器标志里面的每一个基本符号就是就是字符串的元素
字符串是不可变的(不支持增删改);字符串是有序的(支持下标操作)
元素:引号里面的每个基本单元就是字符串的元素,又叫字符(python中只有字符的概念没有字符对应的类型,一般直接使用长度为1的字符串来表示字符
空串
s1 = ''
s2 = ""
s3 = ''''''
s4 = """"""
print(type(s1), type(s2), type(s3), type(s4)) # <class 'str'> <class 'str'> <class 'str'> <class 'str'>
字符串是有序的
print("abc" == "cba") # False
字符
字符分为普通字符和转义字符两种:
1)转义字符
在特定的一个或多个符号前加\让符号具有特殊功能或者特殊意义。那么这种带有\字符就是转义字符:
\n - 换行
\t - 水平制表符(相当于按一下tab键)
’ - 表示一个普通的单引号
" - 表示一个普通的双引号
\ - 表示一个普通的反斜杠
注意:任意一个转移字符的长度为1
2)普通
除了转义字符以外的字符都是普通字符,普通字符在字符串中表示这个符号本身,包括”汉字、数字、字母、符号、表情符号等
特殊的转移转义字符 - 编码字符:\u四位的16进制数 - 表示16进制数的编码值对应的字符
字符编码
1)什么是字符编码
计算机在存储数据的时候只能存数字(存的数字二进制补码),为了能够让计算机存储字符,
我们给每一个字符都对应一个固定的数字,那么每个字符对应的固定的数字就是这个字符的编码值
2)字符编码表 - 记录字符和数字之间一一对应关系的表就是字符编码表
常见的字符编码表有两种:ASCII码表、Unicode编码表(python采用的是Unicode编码表)
a.ASCII码表
ASCII码表总共有128个字符对一个的编码,主要包含的是美国的通用符号,其中包括:
应为标点符号、数字符号、字母字符以及其他的一些符号
ASCII码表中,数字字符在字母的前面,大写字母在小写字母的前面,大写字母和小写字母之间有间隔
b.Unicode编码表
Unicode编码表包含ASCII码表
中文编码范围:4e00 - 9fa5
字符串的操作
1.获取字符
字符串获取字符和列表获取元素的方法一样
# 1)获取字符
sentence = "死亡如风,常伴吾身!"
print(sentence[3], sentence[-7]) # 风 风
# 2)字符串切片
sentence2 = "good good study,day day up"
print(sentence2[1:8]) # ood goo
# 3)遍历
for i in sentence2:
print(i)
for index, item in enumerate(sentence2):
print(index, item)
for i in range(len(sentence2)):
print(i, sentence2[i])
2.加法和乘法
print("abc" + "123") # abc123
print("you see see you!" + "one day day de!") # you see see you!one day day de!
print("abc"*3) # abcabcabc
3.比较大小
两个字符串比较大小:比较第一对不惜那个等的字符编码值的大小
print("abc" > "XYZ") # True
char
“a” <= char <= “z” - 小写字母
“A” <= char <= “Z” - 大写字母
“a” <= char <= “z” or “A” <= char <= “Z” - 字母
“0” <= char <= “9” - 数字
“\u4e00” <= char <= “\u9fa5” - 中文字符