python基础–字符串

字符串

概念及特点

包含那零个或者多个字符的有序不可变序列

特点

有序性:添加顺序和显示顺序一致,添加字符的适合,会设置编号,编号是从0 开始的,被称为索引、下标、角标【有索引、有切片】

不可变性:在内存地址不变的情况下,字符串的内容不允许发生变化

如果字符串内容发生变化,内存地址一定发生变化

定义字符串

1.使用引号【一对单引号,一对双引号,一对三引号[预编译文本保持内容的原样输出]】

2.使用str()构造

索引和切片

索引

通过索引获取对于的字符

操作:字符串[索引]

索引分为两种:正向,负向

正向索引
	从左向右数
	从0开始 到长度-1结束
负向索引
	从右向左数
	从-1开始 到-长度结束
s = '床前明月光,疑是地上霜。'
print(s,len(s)) # 床前明月光,疑是地上霜。 12
print(s[0]) # 床
print(s[9]) # 上
print(s[len(s)-1]) # 。

切片

操作:字符串[起始索引:结束索引:步长] 特点: 不包含结束位置

切片时根据索引来定位范围,获取范围中的子串
根据步长的正负性,分两种:
	正向切片 :从左向右获取,步长为正
		要求: 起始索引定位的字符要在结束索引定位的字符的左边(起始小于结束)
	负向切片 :从右向左获取,步长为负
		要求:起始索引定位的字符在结束索引定位的字符的右边
有些内容可以省略
	1.省略:步长-----字符串[起始索引:结束索引]:表示步长为1,从左向右逐步获取
	2.省略起始索引-----字符串[:结束索引:步长]
		步长为正 :从左向右获取,表示从最左边开始
		步长为负 :从右向左获取,表示从最右边开始
	3.省略结束索引----字符串[起始索引::步长]
		步长为正 :从左向右获取,表示到最右边结束
		步长为负 :从右向左获取,表示到最左边结束
	4.同时省略多个

遍历字符串

  • 直接遍历字符串
s = 'GJHUHBhjhyhu%^%*(&9g'
# 获取s中大写的英文字母的个数
c = 0
for i in s:
    if 'A' <= i <='Z':
        c += 1
print(c)
# 获取26个大写英文字母
print(string.ascii_uppercase) # ABCDEFGHIJKLMNOPQRSTUVWXYZ
# 获取26个小写英文字母
print(string.ascii_lowercase) # abcdefghijklmnopqrstuvwxyz
#  获取所有大小写字母
print(string.ascii_letters) # abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ
# 获取所有数字
print(string.digits) # 0123456789
# 使用其他方法判断是否是大写
c = 0
for i in s:
    # string.ascii_uppercase 获取26个大写英文字母
    if i in string.ascii_uppercase:
        c += 1
print(c)
  • 遍历索引【应用场景:条件或者结论中和索引相关】
s = 'GJHUHBhjhyhu%^%*(&9g'
# 获取大写英文字母对应的索引
for i in range(0,len(s)):
    # 获取索引对应的字母,判断是否是大写
    if s[i] in string.ascii_uppercase:
        print(i,end=' ') # 0 1 2 3 4 5
# 获取索引能被3或者4整除对应的字符
for j in range(len(s)):
    if j%3 == 0 or j%4 == 0 :
        print(s[j],end=' ') # G U H h h y % * ( 9
  • 枚举遍历【最好用】enumerate()

可以同时获取索引和对应 的字符

s = 'GJHUHBhjhyhu%^%*(&9g'
for i in enumerate(s):
    print(i) # i 是一个元组 ,第一个内容是索引,第二个是索引对应的字符
s = 'GJHUHBhjhyhu%^%*(&9g'
# 相当于拆包,pos代表索引,ele代表字符
for pos,ele in enumerate(s):
    print(pos,ele)
s = 'GJHUHBhjhyhu%^%*(&9g'
for pos,ele in enumerate(s):
    # 直接判断字符
    if ele in string.ascii_uppercase:
        # 直接输出索引
        print(pos)

转义字符串

\对一些符号进行转义

\n---newline 换行操作 将光标定位到下一行的值
\t---tab 横向制表符
\r---return  如果\r之前有内容,先把内容删除再写后面的内容
\v  -- 纵向制表符 
\f  -- 翻页 
\u  -- unicode编码   win系统   c:\user
\' -- '
\" -- "
\\ -- \

字符串的获取

# 获取子串再字符串中第一次出现的位置
# 1.字符串对象.find(子串,起始索引,结束索引)
s = 'abcabcabc'
print(s.find('abc')) # 0
print(s.find('abc',1,)) # 3
print(s.find('abc',1,6)) # 3
#2.字符串对象.index(子串,起始索引,结束索引)
print(s.index('abc')) # 0
print(s.index('abc',1)) # 3
# 获取子串再字符串中最后一次出现的位置
# 1.字符串对象.rfind(字符串,起始索引,结束索引)
print(s.rfind('abc')) # 6
# 获取某个子串再字符串中出现的次数
print(s.count('abc')) # 3
s1 = 'ababababababab'
# 注意: 记得不是重叠的
print(s1.count('abab')) # 3

字符串的判断操作

判断是否是纯数字组成  .isdigit()
s1 = 'dfghj123'
s2 = '23456789'
print(s1.isdigit()) # False
print(s2.isdigit()) # True
判断是否是纯字母组成  .isalpha()  注意: 字母不仅指英文字母
s1 = '你好'
s2 = 'sadsc1232'
print(s1.isalpha()) # True
print(s2.isalpha()) # False
判断是否是纯数字或者纯字母  .isalnum() 注意;字母不仅指英文字母
# 结果为Ture 三种情况:纯数字、纯字母、数字+字母
s1 = '123'
s2 = 'sadsc'
s3 = 'wfwwfd1234'
print(s1.isalnum()) # True
print(s2.isalnum()) # True
print(s3.isalnum()) # True
判断字符串中的英文字母是否都是大写  .isupper()
s1 = '你好123abcASDJ'
s2 = '你好123ANJJ'
print(s1.isupper()) # False
print(s2.isupper()) # True(值判断英文字母,不管其他字符)
判断字符串中的英文字母是否都是小写   .islower()
s1 = '你好123abcASDJ'
s2 = '你好123dfgh'
print(s1.islower()) # False
print(s2.islower()) # True
# 判断内字符串中的内容是否都来源与ASCII表  .iaascii()
print(s1.isascii()) # False
# 判断是否首字母大写其他小写  .istitle()
s1 = 'How Are You'
print(s1.istitle())  # True
# 判断是否以指定内容开头  .startswith(指定内容)
print(s1.startswith('How')) # True
#判断字符串是否以多个内容中的一个开头
s1.startswith(('ow','Ar','Y')) # True
# 判断字符串是否以指定内容结尾  .endswith(指定内容)
print(s1.endswith('ou'))  # True
# 判断字符串是否以对各内容中的其中一个结尾
print(s1.endswith(('re', 'ou'))) # True

编码和解码

# 编码方式
# gbk  汉字的编码,占2个字节
# utf-8  汉字的编码,占3个字节
#1.字符串的编码 ---字符窜对象.encode(编码方式)
s = '你好'
utf_s = s.encode('utf-8')
print(utf_s) # b'\xe4\xbd\xa0\xe5\xa5\xbd'

gbk_s = s.encode('gbk')
print(gbk_s) # b'\xc4\xe3\xba\xc3'
# 2.字符串的解码 ---字符串对象.decode(解码方式)
# 注意:用什么方式编码就用什么方式解码,否则会乱码挥着报错
print(utf_s.decode('utf-8')) # 你好
print(utf_s.decode('gbk')) # 浣犲ソ
print(gbk_s.decode('gbk')) # 你好
# 特点:对于ASCII中的符号,编码前后内容不变
# 判断字符串是否是纯英文组成
# 思路:先编码再判断
s1 = '你好abichj'
print(s1.encode('gbk').isalpha())
s2 = 'asdf'
print(s2.encode('gbk').isalpha())
# 判断字符串是否为数字或字母
# 思路:先编码再判断
print(s1.encode('gbk').isalnum())
print(s2.encode('gbk').isalnum())
# 判断是否是字母和数字
# 思路:数字或字母:纯数字、纯字母、数字和字母
s = 'ghjk1234'
print(s.isalnum() and not (s.isdigit()) and not (s.isalpha())) # True

字符串的转换

# 小写字母转化为大写  .upper()
s = 'How aRe yOu'
print(s.upper()) # HOW ARE YOU

# 大写转换为小写  .lower()
print(s.lower()) # how are you

# 大写转化为小写,小写转换为大写  .swapcase()
print(s.swapcase()) # hOW ArE YoU

# 首字母大写,其他字母小写  .capitalize()
print(s.capitalize()) # How are you

# 将每个单词的首字母大写,其他字母小写    .title()
print(s.title()) # How Are You