在 Python 中,字符串属于不可变对象,不支持原地修改,如果需要修改其中的值,
智能创建新的字符串对象。但是,经常我们确实需要原地修改字符串,可以使用 io.StringIO 对象
# 首先导入模块
import io
# 定义一个变量
s = "hello,world"
sio = io.StringIO(s)
print(sio) # <_io.StringIO object at 0x00000189978F4678> 打印的结果
print(sio.getvalue()) # 打印的结果是:hello,world
sio.seek(5) # 第五个后开始替换
sio.write("冰冰")
print(sio.getvalue()) # hello冰冰orld
注意点:
1 字符串的本质是:字符序列。Python 的字符串是不可变的,不支持单字符类型,单字符也是作为一个字符串使用的。
2 Python3 直接支持 Unicode,可以表示世界上任何书面语言的字符。Python3 的字符 默认就是 16 位 Unicode 编码,ASCII 码是 Unicode 编码的子集。
使用内置函数 ord()可以把字符转换成对应的 Unicode 码; 使用内置函数 chr()可以把十进制数字转换成对应的字符。
3 转义字符
4 字符串复制
>>> a = 'Sxt'*3 >>> a 'SxtSxtSxt
5 不换行打印
print("sxt",end=' ')
print("sxt",end='##')
print("sxt")
运行结果: sxt sxt##sxt
6 从控制台读取字符串 使用 input()从控制台读取键盘输入的内容
>>> myname = input("请输入名字:")
请输入名字:小马哥
>>> myname '小马哥'
7 str()实现数字转型字符串
str(5.20) ==> ‘5.20’
str(3.14e2)==>’314.0’
str(True) ==> ‘True
8 使用[]提取字符
正向搜索: 最左侧第一个字符,偏移量是 0,第二个偏移量是 1,以此类推。直到 len(str)-1 为止。
反向搜索: 最右侧第一个字符,偏移量是-1,倒数第二个偏移量是-2,以此类推,直到-len(str) 为止
>>> a = 'abcdefghijklmnopqrstuvwxyz'
>>> a 'abcdefghijklmnopqrstuvwxyz'
>>> a[0] 'a'
>>> a[3] 'd'
>>> a[26-1] 'z'
>>> a[-1]
z'
>>> a[-26] 'a'
>>> a[-30]
Traceback (most recent call last):
File "<pyshell#91>", line 1, in <module>
a[-30] IndexError: string index out of range
9 replace()实现字符串替换
字符串不可改变。但是,我们确实有时候需要替换某些字符。这时,只能通过创建新的字符 串来实现。
>>> a = 'abcdefghijklmnopqrstuvwxyz'
>>> a 'abcdefghijklmnopqrstuvwxyz'
>>> a = a.replace('c','高')
'ab 高 defghijklmnopqrstuvwxyz'
10 字符串切片 slice 操作
切片 slice 操作可以让我们快速的提取子字符串。标准格式为: [起始偏移量 start:终止偏移量 end:步长 step]
11 split()分割和 join()合并
split()可以基于指定分隔符将字符串分隔成多个子字符串(存储到列表中)。如果不指定分隔 符,则默认使用空白字符(换行符/空格/制表符)
>>> a = "to be or not to be"
>>> a.split()
['to', 'be', 'or', 'not', 'to', 'be']
>>> a.split('be')
['to ', ' or not to ', '']
join()的作用和 split()作用刚好相反,用于将一系列子字符串连接起来
>>> a = ['sxt','sxt100','sxt200']
>>> '*'.join(a)
'sxt*sxt100*sxt200'
使用字符串拼接符+,会生成新的字符串对象,因此不推荐使用+来拼接字符串。推荐 使用 join 函数,因为 join 函数在拼接字符串之前会计算所有字符串的长度,然后逐一拷贝, 仅新建一次对象
12 字符串驻留机制和字符串比较
字符串驻留:仅保存一份相同且不可变字符串的方法,不同的值被存放在字符串驻留池中。 Python 支持字符串驻留机制,对于符合标识符规则的字符串(仅包含下划线(_)、字母 和数字)会启用字符串驻留机制驻留机制。
>>> a = "abd_33"
>>> b = "abd_33"
>>> a is b True
>>> c = "dd#"
>>> d = "dd#"
>>> c is d False
>>> str1 = "aa"
>>> str2 = "bb"
>>> str1+str2 is "aabb"
False
>>> str1+str2 == "aabb"
True
13 字符串比较和同一性
我们可以直接使用==,!=对字符串进行比较,是否含有相同的字符。 我们使用 is / not is,判断两个
对象是否同一个对象。比较的是对象的地址,即 id(obj1)是 否和 id(obj2)相等。
14 成员操作符
in /not in 关键字,判断某个字符(子字符串)是否存在于字符串中。
15 字符串常用方法汇总
我们以一段文本作为测试:
a='''我是小马哥,今年 18 岁了,我在北京尚学堂科技上班。我的儿子叫高洛希,他 6 岁了。我 是一个编程教育的普及者,希望影响 6000 万学习编程的中国人。我儿子现在也开始学习编 程,希望他 18 岁的时候可以超过我''
16 去除首尾信息
我们可以通过 strip()去除字符串首尾指定信息。通过 lstrip()去除字符串左边指定信息, rstrip()去除字符串右边指定信息
17 大小写转换
18 格式排版
center()、ljust()、rjust()这三个函数用于对字符串实现排版。示例如下:
>>> a="SXT"
>>> a.center(10,"*")
'***SXT****'
>>> a.center(10)
' SXT '
>>> a.ljust(10,"*")
'SXT*******'
19 其他方法
- isalnum() 是否为字母或数字
- isalpha() 检测字符串是否只由字母组成(含汉字)。
- isdigit() 检测字符串是否只由数字组成。
- isspace() 检测是否为空白符
- isupper() 是否为大写字母
- islower() 是否为小写字母
>>> "sxt100".isalnum()
True
>>> "sxt 尚学堂".isalpha()
True
>>> "234.3".isdigit()
False
>>> "23423".isdigit()
True
>>> "aB".isupper()
False
>>> "A".isupper()
True
>>> "\t\n".isspace()
True
20 字符串的格式化
基本语法是通过 {} 和 : 来代替以前的 % 。 format 函数可以接受不限个参数,位置可以不按顺序