概述
在Python中,字符串是定义为字符的有序集合,即我们可以像使用列表一样在字符串中自由翱翔-使用索引和切片操作字符串,比如通过指定的索引获取字符串某个位置的字符。
# 示例字符串
s = 'python str with slice'
索引的简单使用
在Python中字符串的索引可以是正数,正数即从左向右索引,索引从0开始,也可以是负数,负数即从右向左开始索引,索引从-1开始。如果超出了正负的索引范围,则会抛出异常
# 即从左边获取第一个偏移位置的字符
print(s[0])
# 即从左边获取第一个偏移位置的字符
print(s[-1])
# 即从左边获取第三个偏移位置的字符
print(s[4])
try:
# 尝试不存在于s的索引
print(s[1000])
except:
print('IndexError: string index out of range')
示例结果:
p
e
o
IndexError: string index out of range
切片的简单使用
切片,顾名思义即将一个有序序列切出一片,即从一个完整的字符串中取出一部分字符串,而怎么取? 这就取决于我们怎么利用索引进行切片了:
s = 'python str with slice'
# 获取从偏移为1,直到但不包括偏移为6的元素
print(s[0:6])
# 获取从偏移为7,直到但不包括偏移为10的元素
print(s[7:10])
# 获取从偏移为11,直到但不包括偏移为-6的元素
print(s[11:-6])
示例结果:
python
str
with
通过上面的切片效果,我们可以看到切片的基本使用,即通过两个用冒号隔开的索引完成“切片”操作,并返回新的字符串(记住,就算只“切”了一个字符,在Python中单个字符也是作为字符串的存在,这和类C中是不一样的)
更酷一点的切片
# 示例字符串
s = 'python str with slice'
# 获取偏移为16直到末尾的元素,等价于获取偏移为16直到但不包括偏移为序列长度的元素
print(s[16:])
# 获取从偏移为0,直到但不包含偏移为11的元素
print(s[:11])
# 获取偏移为-5直到末尾的元素,等价于获取偏移为16直到但不包括偏移为序列长度的元素
print(s[-5:])
# 获取从偏移为0,直到但不包含偏移为-11的元素
print(s[:-11])
# 获取从偏移为0,知道末尾的元素,实现了有效的底层s复制。
print(s[:])
示例效果:
slice
python str
slice
python str
python str with slice
顶层赋值小技巧
对于最后一个示例,即s[:]
,对于可变对象的复制是很有用处的,比如列表,当我们想要复制列表时:
ls1 = [1, 2, 3, 4, 5]
ls2 = ls1
ls2[0] = 100
print(ls1)
示例结果
[100, 2, 3, 4, 5]
我们看到运行结果,对于可变对象的复制,通过ls2 = ls1
其实类似C中将指向ls1的指针赋值给ls2,即还是指向了同一内存空间,所以在操作ls2时,ls1也同时发生了变化,本质就是在操作同一内存空间
而通过s[:]
可以实现新的内存分配,完整的赋值一份新的数据,使ls2指向新的内存空间:
ls1 = [1, 2, 3, 4, 5]
ls2 = ls1[:]
ls2[0] = 100
print(ls1)
示例结果
[1, 2, 3, 4, 5]
更更酷一点的切片
在切片的使用中还可以再添加一个可选择的索引参数:
s = 'abcdefghijk'
# 偏移从0开始,直到不含偏移量为11,每隔2个元素索引一次构成最终的新字符串
print(s[:11:2])
# 偏移从11开始,直到不含偏移量为0,每隔2个元素索引一次构成最终的新字符串
print(s[11::-2])
# 即从右向左,每隔一个元素索引一次,效果即翻转字符串
print(s[::-1])
示例结果:
acegik
kigeca
字符串翻转小技巧
当我们想要翻转一个字符串时会怎么做? 用循环? reverse? 栈? reduce? 使用s[::-1]
即可完成字符串翻转的操作。
总结
切片在Python中的使用实在太频繁,且用起来非常顺手,所以不得不提出来说说,比如在读取文本中的行时,需要清除每行的换行符直接line[:-1]
,还有比如在leetcode 有一题:
leetcode题例
实现 strStr() 函数。
给定一个 haystack 字符串和一个 needle 字符串,在 haystack 字符串中找出 needle 字符串出现的第一个位置 (从0开始)。如果不存在,则返回 -1。
示例 1:
输入: haystack = "hello", needle = "ll"
输出: 2
示例 2:
输入: haystack = "aaaaa", needle = "bba"
输出: -1
说明:
当 needle 是空字符串时,我们应当返回什么值呢?这是一个在面试中很好的问题。
对于本题而言,当 needle 是空字符串时我们应当返回 0 。这与C语言的 strstr() 以及 Java的 indexOf() 定义相符。
利用切片解题:
class Solution:
def strStr(self, haystack: str, needle: str) -> int:
if needle:
length_h = len(haystack)
length_n = len(needle)
for i in range(length_h):
if haystack[i:i+length_n] == needle:
return i
return -1
else:
return 0