一.在读取excel文件、其他数据来源会遇到一些无法转换或者特殊标记的字符串等,不能直接使用。这时候需要对数据进行处理,替换为自己需要的数据进行下一步操作,如下:
替换
1.replace()
str.replace(old, new[, max])
- old -- 将被替换的子字符串。
- new -- 新字符串,用于替换old子字符串。
- max -- 可选字符串, 替换不超过 max 次
正则表达式部分知识点:
一:
1)表达式可以参考百度或者python核心编程3或者pyton基础3
2)'\'代表去掉原有的正则表达字符的含义。比如:\$ 代表 他只是个普通的 $ 字符
1.查询符合条件的数据,search会从左到右遍历所有数据找到符合要求的数据 没有符合条件的数据返回None,match只会从起始位置进行筛选不符合就返回 None
语法:search(pattern, string,flags=0)
- pattern --搜索格式
- string --搜索内容
- flags --格式
string='{"ss":"${aa}","dd":11}'
pattern='11'
pattern_2='\$\{aa\}'
调用方式:
a=re.search(pattern,string)
pring(a)
2.获取本次查询到的结果,这里只展示一种方法。关于groups()这里不做介绍。
语法:group(self, *args)
用法:a.groups()
2.替换符合条件的数据,只能对str类型的数据进行替换,查询也是一样。
语法:sub(pattern, repl, string, count=0, flags=0)
- pattern --搜索格式
- repl --需要替换的结果
- string --内容
- count --替换的数量
用法:a=re.search(pattern,string).group()
rp=re.sub(pattern,'123',string,1)
print(rp)
爱折腾的小测试