在使用正则替换时,有时候需要将匹配的结果做对应处理,便可以使用自定义替换方法。
re.sub的用法为:
re.sub('匹配表达式',替换字符或替换函数,替换次数,其他参数)
例如,加入将字符串中的$开头的变量替换为上下文context中对应的值,可以操作如下。
import re
context = {'a': 1, 'b': 2, 'except': 3}
text = '$a + $b = $except'
def repl_func(matched):
if matched:
text = matched.group(1)
return str(context.get(text))
result = re.sub('\$(\w+)', repl_func, text)
print(result)
打印结果为:
1 + 2 = 3
下面是一个用于替换字符串,字典,列表,元祖类型中特定变量的方法。
import re
import json
def parser(origin, *args, delimiter="$", **kwargs): # 支持修改delimiter定界符
patten = r'\{}(?P<var>.+?)'.format(delimiter)
def repl_func(matched): # 自定义re.sub使用的替换方法
var = matched.group('var')
if var.isdigit(): # 如果是数字, 则从args中替换
index = int(var) - 1
if index < len(args):
return args[index]
else:
return "{}{}".format(delimiter, var) # 无替换参数则返回原值
else:
return kwargs.get(var, None) or "{}{}".format(delimiter, var) # 返回kwargs参数中值 or 原值
if isinstance(origin, str):
return re.sub(patten, repl_func, origin, re.M)
elif isinstance(origin, (dict, list)): # 使用json.dumps转为字符串, 替换,然后重新转为dict/list
return json.loads(re.sub(patten, repl_func, json.dumps(origin), re.M))
else:
if isinstance(origin, tuple):
return tuple(json.loads(re.sub(patten, repl_func, json.dumps(origin), re.M))) # 转换后重新转为tuple
if __name__ == '__main__':
s = ['性别: $2 年龄: $3\n$a', '$1', {"say": "$a"}]
print(parser(s, 'kevin', 'male', '20', a="hello, world!"))