一:匹配字符串

使用re模块,首先需要导入re模块

import re

匹配字符串这个模块我就介绍几三个方法,
match()函数 search()函数 findall()函数。接下来我分别来介绍和示例

1:match()函数

概括:match()方法用于从字符串开始处进行匹配,如果在开始的位置匹配成功则返回match对象,如活匹配失败则返回None
语法:re.match(pattern,string,[flags])
参数说明:

  • pattern 表示模式字符串,由要匹配的正则表达式转化而来。
  • string 表示要匹配的字符串。
  • flags 可选参数,表示标志位,用于控制匹配方式,如是否区分字母大小。常用的标志如下图所示。

标志

说明

A或者ASCLL

对于\w\W\b\B\d\D\s和\S只进行ASCLL匹配

I或者IGNORECASE

执行不区分字母大小的匹配

M或者MULTILINE

将^和$用于包括整个字符串的开始和结束的没一行

S或者DOTALL

使用(.)字符串匹配所有字符,包括换行符

X或者VERBOSE

忽略模式字符串中的未转义的空格和注释

例子:匹配字符串是否已"mr_"开头的,不区分大小写

pattern = r'mr_\w+'  # 模式字符串
string = 'MR_SHOP mr_shop'  #要匹配的字符串
match = re.match(pattern,string,re.I)   # 匹配字符串不区分大小
print match
string1 = '项目名称MR_SHOP mr_shop'
match1 = re.match(pattern,string,re.I)   # 匹配字符串不区分大小
print match1
# <_sre.SRE_Match object at 0x0000000002BDA510>
# <_sre.SRE_Match object at 0x00000000030A36B0>

2:search()函数

概括:search()方法用于搜索整个字符串中搜索第一个匹配的值,如果匹配成功则返回macth对象,否则返回None
语法:re.search(pattern,string,[flags])
参数说明:

  • pattern 表示模式字符串,由要匹配的正则表达式转化而来。
  • string 表示要匹配的字符串。
  • flags 可选参数,表示标志位,用于控制匹配方式,如是否区分字母大小。常用的标志和match()模块是一个表。

代码示例:

pattern = r'mr_\w+'  # 模式字符串
string = 'MR_SHOP mr_shop'  #要匹配的字符串
match = re.search(pattern,string,re.I)   # 匹配字符串不区分大小
print match
string1 = '项目名称MR_SHOP mr_shop'
match1 = re.search(pattern,string,re.I)   # 匹配字符串不区分大小
print match1
<_sre.SRE_Match object at 0x0000000002DAA510>
<_sre.SRE_Match object at 0x00000000032F36B0>

和上面的match()各人感觉没什么区别

3:findall()函数

概括:使用findall()方法用于在整个字符串中搜索所有符合正则表达式的字符串,并且以列表的形式返回,如果匹配成功则返回包含匹配结构的列表否则返回空列表。本人在开发时用的这个函数是比较多的。
语法:re.findall(pattern,string,[flags])
参数说明:

  • pattern 表示模式字符串,由要匹配的正则表达式转化而来。
  • string 表示要匹配的字符串。
  • flags 可选参数,表示标志位,用于控制匹配方式,如是否区分字母大小。常用的标志和match()模块是一个表。
    直接上代码吧:
pattern = r'mr_\w+'  # 模式字符串
string = 'MR_SHOP mr_shop'  #要匹配的字符串
match = re.findall(pattern,string,re.I)   # 匹配字符串不区分大小
print match
string1 = '项目名称MR_SHOP mr_shop'
match1 = re.findall(pattern,string)   # 匹配字符串区分大小
print match1
# ['MR_SHOP', 'mr_shop']
# ['MR_SHOP', 'mr_shop']

在来一个简单的例子。

pattern = r'[1-9]{1,3}(\.[0-9]{1,3}){3}'  # 模式字符串
str1 = '127.0.0.1 192.168.1.66'
match = re.findall(pattern,str1)
print match
# ['.1', '.66']
pattern = r'([1-9]{1,3}(\.[0-9]{1,3}){3})'  # 模式字符串
str1 = '127.0.0.1 192.168.1.66'
match = re.findall(pattern,str1)
for i in match:
	print i[0]
# 127.0.0.1
# 192.168.1.66

这里就可以直接拿到IP地址了。