Mysql之模糊匹配查询
模糊匹配相似数据
Mysql 模糊匹配查询
MySQL提供标准的SQL模式匹配,以及一种基于像Unix实用程序,如:vi、grep和sed的扩展正则表达式模式匹配的格式
SQL 模式
SQL的模式匹配允许你使用
- “_”匹配任何单个字符,
- 而“%”匹配任意数目字符(包括零个字符)。
在MySQL中,SQL的模式缺省是忽略大小写的。
注意:在你使用SQL模式时,你不能使用=或!=;而使用LIKE或NOT LIKE比较操作符。
任意字符%
其中关于条件,SQL提供了两种匹配模式:
百分号(%):表示任意个或多个字符。可匹配任意类型和长度的字符。
SELECT * FROM character WHERE name LIKE ‘%孙%';
即匹配姓名为“孙行者”,“行者孙,“行者孙”等包含“孙”类型的数据
SELECT * FROM character WHERE name LIke '%孙%' and name like '%行%';
即匹配姓名为“孙行者”,“行者孙,“行者孙”等包含“孙”和“行”的数据
SELECT * FROM character WHERE name LIke '%孙%行%‘;
只能匹配姓名为“孙行者”等类似“…孙…行…”的数据
单个字符_
下划线(_):表示任意单个字符。匹配单个任意字符,它常用来限制表达式的字符长度语句:(可以代表一个中文字符)
SELECT * FROM character WHERE name LIKE ‘_三_';
即匹配姓名为“…三…”类型的数据,前后均只有一个字符
SELECT * FROM character WHERE name LIKE ‘_三';
即匹配姓名类似“…三”类型的数据,前面有且只有一个字符
正则模式
正则表达式作用是匹配文本,将一个模式(正则表达式)与一个文本穿进行比较。
MySQL用where子句对正则表达式提供了初步的支持,允许你指定用正则表达式过滤SELECT检索出的数据。
MySQL正则表达式仅仅使SQL语言的一个子集,可以匹配基本的字符、字符串
匹配
包含 直接写字符串
select * from wp_posts where post_name REGEXP 'hello';
可以检索出列post_name中所有包含hello的行
任意字符.
select * from wp_posts where post_name REGEXP '.og';
. 匹配除\n之外的任意单个字符
- 注:.是正则表达式中的一个特殊字符。它表示匹配一个字符,因此bog,cog,dog等等都能匹配。
注意:关于大小写的区分:MySQL中正则表达式匹配(从版本3.23.4后)不区分大小写。
区分大小写binary
如果要区分大小写,应该使用BINARY关键字,例如:
where post_name REGEXP BINARY 'Hello .000'
binary
adj.
由两部分组成的,二重的;二进制的(用 0 和 1 记数)
n.
二进制,二进制记数法;由两部分组成的事物,一双,双体
- 注意了 这个mysql 8.0.32,默认字符报错
select * from wp_posts where post_name REGEXP BINARY 'Hello'
> 3995 - Character set 'utf8mb4_0900_ai_ci' cannot be used in conjunction with 'binary' in call to regexp_like.
> 时间: 0s
依X开头^
^匹配字符串开始位置,如查询所有姓王的人名
select name from 表名 where name REGEXP '^王';
依X结尾$
$匹配字符串结束位置,如查询所有姓名末尾是“明”的人名
select name from 表名 where name REGEXP '明$';
进行OR匹配 |
为搜索两个串之一(或者这个串,或者为另外一个串),使用|。
| 作为OR操作符,表示匹配其中之一。可以给出两个以上的OR条件。
select * from products where pro_id REGEXP '1000|2000';
这样就1000和2000都能匹配并返回,当然,使用多个|就可以匹配多个串
范围的单一字符 []
[ ]匹配任何单一字符,是另一种形式的OR语句,可缩写的OR语句
例如,匹配范围:[0123456789]可以匹配0到9,[1-4] [4-9] 也是合法的范围。
此外,范围不一定只是数值的,[a-z]匹配任意字母字符。
例如,查询出w/z/s开头的人的人名
SELECT prod_name FROM products WHERE prod_name REGEXP '^[wzs]';
取反 [^…]
[^…]匹配不包含在[ ]的字符,如查询出chenmin之外的人名
SELECT prod_name FROM products WHERE prod_name REGEXP '[^chenmin]';
^的双重用途:在集合中(用[ ]定义),它用来否定该集合。否则,用来指串的开始
特殊字符匹配
匹配特殊字符使用\进行转义
\为前导。即转义,正则表达式内具有特殊意义的所有字符都必须以这种方式转义。
(1)\- 表示查找-
(2)\. 表示查找.
(3)\f 表示换页
(4)\n 表示换行
(5)\r 表示回车
(6)\t 表示制表
(7)\v 表示纵向制表
4 ab-cd
-- 一个转义符,2个,3个转义符 都可以查出来
select * from wp_posts where post_name REGEXP '\\\-';
匹配字符类
(1
)[:alnum:] 任意字母和数字(同[a-zA-Z0-9
])
(2
)[:alpha:] 任意字符(同[a-zA-A])
(3
)[:blank:] 空格和制表符(同[\t])
(4
)[:digit:] 任意数字(同[0
-9
])
(5
)[:lower:] 任意小写字母(同[a-z])
(6
)[:upper:] 任意大写字母(同[A-Z])
(7
)[:space:] 包括空格在内的任意空白字符(同 [\f\n\t\r\v])
(8
)[:cntrl:] ASCII控制字符(ASCII 0
到31
和127
)
(9
)[:graph:] 与["print:]相同,但不包括空格
(10
)[:print:] 任意可打印字符
(11
)[:punct:] 既不在 [:alnum:] 又不在 [:cntrl:] 中的任意字符
(12
)[:xdigit:] 任意十六进制数字(同 [a-fA-F0-9
])
匹配多个示例,关于重复元字符
元字符 说明
* 0个或多个匹配
+ 1个或多个匹配(等于 {1, })
? 0个或1个匹配(等于 {0, 1})
{n} 指定数目的匹配
{n, } 不少于指定数目的匹配
{n ,m} 匹配数目的范围(m不超过255)
select prod_name from products where prod_name REGEXP '[[:DIGIT:]]{4}';
- 如前所述,[:digit:]匹配任意数字,因而它为数字的一个几何。
- [[:digit:]]{4}匹配连在一起的任意4位数字,当然,上面的例子也可以这样写
REGEXP '[0-9][0-9][0-9][0-9]'
定位符
^ 文本的开始
$ 文本的末尾
[[:<:>
[[:>:]] 词的结尾
in查询
注:like匹配整个串,而REGEXP匹配子串。
in查询
- 叫in查询不是很合理,更合理的说法是:in其实和=类似,
- 区别在于:=后面是一个值。
- in后面可以是多个值。
select * from role where name in("唐三");
即匹配姓名为“唐三”一行数据;
select * from role where name in("唐三","唐三藏");
即匹配姓名为“唐三”,“唐三藏”一行数据;
select * from role where name in("唐三","%行者%")
只匹配姓名为“唐三”一行数据;即in查询不支持模糊查询
select * from role where name in("%行者%")
-- 如果库里的名字叫做:%行者%,即可匹配出来
无匹配结果
like contact模糊查询
CONCAT(str1,str2,…) 函数返回结果为连接参数产生的字符串。
select * from role where name like contact("%","三","%");
即匹配姓名为“唐三”,“唐三藏”等类型的数据数据;
like contact模糊查询强大的地方在于可以对传进来的参数进行某查询,比如经前端提交上的数据,赋值给参数name,则可以
select * from table where name like contact("%",${name},"%")