一、简介

在MySQL中,查询语句SELECT应该是使用频率最高的语句了,在一般的应用之中,数据库的读写比例大概能达到10:1。

由于其子句较多,且功能繁杂,所以语法相对较为复杂。

二、SELECT语法

SELECT
[ALL | DISTINCT | DISTINCTROW ]
[HIGH_PRIORITY]
[STRAIGHT_JOIN]
[SQL_SMALL_RESULT] [SQL_BIG_RESULT] [SQL_BUFFER_RESULT]
SQL_NO_CACHE [SQL_CALC_FOUND_ROWS]
select_expr [, select_expr ...]
[FROM table_references
[PARTITION partition_list]
[WHERE where_condition]
[GROUP BY {col_name | expr | position}, ... [WITH ROLLUP]]
[HAVING where_condition]
[WINDOW window_name AS (window_spec)
[, window_name AS (window_spec)] ...]
[ORDER BY {col_name | expr | position}
[ASC | DESC], ... [WITH ROLLUP]]
[LIMIT {[offset,] row_count | row_count OFFSET offset}]
[INTO OUTFILE 'file_name'
[CHARACTER SET charset_name]
export_options
| INTO DUMPFILE 'file_name'
| INTO var_name [, var_name]]
[FOR {UPDATE | SHARE} [OF tbl_name [, tbl_name] ...] [NOWAIT | SKIP LOCKED]
| LOCK IN SHARE MODE]]

常用基础关键词

select_expr [, select_expr ...]

每一条select_expr语句代表你想要从表中取出的字段值,这是必备的关键词,也就是你至少要写一条select_expr,如果要写多条select_expr的话,应该用,进行分割。

并且select_expr可以使用*通配符来进行匹配,例如以下语句将会取出表中的所有字段。

SELECT * FROM tb_name;

FROM table_references

table_references指的是你想要提取的一张或多张表的表名。

SELECT col_name1, col_name2 FROM tb_name;

如果对table_references指定了多个表名,那么意味着你在使用JOIN连接。

[PARTITION partition_list]

在FROM语句中,可以使用PARTITION子句来指定查询的分区表。指定之后,查询将只从列出的分区表中查询数据。

[WHERE where_condition]

FROM语句中,还有WHERE子句,可以指定查找符合where_condition表达式的数据。如果没有指定WHERE子句,那么将会把表中所有行的数据查询出来。

例子:

SELECT col_name1 FROM tb_name WHERE col_name2=1;

在WHERE的where_condition表达式中,可以使用任何MySQL支持的函数和运算符,聚合算法除外。

[GROUP BY {col_name | expr | position}, ... [WITH ROLLUP]]

FROM中还有一个GROUP BY语句,用以分组。

[ORDER BY {col_name | expr | position} [ASC | DESC], ... [WITH ROLLUP]]

排序子句,用于将查询到的数据按一定顺序进行排列,ORDER BY可以通过列名或者列的别名来进行排序。例子如下所示:

SELECT college, region, seed FROM tournament

ORDER BY region, seed;

SELECT college, region AS r, seed AS s FROM tournament

ORDER BY r, s;

如果需要改变排序方式为降序的话,那么可以在ORDER BY语句后加上DESC(descending),默认的排序方式是ASC(ascending)。

SELECT college, region, seed FROM tournament

ORDER BY region, seed DESC;

[LIMIT {[offset,] row_count | row_count OFFSET offset}]

LIMIT子句主要用来限制查询结果的数量。LIMIT一般需要一个或两个非负整数参数来决定限制的范围和位置。

当只有一个参数时,参数表示的是从查询结果的第一行开始返回的行数。例:

SELECT * FROM tb_name LIMIT 5; # 返回前五行

当传入两个参数时,第一个参数表示相对于结果第一行的偏移行数,第二个参数表示的是返回的行数。例:

SELECT * FROM tb_name LIMIT 5,10; # 返回第6-15行

如果你希望从某一行开始,返回这一行之后所有的结果,那么你可以把第二个参数设置的非常大。例:

SELECT * FROM tbl LIMIT 95,18446744073709551615; #返回从96行开始所有的结果

修饰符

跟在SELECT后有许多可以影响查询结果的修饰符可以使用,例如HIGH_PRIORITY、STRAIGHT_JOIN等。

ALL、DISTINCT

这个修饰符指的是是否返回重复的查询结果。

ALL(默认)指的是,只要符合查询结果,就算有数据是重复的也全部返回。

DISTINCT指的是,如果查询结果中有重复的行,那么那些重复的数据将会被删除。DISTINCTROW是DISTINCT的同义词。

HIGH_PRIORITY

HIGH_PRIORITY能让SELECT语句拥有比UPDATE更高的优先级。

STARTGHT_JOIN

STARTGHT_JOIN会强制让优化器按照FROM字句中列出的顺序进行连接。

SQL_SMALL_RESULT或SQL_BIG_RESULT

这个修饰符可以与GROUP BY或者DISTINCT一起使用,来告诉优化器搜索的结果非常多还是非常少。如果使用SQL_BIG_RESULT,那么MySQL会直接使用基于磁盘的临时表来存储搜索结果,如果使用的是SQL_SMALL_RESULT,那么MySQL会使用基于内存的临时表来存储搜索结果。

注:需要注意的是,SELECT子句的顺序都需要按照语法中给定的顺序来进行使用,INTO子句例外,它可以跟在select_expr列表后方。

三、聚合分组

聚合函数

在MySQL中有一些对值的集合进行操作的函数可以使用,这被称为聚合函数,以下是常见的聚合函数:

聚合函数

描述

AVG()

求平均值函数

COUNT()

返回参数的行数

COUNT(DISTINCT)

返回去重之后的行数

GROUP_CONCAT()

返回所有值拼接成的字符串

MAX()

求最大值

MIN()

求最小值

STD()

求标准差

SUM()

求和函数

除非专门说明,否则这些聚合函数都会忽略列表中的NULL。

AVG([DISTINCT] expr) [over_clause]

返回expr的平均值,可以使用DISTINCT将结果先去重后再求平均值。例子:

mysql> SELECT student_name, AVG(test_score)

FROM student

GROUP BY student_name;

COUNT(expr) [over_clause]

COUNT会返回expr中值不为NULL的行数。但是COUNT(*)有一点特殊,其返回的是提取出来的总行数,不管其是否为NULL。

mysql> SELECT student.student_name,COUNT(*)

FROM student,course

WHERE student.student_id=course.student_id

GROUP BY student_name;

GROUP_CONCAT(expr)

这个聚合函数会将expr中所有非NULL值拼接成一个字符串并返回。

mysql> SELECT student_name,

GROUP_CONCAT(test_score)

FROM student

GROUP BY student_name;

分组查询(GROUP BY)

GROUP BY是SELECT语句中的子句,其可以指定字段,将这个字段中值相同的行分为一组,所以这个字段基本上都与聚合函数一起使用 ,能够根据不同条件统计数据。例如:

mysql> SELECT class, COUNT(name)

FROM student

GROUP BY class;

此例子会将学生通过班级分组,并统计出每个班级的人数。

需要注意的是,在使用了GROUP BY分组之后,那么前面SELECT查询的字段就只能使用分组的字段和聚合函数了,使用其他字段将会报错。

四、连接查询(JOIN)

在MySQL中,支持在SELECT、DELETE和UPDATE的多表中使用JOIN语法。JOIN也被称为连接表达式,而连结又主要分为内连接以及外连接。

JOIN语法可以把两张不同的表按一定的条件进行拼接。

我将会使用以下两张表作为例子进行演示:

mysql> SELECT * FROM a;
+------+-------+
| id | name |
+------+-------+
| 1 | Emma |
| 2 | Jason |
+------+-------+
2 rows in set (0.00 sec)
mysql> SELECT * FROM b;
+------+------+
| id | sex |
+------+------+
| 1 | F |
| 3 | M |
+------+------+
2 rows in set (0.00 sec)

内连接

MySQL中的JOIN,CROSS JOIN,INNER JOIN三者是等价的,都被视为内连接。在直接使用的时候,又被称为无条件内连接或笛卡尔连接,其会把两张表里的数据完全相互连接,形成M * N条数据。

例子:

mysql> SELECT * FROM a JOIN b;
+------+-------+------+------+
| id | name | id | sex |
+------+-------+------+------+
| 1 | Emma | 1 | F |
| 2 | Jason | 1 | F |
| 1 | Emma | 3 | M |
| 2 | Jason | 3 | M |
+------+-------+------+------+
4 rows in set (0.00 sec)

可以看到数据的连接是完全没有任何联系的,所以如果我们需要通过指定条件来限定连接的方式,就可以使用ON子句来设定连接条件。

这一种有条件的内连接是使用的最多的连接方式。

mysql> SELECT * FROM a JOIN b ON a.id=b.id;
+------+------+------+------+
| id | name | id | sex |
+------+------+------+------+
| 1 | Emma | 1 | F |
+------+------+------+------+
1 row in set (0.00 sec)

外连接

在内连接中,可以看到如果没有符合ON字句的匹配条件,那么不符合的这些行将会被舍去。但是有一些情况下,我们希望保留下那些没有符合匹配条件的行,这个时候就可以使用外连接。

左外连接

既然是要保留没有符合匹配条件的行,那么肯定是需要一个标准的,也就是保留哪张表的不匹配行。那么左外连接也就意味着将会以JOIN的左表为基准进行保留。

也就是说,在左外连接的过程中,左表中不符合匹配条件的行将会被保存下来,这些行的右表字段将使用NULL来填充。而右表中不匹配的字段将会被舍去。

mysql> SELECT * FROM a LEFT JOIN b ON a.id=b.id;
+------+-------+------+------+
| id | name | id | sex |
+------+-------+------+------+
| 1 | Emma | 1 | F |
| 2 | Jason | NULL | NULL |
+------+-------+------+------+
2 rows in set (0.00 sec)

右外连接

与左外连接相对应,将右表作为基准进行连接。

mysql> SELECT * FROM a RIGHT JOIN b ON a.id=b.id;
+------+------+------+------+
| id | name | id | sex |
+------+------+------+------+
| 1 | Emma | 1 | F |
| NULL | NULL | 3 | M |
+------+------+------+------+
2 rows in set (0.00 sec)

五、子查询

子查询也就是说把一个查询嵌套在另一个查询中,子查询也被称为内部查询,包含内部查询的则被称为外部查询。

外部查询需要是这些语句之一:SELECT、INSERT、UPDATE、DELETE或DO。

子查询的位置一般会在SELECT中、FROM后、WHERE中。

子查询分类

子查询一般会被分为以下几类:

标量子查询:返回单一值的标量,最简单的形式。

是指子查询返回的是单一值的标量,如一个数字或一个字符串,也是子查询中最简单的返回形式。 可以使用 = > < >= <= <> 这些操作符对子查询的标量结果进行比较,通常子查询的位置在比较式的右侧。

SELECT * FROM article WHERE uid = (SELECT uid FROM user WHERE status=1 ORDER BY uid DESC LIMIT 1)

SELECT * FROM t1 WHERE column1 = (SELECT MAX(column2) FROM t2)

SELECT * FROM article AS t WHERE 2 = (SELECT COUNT(*) FROM article WHERE article.uid = t.uid)

列子查询:返回的结果集是N行一列。

指子查询返回的结果集是 N 行一列,该结果通常来自对表的某个字段查询返回。可以使用IN、ANY、SOME和ALL操作符,不能直接使用= > < >= <= <> 这些比较标量结果的操作符。

SELECT * FROM article WHERE uid IN(SELECT uid FROM user WHERE status=1)

SELECT s1 FROM table1 WHERE s1 > ANY (SELECT s2 FROM table2)

SELECT s1 FROM table1 WHERE s1 > ALL (SELECT s2 FROM table2)

行子查询:返回的结果集是一行N列。

指子查询返回的结果集是一行N列,该子查询的结果通常是对表的某行数据进行查询而返回的结果集。

SELECT * FROM table1 WHERE (1,2) = (SELECT column1, column2 FROM table2)

SELECT * FROM article WHERE (title,content,uid) = (SELECT title,content,uid FROM blog WHERE bid=2)

表子查询:返回的结果集是N行N列。

指子查询返回的结果集是N行N列的一个表数据。

SELECT * FROM article WHERE (title,content,uid) IN (SELECT title,content,uid FROM blog)