分组函数主要用于统计,又称为聚合函数、统计函数或组函数。
常见的分组函数有:
SUM(expr) 求和AVG([DISTINCT] expr) 求平均值MAX(expr) 求最大值MIN(expr) 求最小值COUNT(DISTINCT expr,[expr...]) 计算个数
先建一个员工表用于测试,表名emp,包含姓名,部门编号,工作,工资,入职日期,奖金等信息。
CREATE TABLE `emp` ( `id` int(255) NOT NULL AUTO_INCREMENT, `ename` varchar(255) DEFAULT NULL, `job` varchar(255) DEFAULT NULL, `sal` int(11) DEFAULT NULL, `deptNo` int(11) DEFAULT NULL, `hiredate` datetime NOT NULL, `bonus` int(11) DEFAULT NULL, `orderNo` varchar(255) DEFAULT NULL, PRIMARY KEY (`id`)) ENGINE=InnoDB AUTO_INCREMENT=11 DEFAULT CHARSET=utf8
简单插入几行数据来测试
简单使用
实例:
#summysql> select sum(sal) as sum from emp;+-------+| sum |+-------+| 37700 |+-------+#avgmysql> select avg(sal) as avg from emp;+-----------+| avg |+-----------+| 3770.0000 |+-----------+#maxmysql> select max(sal) from emp;+----------+| max(sal) |+----------+| 5000 |+----------+#minmysql> select min(sal) from emp;+----------+| min(sal) |+----------+| 2000 |+----------+#countmysql> select count(sal) from emp;+------------+| count(sal) |+------------+| 10 |+------------+
搭配其他函数使用
mysql> select round(avg(sal),2) as avg from emp;+---------+| avg |+---------+| 3770.00 |+---------+
参数的类型
同时使用数值、字符型和日期参数来测试
sum和avg
mysql> select sum(sal) , SUM(ename), sum(hiredate) from emp;+----------+------------+------------------------+| sum(sal) | SUM(ename) | sum(hiredate) |+----------+------------+------------------------+| 37700 | 0 | 201785163831138.000000 |+----------+------------+------------------------+mysql> select avg(sal) , avg(ename), avg(hiredate) from emp;+-----------+------------+---------------------------+| avg(sal) | avg(ename) | avg(hiredate) |+-----------+------------+---------------------------+| 3770.0000 | 0 | 20178516383113.8010000000 |+-----------+------------+---------------------------+
结果中看出,sum和avg的参数是字符和日期时,虽然没有语法错误,但却是没有意义的。
max和min
mysql> select max(sal) , max(ename), max(hiredate) from emp;+----------+------------+---------------------+| max(sal) | max(ename) | max(hiredate) |+----------+------------+---------------------+| 5000 | Zara | 2019-06-03 18:30:39 |+----------+------------+---------------------+mysql> select min(sal) , min(ename), min(hiredate) from emp;+----------+------------+---------------------+| min(sal) | min(ename) | min(hiredate) |+----------+------------+---------------------+| 2000 | Anette | 2016-02-10 18:32:03 |+----------+------------+---------------------+
字符和日期也是可以排序的,有可比较性,所以它们作为max和min的参数也能得到有意义的结果。
count
mysql> select count(sal) , count(ename), count(hiredate) from emp;+------------+--------------+-----------------+| count(sal) | count(ename) | count(hiredate) |+------------+--------------+-----------------+| 10 | 10 | 10 |+------------+--------------+-----------------+
同样,count使用字符型和日期也是有意义的。
MySQL中函数使用的参数,不但要符合语法,并且要有意义。关于它们的参数类型,我们可以得出结论:
- sub、avg一般用于处理数值型。
- max、min、count可以处理任意值。
是否忽略null
以emp表中的bonus列来测试。
先看一下数据
其中有5行的值是null,5行是非null。
sum与avg实例:
mysql> select sum(bonus), avg(bonus), sum(bonus)/5, sum(bonus)/10 from emp;+------------+------------+--------------+---------------+| sum(bonus) | avg(bonus) | sum(bonus)/5 | sum(bonus)/10 |+------------+------------+--------------+---------------+| 1650 | 330.0000 | 330.0000 | 165.0000 |+------------+------------+--------------+---------------+
首先,和是1650,我们通过计算能够知道,它与所有bonus值非null的行的加起来是一样的。
还有,和除以5的结果与agv计算的平均值相等,也就是说平均值的计算也是在非null的行中计算的。
所以sum和avg是忽略null的。
max和min
mysql> select max(bonus), min(bonus) from emp;+------------+------------+| max(bonus) | min(bonus) |+------------+------------+| 500 | 200 |+------------+------------+
max和min明显也是是忽略null的,否则在结果中,将会出现max的值或者min的值为null的情况了。
count
mysql> select count(bonus) from emp;+--------------+| count(bonus) |+--------------+| 5 | +--------------+
结果只有5行,显然count也是忽略null的。
所以,以上组合函数都是忽略null值的。我们在使用的时候要考虑字段值是否为null的情况。
和distinct搭配使用达到去重的效果
以sum为例:
mysql> select sum(DISTINCT sal), sum(sal) from emp;+-------------------+----------+| sum(DISTINCT sal) | sum(sal) |+-------------------+----------+| 32700 | 37700 |+-------------------+----------+1 row in set (0.00 sec)
表中有两个人的sal是5000,所去重后结果比没去重的少5000没错。
好了,对于分组函数的分享就到此。