《SQL必知必会》读书笔记

1.聚集函数

我们经常需要汇总数据而不用把它们实际检索出来,为此SQL提供了专门的函数。使用这些函数,SQL查询可用于检索数据,以便分析和报表生成。这种类型的检索例子有:

  • 确定表中行数(或者满足某个条件或包含某个特定值得行数)
  • 获得表中某些行的和
  • 找出表列

上述例子都需要汇总表中得数据,而不需要实际数据本身。

与上一章介绍得数据处理函数不同,SQL的聚集函数在各种主要SQL实现中得到了相当一致的支持。

SQL聚集函数:(都是针对某一列的

  • AVG() 【返回某列的平均值】
  • COUNT() 【返回某列的行数】
  • MAX() 【返回某列的最大值】
  • MIN() 【返回某列的最小值】
  • SUM() 【返回某列之和】

2.AVG()函数

AVG()函数可用来返回所有列的平均值,也可用来返回特定列或行的平均值。

SELECT AVG(prod_price) AS avg_price
FROM Products

avg_price
6.823333

AVG()也可以用来确定特定列或行的平均值。

SELECT AVG(prod_price) AS avg_price
FROM Products
WHERE vend_id = 'DLL01'

avg_price
3.8650

过滤出vend_id为DLL01的产品,然后只是求该产品的平均值,也就是对特定一些列求平均值。

注意:只用于单个列
AVG()只能用来确定特定数值列的平均值,而且列名必须作为函数参数给出。为了获得多个列的平均值,必须使用多个AVG()函数。

注意:NULL值
AVG()函数忽略列值为NULL的行。

3.COUNT()函数

COUNT()确定表中行的数目或符合特定条件的行的数目。

COUNT()函数有两种使用方式:

  • 使用COUNT(*)对表中行的数目进行计数,不管表列中包含的是空值(NULL)还是非空值。
  • 使用COUNT(column)对特定列中具有值得行数进行计数,忽略NULL值。
SELECT COUNT(*) AS num_CUST
FROM Customers

num_cust
5

在此例子中,利用COUNT(*)对所有行计数,不管行中各列有什么值。

SELECT COUNT(cust_email) AS num_cust
FROM Customers

num_cust
3

这条SELECT语句使用COUNT(cust_email)对cust_eamil列中有值得行进行计数。

说明:NULL值
如果指定列名,则COUNT()函数会忽略指定列得值为空得行,但如果COUNT()函数中用到是星号(*),则不忽略。

4.MAX()函数

MAX()返回指定列中的最大值。MAX()要求指定列名。

SELECT MAX(prod_price) AS max_price
FROM Products

max_price
11.9900

提示:对非数值数据使用MAX()
在用于文本数据时,MAX()返回按该列排序后的最后一行。

说明:NULL值
MAX()函数忽略列值为NULL的行。

5.MIN()函数

MIN()函数返回指定列的最小值。

SELECT MIN(prod_price) AS min_price
FROM Products

min_price
3.4900

提示:对非数值数据使用MAX()
在用于文本数据时,MAX()返回按该列排序后的最前面的行。

说明:NULL值
MAX()函数忽略列值为NULL的行。

6.SUM()函数

SUM()用来返回指定列值的和(总计)

SELECT SUM(quantity) AS items_ordered
FROM OrderItems
WHERE order_num =20005

items_ordered
200

SUM()也可以用来计算计算值。在下面的例子中,合计每项物品的item_price*quantity,得出总的订单金额:

SELECT SUM(item_price*quantity) AS total_price
FROM OrderItems
WHERE order_num = 2005;

total_price
1648.0000

函数SUM(item_price*quantity)返回订单中所有物品价钱之和,WHERE子句同样保证只统计某个物品订单中的物品。

提示:在多个列上进行计算
如本例所示,利用标准的算术操作符,所有聚集函数都可用来执行多个列上的计算。

说明:NULL值
SUM()函数忽略列值为NULL的行。

7.聚集不同值

以上5个聚集函数都可用如下使用。(聚集参数:ALL、DISTINCT

  • 对所有行执行计算,指定ALL参数或不指定参数(因为ALL是默认行为。)
  • 只包含不同的值,指定DISTINCT参数。

提示:ALL为默认

ALL参数不需要指定,因为它是默认行为。如果不指定DISTINCT,则假定为ALL。

下面的例子使用AVG()函数返回特定供应商提供的产品的平均价格。它与上面的SELECT语句相同,但使用了DISTINCT参数,因此平均值只考虑各个不同的价格:

SELECT AVG(DISTINCT prod_price) AS avg_price
FROM Products
WHERE vend_id = 'DLL01'

avg_price
4.2400

注意:DSITINCT不能用于COUNT(*)
如果指定列名,则DISTINCT只能用于COUNT()。DISTINCT不能用于COUNT(*)。类似地,DISTINCT必须使用列名,不能用于计算或表达式。

提示:将DISTINCT用于MIN()和MAX()
虽然DISTINCT从技术可用于MIN()和MAX(),但这样做实际上没有价值。

说明:其他聚集参数
除了这里介绍的DISTINCT和ALL参数,有的DBMS还支持其他参数,如支持对查询结果的子集进行计算的TOP和TOP PERCENT。为了了解具体的DBMS支持哪些聚集参数,请参阅相应的文档。

8.组合聚集函数

目前为止的所有聚集函数例子都只涉及单个函数。但实际上,SELECT语句可根据需要包含多个聚集函数。

SELECT COUNT(*) AS num_items,
        MIN(prod_price) AS price_min,
        MAX(prod_price) AS price_max,
        AVG(prod_price) AS price_avg
FROM Products

num_items   price_min   price_max   price_avg
9           3.4900      11.9900     6.823333