SQL数据库的三级结构

三级结构

关系模式称为"基本表",存储模式称为"存储文件",子模式称为"视图",元组称"行",属性称"列"。

SQL数据库体系的结构要点如下:

  • (1)一个SQL数据库是表的汇集。
  • (2)一个SQL表由行集构成,行是列的序列,每列对应一个数据项。
  • (3)表或者是基本表,或者是视图。基本表是实际存储在数据库中的表,视图由是由若干基本表或其他视图构成的表的定义。
  • (4)一个基本表可以跨一个或多个存储文件,一个存储文件也可存放一个或多个基本表。存储文件与物理文件对应。
  • (5)用户可以用SQL语句对表进行操作,包括视图和基本表。
  • (6)SQL的用户可以是应用程序,也可以是终端用户。

SQL语句(结构化查询语言)

  • 数据定义语言(DDL)负责创建,修改,删除表,索引和视图等对象 -Create,Alter,Drop
  • 数据操作语言(DML)负责数据库中的数据的插入,修改,查询和删除操作 -Insert,Update,Select,Delete
  • 数据控制语言(DCL)用来授权和撤销用户对数据的操作权限 -Grant,Revoke
数据定义
基本数据类型
  • 数值型:包括 int、smallint、decimal(p,d)、numeric(p,d)
  • 字符串型:char(n) 、nchar(n)、varchar(n)、nvarchar(n)前2者是定长,后2者为变长串
  • 时间型:datetime、date
  • 以上类型中不常见的解释:
  • decimal(p,d)(精确数值型,共p位,小数点后有d位)
  • numeric(p,d) (共p位,小数点后有d位)
  • nchar:其定义形式为Nchar(n)。它与Char数据类型类似,不同的是Nchar数据类型n的取值为1~4000。Nchar数据类型采用Unicode标准字符集,Unicode标准用两个字节为一个存储单位,其一个存储单位的容纳量就大大增加了,可以将全世界的语言文字都囊括在内,在一个数据列中就可以同时出现中文、英文、法文等,而不会出现编码冲突。
  • Nvarchar:其定义形式Nvarchar(n)。它与Varchar数据类型相似,Nvarchar数据类型也采用Unicode标准字符集,n的取值范围为1~4000。
基本表
基本表的创建:(建立表结构)
CREATE TABLE 基本表名 
(列名,类型, 
…… 
完整性约束...) 
--完整性约束包括主键子句(PRIMARY KEY)、检查子句(CHECK)和外键子句(Foreign KEY).
基本表结构的修改
-- 增加新列: 
ALTER TABLE 基本表名 ADD 列名 类型 [列的完整性约束]
-- 删除原有的列: 
ALTER TABLE 基本表名 DROP COLUMN 列名
-- 增加表级约束: 
ALTER TABLE 基本表名 ADD 表级完整性约束 
或 ALTER TABLE 基本表名 ADD CONSTRAINT 表级完整性约束名 约束条件
-- 删除原有表级约束: 
ALTER TABLE 基本表名 DROP CONSTRAINT 约束名
--修改数据列,只能修改数据列的数据类型,注意其中的限制:
ALTER TABLE 基本表名 ALTER COLUMN 列名 新的数据类型
基本表的撤消
DROP TABLE 基本表名
索引
索引的创建:
CREATE [CLUSTERED][UNIQUE] INDEX 索引名 ON 表名(列名[ASC|DESC])

说明

  • 列名后面需要指定ASC[升序]或DESC[降序] 若不指定,默认为升序
  • 本语句建立索引的排列方式为首先以列名中的第一个排序,该列值相同的记录,按下一列名的值排序
  • UNIQUEL规定索引的每一个索引值只对应表或视图中唯一的记录,可允许存在NULL值,但不允许出现多个NULL值
  • CLUSTERED:表示该索引为聚簇索引,一个表或者视图中只允许有一个聚簇索引,建立索引后,表在磁盘中的物理顺序与聚簇索引一致。在最常查询的列上建立聚簇索引可以加快查询速度,在经常更新的列上建立聚簇索引,则DBMS维护索引的代价太大
  • NONCLUSTERED:规定此索引为非聚簇索引,是SQL的默认选择。一个表可以有多个非聚簇索引。对于非聚簇索引,数据的物理存储顺序独立于索引存储顺序。每个索引行均包含非聚簇键值和一个或多个含定位器(指向包含该值的行)每个索引均可以提供对数据的不同排序次序的访问。

设计索引的情况分析

  • 适合建索引
  • 经常被查询,如经常在WHERE子句中出现的属性
  • 在order by子句使用的属性
  • 频繁出现在连接条件中的属性,即主码或外部码
  • 该列的值唯一的属性
  • 主码或外部码应建立索引
  • 对于以查询为主或只读的表,可以多建索引
  • 对于范围查询(=、<、>、>=、<=比较符确定查询范围)可在相关属性上建立索引
  • 使用聚集函数(MIN、MAX、AVG、SUM、COUNT)或者排序输出的属性最好建立索引
  • 不适合建索引
  • 太小的表
  • 在查询中很少被引用的属性
  • 包含太多重复选用值得属性
  • 一些特殊数据类型的属性不能建立索引,BIT,TEXT,IMAGE等
索引的撤消:
DROP INDEX 表名.索引名
数据查询
SELECT语句的基本句法
SELECT-FROM-WHERE句型
SELECT 列名表(逗号隔开) 
FROM 基本表或视图序列 
WHERE 条件表达式

Notice:掌握条件表达式中各种运算符的应用.

  • 算术比较运算符=,>,<,<>或!=,<=,>=;
  • 逻辑运算符AND、OR、NOT;
  • 集合成员资格运算符:IN,NOT IN;like, not like;between and ,any(存在一个),all(所有);
  • 谓词:EXISTS(存在量词),NOT EXISTS;
  • 聚合函数
聚合函数

如果语句没有Group By则返回单个值;如果语句带Group By则每个小组返回一个值。

函数名

函数含义

COUNT(*)

计算元组的个数

COUNT(列名)

求一列中值的计算个数

COUNT(DISTINCT 列名)

求一列中值的种类数

SUM(列名)

求一列中值的总和

AVG(列名)

求一列中值的平均值

MAX(列名)

求一列中值的最大值

MIN(列名)

求一列中值的最小值

比较运算符的嵌套查询
select *
from emplyee 
where age > any(select age 
               from employee
               where Dno='02' and Dno <>'02')
  • > any 只要大于其中一个就行
  • >all 必须大于所有结果
  • < any 只要小于其中一个就行
  • < all 必须小于所有结果
  • >=any 只要大于等于其中一个就行
  • >=all 必须大于等于所有结果
  • <=any 只要小于等于其中一个就行
  • <=all 必须小于等于所有结果
  • =any 只要等于一个就行
  • <> any 只要不等于其中一个就行
  • <>all 必须不等于所有结果
完整SELECT语句
SELECT 列名表(逗号隔开) 
FROM 基本表或视图序列 
[WHERE 条件表达式] (行条件子句) 
[GROUP BY 列名序列] (分组子句) 
    [HAVING 组条件表达式] (组条件子句) 
[ORDER BY列名[ASC|DESC]..] (排序子句)
  • SELECT子句中的规定
  • 如果要求输出表格中不允许出现重复元组,则在SELECT后加一DISTINCT
  • SELECT 子句中允许出现 +,-,*,/,以及列名、常数、函数的算术表达式
  • 条件表达式的算术比较操作
  • WHERE 子句中可以用BETWEEN…AND…来限定一个值的范围
  • 列和基本表的改名操作
  • 同一个基本表在SELECT语句中多次引用时可用AS来增加别名
  • 字符串的匹配操作
  • WHERE子句中字符串匹配用LIKE和两个通配符,%和下划线_. %为任意长度的字符串,_表示单个字符
  • 集合的并、交、差操作
  • 查询结果的结构完全一致时,可将两个查询进行并(UNION)、交(InterSect)、差(Except)
  • 空值的比较操作
  • 查询空值操作不是用=‘null’,而是用 IS NULL来测试。
  • 集合的比较操作
  • 集合成员资格比较用 IN/NOT IN
  • 集合成员算术比较用元组θ ANY/ALL (θ是算术比较运算符)(少用)
  • 导出表的使用
  • 使用INTO关键字,可以给子查询结果起个表名,保存相关查询数据。 (select into)
连接查询

等值连接

select [distinct/all]<目标列表达式[别名]清单>
from <关系名1[别名1]> inner join <关系名2[别名2]>
on 连接条件表达式
或
select [distinct/all]<目标列表达式[别名]清单>
from <关系名清单>
on 连接条件表达式

左外连接(left join):除了返回两表中满足条件的元组以外,还将左侧表中不匹配的元组,右侧表中以空值代替

右外连接(right join):除了返回两表中满足条件的元组以外,还将右侧表中不匹配的元组,左侧表中以空值代替

全外连接(full join):除了返回两表中满足条件的元组以外,还返回左侧表中不匹配元组,右侧表中以空值代替,以及右侧表中不匹配元组,左侧表中以空值代替

自身连接:有些特殊的查询需要对同一个关系进行多次连接查询

-- 自身连接
-- emgr表示该员工直接负责人,连接查询得到该员工的间接负责人,也就是找该负责人的负责人
select emp1.cno,emp2.emger
from employee emp1, employee emp2
where emp1.emgr = emp2.cno
数据更新
数据插入

(1) 元组值的插入

INSERT INTO 基本表名(列名表) 
values(元组值)

(2) 查询结果的插入

INSERT INTO 基本表名(列名表) 
SELECT 查询语句
数据删除
DELETE FROM 基本表名 [WHERE条件表达式] 
--(语义:从基本表中删除满足条件表达式的元组)
视图
创建:
CREATE VIEW 视图名(列名表) AS SELECT 查询语句 [with check option];

若有[with check option],则在今后进行insert,update,delete操作时,系统自动检查是否符合原定义视图子查询中的条件表达式

注意:如果在视图中碰到聚合函数,必须创建表名

撤消:
DROP VIEW 视图名
视图更新

对试图的更新其实是DBMS自动将视图的更新,转换成了对基本表的更新。

如果在定义时有添加了[with check option],对试图更新时系统发将自动检查原定义时的条件是否满足,若不满足,则拒绝执行。

视图的可更新性
  • 如果视图是从多个基本表使用连接操作导出的,则不允许更新。
  • 如果导出的视图使用了分组和聚合操作,也不允许更新。
  • 如果视图是从单个基本表使用选择、投影操作导出的,并且包括了基本表的主键和没有缺省值的不可为空的列, 那么这样的视图称为“行列子集视图”,则可以执行操作。