6.1.1 数据库的基本概念
1.数据
数据是指存储在某一种媒体上能够识别的物理符号
2.数据处理
数据处理是指对各种形式的数据进行收集、存储、加工和传播的一系列活动的总和。
3.数据库
数据库是长期存放在计算机内的、有组织的、可表现为多种形式的可共享的数据集合。
4.数据库管理系统
数据库管理系统(DBMS)是对数据库进行管理的系统软件
5.数据库系统
数据库系统(DBS)是指拥有数据库技术支持的计算机系统
DBA:数据库管理员
DBS包括DB 和
并非所有Office组件都是应用软件,比如Access 2010
6.1.2 数据库管理技术的发展
数据管理技术的发展大致经历了人工管理、文件系统和数据库系统三个阶段。
1数据独立性越来越好
2共享性越来越好
3冗余度越来越低
4存储粒度越来越小
其中数据库系统区别于其他两个系统的显著特点是数据结构化
人工管理阶段的主要特点如下:
数据不进行保存
没有专门的数据管理软件
数据面向应用
只有程序的概念
文件系统阶段的主要特点如下:
数据可以长期保存在磁盘上;
文件系统提供了数据与程序之间的存取方法
数据冗余量大
文件之间缺乏联系,相对孤立,仍然不能反映客观世界各个事物之间错综复杂的联系。
数据库系统阶段的主要特点如下:
(1)数据的结构化
(2)数据共享性好
(3)数据独立性好
(4)数据存储粒度小
(5)为用户提供了友好的接口
未来数据库将朝两个方向发展,一是超大容量,支持海量数据处理,支持数据仓库、数据挖掘、分析等;二是更小。
| 数据库系统 | 数据仓库系统 |
面向的用户 | 底层人员 | 决策人员 |
数据内容不同 | 当前数据 | 历史数据 |
数据来源不同 | 同种数据源 | 异种数据源 |
数据的操作不同 | 联机事务处理 | 联机分析处理 |
6.1.3 数据库系统的组成
数据库系统由四部分组成,即硬件系统、系统软件(包括操作系统和数据库管理系统)、数据库应用系统和各类人员。
1.硬件系统
由于一般数据库系统的数据量很大,加之DBMS丰富的强有力的功能使得自身的体积很大,因此,整个数据库系统对硬件资源提出了较高的要求
2.系统软件
系统软件主要包括操作系统、数据库管理系统、与数据库接口的高级语言及其编译系统,以及以DBMS为核心的应用程序开发工具。
3.数据库应用系统
数据库应用系统是为特定应用开发的数据库应用软件
4.各类人员
参与分析、设计、管理、维护和使用数据库的人员均是数据库系统的组成部分。这些人员包括数据库管理员系统分析员、应用程序员和最终用户
6.1.4 数据模型
数据库是企业或组织所涉及的数据的提取和综合,它不仅反映数据本身,而且反映数据之间的联系。数据库用数据模型对现实世界进行抽象,现有的数据库系统均是基于某种数据模型的。
数据库中最常见的数据模型有三种,即层次模型、网状模型和关系模型。
三个组成:数据结构 数据操作 数据完整性约束
层次模型
若用图来表示,层次模型是一棵倒立的树。在数据库中,满足以下两个条件的数据模型称为层次模型:
(1)有且仅有一个结点无父结点,这个结点称为根结点;
(2) 其他结点有且仅有一个父结点。
在层次模型中,结点层次从根开始定义,根为第一层根的子结点为第二层,根为其子结点的父结点,同一父结点的子结点称为兄弟结点,没有子结点的结点称为叶结点。
网状模型:
若用图来表示,网状模型是一个网络。在数据库中满足以下两个条件之一的数据模型称为网状模型。
(1) 允许一个以上的结点无父结点;
(2) 允许结点可以有多于一个的父结点。
由于在网状模型中子结点与父结点的联系不是唯一的,所以要为每个联系命名,并指出与该联系有关的父结点和子结点。
网状模型允许一个以上的结点无父结点或某一个结点有一个以上的父结点,从而构成了比层次结构复杂的网状结构。
关系模型
关系模型把世界看作是由实体(Entity)和联系(Relationship)构成的。
所谓联系就是实体之间的关系,即实体之间的对应关系。
联系可以分为三种:
一对一的联系。
一对多的联系。
多对多的联系。
满足下列条件的二维表,在关系模型中,称为关系。
(1) 每一列中的分量是类型相同的数据;
(2)列的顺序可以是任意的;
(3)行的顺序可以是任意的;
(4)表中的分量是不可再分割的最小数据项,即表中不允许有子表;
(5)表中的任意两行不能完全相同。
一个关系一定是一个二维表,一个二维表不一定是一个关系。
具有二维表特性的电子表格在Excel中被称为数据清单。
关系数据库以其数学理论基础完善、使用简单灵活数据独立性强等特点,而被公认为是最有前途的一种数据库管理系统。
6.1.5 关系数据库
1.关系数据库的基本概念
(1)关系:一个关系就是一张二维表,每个关系有一个关系名。在计算机中,关系的数据存储在文件中,在Access中,一个关系就是数据库文件中的一个表对象
(2)属性:二维表中垂直方向的列称为属性,有时也叫做一个字段。
(3)域:一个属性的取值范围叫做一个域。
(4)元组:二维表中水平方向的行称为元组,有时也叫做一条记录
(5)码:又称为关键字。二维表中的某个属性或属性组,若他的值唯一地标识了一个元组,则称该属性或属性组为候选码。若一个关系有多个候选码,则选定其中一个为主码,也称之为主键。
不同属性可以有相同的域
(6)分量:元组中的一个属性值叫做元组的一个分量
(7)关系模式:是对关系的猫述,它包括关系名、组成该关系的属性名、属性到域的映象。通常简记为: 关系名(属性名1,属性名2,……,属性名n)
2.关系运算
对关系数据库进行查询时,若要找到用户关心的数据就需要对关系进行一定的关系运算。关系运算有两种:一种是传统的集合运算(并、差、交、广义笛卡儿积等) ;另一种是专门的关系运算(选择、投影、连接)。
传统的集合运算不仅涉及关系的水平方向 (即二维表的行),而且涉及关系的垂直方向 (即二维表的列)关系运算的操作对象是关系,运算的结果仍为关系。
传统的集合运算一并运算
并:设关系R和S具有相同的关系模式,R和S的并是由属于R或属于S的元组构成的集合,记为RUS。
作用:关系的合并;要求:相同关系模式
传统的集合运算一差运算
差: 设关系R和S具有相同的关系模式,R和S的差是由属于R但不属于S的元组构成的集合,记为R-S。
作用: 去掉重复的记录;要求: 相同关系模式
传统的集合运算一交运算
交: 关系R和S的交是由既属于R又属于S的元组构成的集合记为RnS,这里要求R和S定义在相同的关系模式上。形式定义如下:
作用:获取重复的记录; 要求:相同关系模式
传统的集合运算一笛卡尔积运算
笛卡儿积: 设关系R和关系S的元数分别为r和s。定义R和S的笛卡儿积RxS是一个(r + s)元的元组集合,每个元组的前r个分量 (属性值)来自R的一个元组,后s个分量是S的一个元组,记为RxS。形式定义如下:
作用:全组合连接,形成新关系;
专门的关系运算包括
(1) 选择: 选择运算即在关系中选择满足指定条件的元组.
(2) 投影: 投影运算是在关系中选择某些属性 (列)。
(3) 连接: 连接运算是从两个关系的笛卡儿积中选取属性间满足一定条件的元组
专门的关系运算一选择运算
选择: 从一个关系R中选出满足条件表达式F的元组,构成一个新关系
作用: 从一个表中选出满足条件的行,模式不变
专门的关系运算——投影运算
投影:从一个关系R中选出属性(组)A,构成一个新关系
作用:选择若干列,构成一个新表,模式改变。
专门的关系运算——连接运算
连接:先对两个关系做笛卡尔积生成一个新的关系,然后在新的关系上做选择操作。
自然连接:除去重复属性的等值连接
自然连接:首先对R和S进行笛卡尔积,然后选择公共字段相等的行,最后去除重复属性。
1.数据库管理系统的组成
(5)事务运行管理。提供事务运行管理及运行日志管理、事务运行的安全性监控和数据完整性检查、事务的并发控制及系统恢复等功能。
2.数据库管理系统的功能
数据库管理系统所提供的功能有以下几项:
(1)数据定义功能。
(2)数据存取功能
(3)数据库运行管理功能。
(4)数据库的建立和维护功能。
(5)数据库的传输