数据库系统的核心任务是数据管理 。数据库技术是一门研究如何存储、使用和管理数据的技术。
数据库的四个基本概念:
1、数据(Data)
数据即信息,用于描述事物与变化的符号记录,有着它的语法和语义。
2、数据库(DataBase , DB)
位于计算机储存设备上,按照一定格式与规则存放数据的仓库。具有永久存储、有组织和可共享三个特征。具有较小的冗余度、较高的数据独立性和易拓展性。
3、数据库管理系统(DataBase management system , DBMS)
和操作系统一样,是计算机的基础软件系统。具有数据定义、数据组织、存储、管理、操作、维护与运行等功能。
4、数据库系统(DataBase System , DBS)
由数据库、数据库管理系统、应用程序、数据库管理员组成的全套基于数据的系统总称。
通常,把数据库系统简称为数据库。
数据模型
数据模型是对现实数据的抽象,常分为两类:
1、概念模型
从用户的角度出发,对数据和信息建模,主要用于数据库设计。
2、逻辑模型和物理模型
逻辑模型主要包括:层次模型、网状模型、关系模型等,从计算机系统的观点对数据建模,主要用于数据库管理系统的实现。
物理模型则是对数据最底层的抽象,描述数据在系统内部和底层的存取方式和表示方式。是面向计算机系统硬件层面的模型。
数据模型的组成要素:数据结构、数据操作、数据完整性约束条件。
下面主要介绍概念模型与关系模型
概念模型:
1、实体(entity):
客观存在并可相互区别的事物,可以是具体的人、事、物或抽象的概念或关系。
2、属性(attribute):
实体所具有的特征,本质是对数据信息的侧重。
3、码(key):
能够唯一标识实体的属性集合。
4、实体型(entity type):
区别于实体,实体型是用实体名与属性组来刻画实体。类似于c++中模板与实例的关系(实体为模板,实体型为实例)。
5、联系(relationship):
实体间一对一、一对多或是多对多的联系。常用E-R图来描述这种关系。
关系模型:
每个关系的数据结构是一张规范的二维表。关系,即表。
表中的每一列都是属性,每一行为属性组,称为元组。
表中的属性组可以唯一确定一个元组,该属性组称为码,码可以理解为实体型间的特性标识。
属性的值域称为域。
下面给出关系术语与表格术语的对比:
关系术语 | 一 般表格的术语 |
关系名 | 表名 |
关系模式 | 表头 |
关系 | 二维表 |
元组 | 行 |
属性 | 列 |
属性名 | 列名 |
属性值 | 列值 |
| |
在最后,介绍一下数据库系统的三级模式结构 外模式、模式、内模式。
外模式:
也称用户模式,是数据库用户能够看见和使用的局部数据的逻辑描述。简单来说,就是数据库用户的数据视图。
模式:
也称逻辑模式,是数据库系统中全部数据逻辑结构和特征的描述,区别于外模式的局部数据。是所有用户的公共数据视图。
定义模式时,不仅要定义数据的逻辑结构,例如数据记录由哪些数据项构成,数据项的名字、类型、取值范围等;还要定义数据见的联系,与数据有关的安全性、完整性要求。
内模式:
即存储模式,是数据的物理存储结构和存储方式的描述。