1.1 数据库系统概论 数据库系统概念

  数据库系统的基本概念

    基本概念:数据(Data)

      数据是数据库中存储的基本对象

      数据的形式:数字,文字,图形,视频,语音

      数据的4个特征:

        1)有“型”和“值”之分。

        2)受数据类型和取值范围的约束。

        3)有定性表示和定量表示之分。

        4)应具有载体和多种表现形式。

    数据处理

数据转化为信息的过程

收集、整理、存储、加工、分类、维护、排序、检索和传 输等一系列活动

分析、归纳、推理等科学方法,利用计算机技术、数据库等手段,提取有效的信息资源,为进一步分析、管理和决策提供依据。

    基本概念:信息(Information)

       信息是经过加工后的数据,它对接收者的行为能产生影响,它对接收者的决策具有价值

    数据与信息之间的联系和区别

      区别:

        信息是经过加工之后所得到的数据,是逻辑性或观念性的;

         数据是记载客观事物的符号,是物理性的。

      联系:

         信息是数据的内在逻辑关系的体现;

         数据是信息的表现形式。

    基本概念:数据库

DB)是长期储存在计算机内、有组织的、可共享的大量的数据集合。

    基本概念:数据库管理系统

      定义

DBMS)是位于用户与操作系统之间的一系列以统一的方式管理和维护数据库中数据的软件集合。

      DBMS用途

        科学地组织和存储数据、高效地获取和维护数据

    数据库管理系统功能

      数据定义功能

      数据操作功能

      数据库的运行管理

      数据库的建立和维护功能

常见的关系型DBMS

Oracle

应用广泛、功能强大,分布式数据库系统 “关系-对象”型数据库

MySQL

快捷、可靠 开源、免费、与PHP组成经典的LAMP组合

SQL Server

针对不同用户群体的五个特殊的版本 易用性好

DB2

应用于大型应用系统,具有较好的可伸缩性

    数据库管理系统:MySQL

      优势:

        开源:MySQL源代码免费下载

        简单:MySQL体积小,便于安装

        性能优越:MySQL性能足够与商业数据库媲美

        功能强大:MySQL提供的功能足够与商业数据库媲美

1.1.2 数据管理技术产生与发展

  数据管理技术经历了人工管理、文件系统、数据库系统三个阶段

  1.人工管理阶段:

    特点

      1) 不保存大量的数据。

      2) 没有软件系统对数据进行管理。

      3) 基本上没有“文件”概念。

      4) 一组数据对应一个程序,数据不共享。

    应用背景:

      1) 计算机主要用于科学计算。

      2)硬件中的外存只有卡片、纸带、磁带,没有磁盘等直接存取设备。

      3)软件只有汇编语言,没有操作系统和管理数据的软件。

      4)数据处理的方式基本上是批处理

  2. 文件系统阶段:

      1) 文件系统的数据冗余度(Redundancy)大。

      2) 文件系统中缺乏数据与程序独立性。

        ① 文件系统中的数据文件是为某一特定应用服务的,数据文件的可重复利用率非常低。

         ② 当数据的逻辑结构改变时,必须修改它的应用程序,同时也要修改文件结构的定义。

      3) 应用程序的改变将影响到文件数据结构的改变。

1.1.3 数据库系统特点

  1. 数据结构化

  2.数据的共享性高,冗余度低,易扩充

  3.数据独立性高 物理独立性和逻辑独立性

  4.数据由DBMS统一管理和控制

      (1)数据的安全性(Security)保护

      (2)数据的完整性(Integrity)检查

      (3)并发(Concurrency)控制

      (4)数据库恢复(Recovery)

1.1.4数据库系统组成

数据库系统是指在计算机系统中引入数据库后的系统,一般由数据库、数据库管理系统(及其开发工具)、数据库应用系统、用户(其中包括数据库管理员等)构成。

  

  数据库管理员

    数据库管理员(Database Administrator,简称DBA),是一个负责管理和维护数据库服务器的人。数据库管理员负责全面管理和控制数据库系统。

    具体职责:

      ① 决定数据库中的信息内容和结构

      ② 决定数据库的存储结构和存取策略

      ③ 定义数据的安全性要求和完整性约束条件

      ④ 监控数据库的使用和运行

      ⑤ 数据库的改进和重组重构

  应用系统  

    应用系统(数据库应用系统)是在数据库管理系统(DBMS)支持下建立的计算机应用系统,简写为DBAS。

例如:以数据库为基础的养老院管理系统、图书管理系统、生产实习平台等等。

    

  基本概念:用户

    用户是指最终用户(End User)。最终用户通过应用系统的用户接口使用数据库。常用的接口方式有浏览器、菜单驱动、表格操作、图形显示、报表等,给用户提供简明直观的数据表示。

      

    最终用户可以分为如下三类:

       ① 偶然用户

       ② 简单用户 ③ 复杂用户

1.2 数据模型

  数据模型的概念

数据模型主要用来抽象、表示和处理现实世界中的数据和信息,以便于采用数据库技术对数据进行集中管理和应用,是对客观事物及其联系的数学描述。

    数据模型应满足三方面的要求:

      能比较真实地模拟现实世界;

      容易为人所理解;

      便于在计算机上实现。

  数据处理三层抽象描述

概念层、逻辑层、物理层。

概念层

      概念层是数据抽象级别的最高层,其目的是按用户的观点来对现实世界建模。概念层的数据模型称为概念数据模型,简称概念模型。

实体—联系模型(Entity-Relationship Model,简称E-R模型)。

    (2)逻辑层

逻辑层是数据抽象的中间层,描述数据库数据整体的逻辑结构。这一层的数据抽象称为逻辑数据模型,简称数据模型。

层次模型(Hierarchical Model)、网状模型(Network Model)、关系模型(Relation Model)和面向对象模型(Object Oriented Model)

    (3)物理层

物理层是数据抽象的最底层,用来描述数据物理存储结构和存储方法。

      物理数据结构一般都向用户屏蔽,用户不必了解其细节。

1.2.1 概念模型

  概念模型的用途

信息世界的建模

中间层次

    是数据库设计的有力工具

语言

  

  对概念模型的基本要求

    较强的语义表达能力,能够方便、直接地表达应用中的各种语义知识

    简单、清晰、易于用户理解。

  1.信息世界中的基本概念

    (1) 实体(Entity)

      客观存在并可相互区别的事物称为实体。

      可以是具体的人、事、物或抽象的概念。

    (2) 属性(Attribute)

      实体所具有的某一特性称为属性。

      一个实体可以由若干个属性来刻画。

    (3) 码(Key)

      唯一标识实体的属性集称为码。

    (4) 域(Domain)

      属性的取值范围称为该属性的域。

    (5) 实体型(Entity Type)

      用实体名及其属性名集合来抽象和刻画 同类实体称为实体型

    (6) 实体集(Entity Set)

      同型实体的集合称为实体集,如:全体学生

    (7) 联系(Relationship)

      现实世界中事物内部以及事物之间的联系在信息世界中反映为实体内部的联系和实体之间的联系

    (8)实体型间联系类型

      两个实体型   一对一联系(1:1)  

      三个实体型   一对多联系(1:n)

      一个实体型   多对多联系(m:n)

数据处理属于什么层次架构 数据处理的概念_数据库

 

  2. 概念模型的表示方法

    概念模型是对信息世界的建模
    概念模型的表示方法很多
    最为著名、最为常用的是P.P.S.Chen于1976年提出的实体-联系方法(Entity-Relationship approach)。
    用E-R图来描述现实世界的概念模型,E-R方法也称为E-R模型。
    E-R图提供了表示实体型、属性和联系的方法。
      实体型:用矩形表示,矩形框内写明实体名。
      属性:用椭圆形表示,并用无向边将其与相应的实体连接起来。
      联系:用菱形表示,菱形框内写明联系名,并用无向边分别与有关实体连接起来,同时在无向边旁标上联系的类型(1:1,1:n或m:n)。

数据处理属于什么层次架构 数据处理的概念_数据库系统_02

数据处理属于什么层次架构 数据处理的概念_数据处理属于什么层次架构_03

 

 

数据处理属于什么层次架构 数据处理的概念_数据处理属于什么层次架构_04

数据处理属于什么层次架构 数据处理的概念_数据库_05

 

 

数据处理属于什么层次架构 数据处理的概念_数据处理属于什么层次架构_06

 

 

数据处理属于什么层次架构 数据处理的概念_数据库_07

  3. E-R模型设计原则

    (1)属性应该存在于且只存在于某一个地方(实体或者关联)。该原则确保了数据库中的某个数据只存储于某个数据库表中(避免同一数据存储于多个数据库表),避免了数据冗余。

    (2)实体是一个单独的个体,不能存在于另一个实体中成为其属性。该原则确保了一个数据库表中不能包含另一个数据库表,即不能出现“表中套表”的现象。

    (3)同一个实体在同一个E-R图内仅出现一次。例如同一个E-R图,两个实体间存在多种关系时,为了表示实体间的多种关系,尽量不要让同一个实体出现多次。比如客服人员与客户,存在“服务—被服务”、“评价—被评价”的关系。

  4.E-R模型设计步骤

    ①划分和确定实体。

    ②划分和确定联系。

    ③确定属性。作为属性的“事物”与实体之间的联系,必须是一对多的关系,作为属性的“事物”不能再有需要描述的性质或与其他事物具有联系。为了简化E-R模型,能够作为属性的“事物”尽量作为属性处理。

    ④画出E-R模型。重复过程①~③,以找出所有实体集、关系集、属性和属值集,然后绘制E-R图。设计E-R分图,即用户视图的设计,在此基础上综合各E-R分图,形成E-R总图。

    ⑤优化E-R模型。利用数据流程图,对E-R总图进行优化,消除数据实体间冗余的联系及属性,形成基本的E-R模型。    

 1.2.2  数据模型的要素

数据结构、数据操作和完整性约束三部分组成。

数据结构

数据结构描述数据库的组成对象以及对象之间的联系。

    描述的内容有两类:

      一类是与对象的类型、内容、性质有关的,例如网状模型中的数据项、记录,关系模型中的域、属性、关系等;

      一类是与数据之间联系有关的对象,例如网状模型中的系型。

  (2) 数据操作

    数据操作是指对数据库中各种对象(型)的实例(值)允许执行的操作的集合,包括操作及有关的操作规则。

    数据库主要有检索和更新(包括插入、删除、修改)两大类操作。

  (3) 数据的完整性约束条件

    数据的完整性约束条件是一组完整性规则。

    完整性规则是给定的数据模型中数据及其联系所具有的制约和依存规则,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效、相容。

 

1.2.3 基本数据模型

  非关系模型

    层次模型(Hierarchical Model)

    网状模型(Network Model )

      数据结构:以基本层次联系为基本单位

      基本层次联系:两个记录以及它们之间的一对多(包括一对一)的联系

  关系模型(Relational Model)

    数据结构:表

  *面向对象模型(Object Oriented Model

    数据结构:对象

 

数据处理属于什么层次架构 数据处理的概念_数据库系统_08

 

1.3 数据库系统结构

  数据库系统的三级模式结构

  二级映射与数据独立性

  C/S与B/S结构

1.3.1 数据库系统的三级模式结构

  1)外模式(External Schema)

    外模式(也称子模式或用户模式)

      数据库用户(包括应用程序员和最终用户)使用的局部数据的逻辑结构和特征的描述

      数据库用户的数据视图,是与某一应用有关的数据的逻辑表示

      通常是模式的子集,一个数据库可以有多个外模式

介于模式与应用之间

      模式与外模式的关系:一对多

      外模式与应用的关系:一对多

保证数据库安全性的一个有力措施。

  2)模式(Schema)

    模式(也称逻辑模式)

全体数据的逻辑结构和特征的描述

      一个数据库只有一个模式

    模式的地位:是数据库系统模式结构的中间层

      与数据的物理存储细节和硬件环境、具体的应用程序、开发工具及高级程序设计语言无关

    模式的定义包括:

      数据的逻辑结构、数据之间的联系、数据有关的安全性、完整性要求

  3)内模式(Internal Schema)

    内模式(也称存储模式)

      是数据物理结构和存储方式的描述
      是数据在数据库内部的表示方式,例如:

        记录的存储方式(顺序存储,按照B树结构存储,按hash方法存储)

        索引的组织方式

        数据是否压缩存储

        数据是否加密

        数据存储记录结构的规定

      一个数据库只有一个内模式

  三者之间的关系:

    模式是内模式的逻辑表示

    内模式是模式的物理实现

    外模式是模式的部分抽取

1.3.3数据库系统常见的运行与应用结构

数据处理属于什么层次架构 数据处理的概念_数据库系统_09