我们给出以下例子:
- 数据(data)是对客观事物的符号表示,在计算机科学中是指所有能输入到计算机中并被计算机程序处理的符号的总称。数据包括文字、表格、图像等。
数据的基本单位是数据元素(data element)(C语言中的结构体、结点、记录等),通常把数据元素作为一个整体进行处理。例如,超市商品表单。
数据对象(data object)是具有相同类型的数据元素的集合,因为所有数据元素类型相同时处理起来更加方便,所以在数据结构中,除特别指定外,数据通常都是数据对象 。
有些数据元素是由若干个数据项(也可称为字段、域、属 性)组成。
数据结构的概念数据项是数据的不可分割的最小单位。
例如在1~10的整数数据中,任意一个数据就是一个数据元素。字符数据A~Z。
数据结构(data structure)是相互之间存在一种或多种特定关系的数据元素的集合。这些数据元素不是孤立存在的,而是有着某种关系,这种关系构成了某种结构。
数据结构 = 数据 + 结构
- 在数据结构中主要讨论数据元素之间的相邻关系
三个方面
-
逻辑结构:数据元素之间的逻辑关系的整体。它是数据结构在用户面前呈现的形式。
-
存储结构:数据元素及其关系在计算机存储器中的存储方式,也称为数据的物理结构。
-
运算:施加在该数据上的操作。
- 举例:
如下所示的为一个学生成绩表Score,它由多个学生成绩记录(即数据元素)组成,每个元素又包括多个数据项。要求计算所有学生的平均分。
逻辑结构
数据元素之间的逻辑关系的整体称为数据的逻辑结构,这里的逻辑关系主要指数据元素之间的相邻关系。
根据数据元素之间逻辑关系的不同,分为如下下列4类基本结构。
-
集合:包含的所有数据元素同属于一个集合(最松散的关系)
-
线性结构:包含的数据元素之间存在一对一的关系。
-
树形结构:包含的数据元素之间存在一对多的关系。
-
图形结构:包含的数据元素之间存在多对多的关系。也称为网状结构
- 线性结构
- 树形结构
- 图结构
数据的逻辑结构可以采用二元组方式进行描述。 二元组表示如下:
- \(D\)是数据元素的有限集合,即\(D\)是由有限个数据元素(简称为元素)所构成的集合。
- \(R\)是\(D\)上的关系的有限集合,即R是由有限个关系\(r_{j}(1≤j≤m)\)所构成的集合。
- \(r_{j}\)是指从\(D→D\)的关系。
数据结构大致包含以下几种存储结构:
-
线性表,还可细分为顺序表、链表、栈和队列;
-
树结构,包括普通树,二叉树,线索二叉树等;
-
图存储结构;
线性表
线性表并不是一种具体的存储结构,它包含顺序存储结构和链式存储结构,是顺序表和链表的统称。
顺序表
顺序表,简单地理解,就是常用的数组,只是换了个名字而已,例如使用顺序表存储 {1,3,5,7,9}
由于顺序表结构的底层实现借助的就是数组,因此对于初学者来说,可以把顺序表完全等价为数组,但实则不是这样。数据结构是研究数据存储方式的一门学科,它囊括的都是各种存储结构,而数组只是各种编程语言中的基本数据类型,并不属于数据结构的范畴。
链表
使用顺序表(底层实现靠数组)时,需要提前申请一定大小的存储空间,这块存储空间的物理地址是连续的,链表则完全不同,使用链表存储数据时,是随用随申请,因此数据的存储位置是相互分离的,换句话说,数据的存储位置是随机的。
为了给各个数据块建立“依次排列”的关系,链表给各数据块增设一个指针,每个数据块的指针都指向下一个数据块(最后一个数据块的指针指向 NULL),就如同一个个小学生都伸手去拉住下一个小学生的手,这样,看似毫无关系的数据块就建立了“依次排列”的关系,也就形成了链表
栈和队列
栈
栈和队列隶属于线性表,是特殊的线性表,因为它们对线性表中元素的进出做了明确的要求。
栈中的元素只能从线性表的一端进出(另一端封死),且要遵循“先入后出”的原则,即先进栈的元素后出栈。
栈结构如图所示,像一个木桶,栈中含有 3 个元素,分别是 A、B 和 C,从在栈中的状态可以看出 A 最先进的栈,然后 B 进栈,最后 C 进栈。根据“先进后出”的原则,3 个元素出栈的顺序应该是:C 最先出栈,然后 B 出栈,最后才是 A 出栈。
队列
队列中的元素只能从线性表的一端进,从另一端出,且要遵循“先入先出”的特点,即先进队列的元素也要先出队列。
队列结构如图所示,队列中有 3 个元素,分别是 A、B 和 C,从在队列中的状态可以看出是 A 先进队列,然后 B 进,最后 C 进。根据“先进先出”的原则,3 个元素出队列的顺序应该是 A 最先出队列,然后 B 出,最后 C 出。
树存储结构
树存储结构适合存储具有“一对多”关系的数据。
如图所示,其中张平只有一个父亲,但他却有两(多)个孩子,这就是“一对多”的关系,满足这种关系的数据可以使用树存储结构。
图存储结构
图存储结构适合存储具有“多对多”关系的数据。
如图所示,从 V1 可以到达 V2、V3、V4,同样,从 V2、V3、V4 也可以到达 V1,这就是“多对多”的关系,满足这种关系的数据可以使用图存储结构。