数据结构与算法之堆排序

  • ​​前提条件​​
  • ​​基本概念​​
  • ​​算法步骤​​
  • ​​建立大根堆​​
  • ​​堆排序​​
  • ​​算法分析​​
  • ​​时间复杂度​​
  • ​​空间复杂度​​
  • ​​算法特点​​
  • ​​完整代码​​
  • ​​输出结果​​
  • ​​参考文献​​

前提条件

  • 熟悉C语言与指针
  • 熟悉数据结构与算法

基本概念

堆排序 (Heap Sort) 是 一 种树形选择排序,在排序过程中,将待排序的记录数据结构与算法之堆排序_堆排序看成是一棵完全二叉树的顺序存储结构,利用完全二叉树中双亲结点和孩子结点之间的内在关系,在当前无序的序列中选择关键字最大(或最小)的记录。

算法步骤

建立大根堆

由于单个节点的完全二叉树满足堆特性,所以叶子节点都是堆。对n个结点的完全二叉树建堆的过程依次将以编号为数据结构与算法之堆排序_堆排序_02的结点为根的子树筛选为子堆

例如,对初始序列(42,58,68,98,86,42)建堆的过程如视频所示。由于堆长度n为6,所以需要依次对编号为数据结构与算法之堆排序_堆排序_03

建立大根堆

//筛选法调整堆
void HeapAdjust(SqList &L,int s,int m)
{
//假设r[s+1..m]已经是堆,将r[s..m]调整为以r[s]为根的大根堆
ElemType rc;
int j;
rc=L.r[s];
for(j=2*s;j<=m;j*=2)
{ //沿key较大的孩子结点向下筛选
if(j<m&&L.r[j].key<L.r[j+1].key) ++j; //j为key较大的记录的下标,比较左右节点大小
if(rc.key>=L.r[j].key) break; //rc应插入在位置s上
L.r[s]=L.r[j]; s=j;
}
L.r[s]=rc; //插入
}
//建初堆
void CreatHeap(SqList &L)
{
//把无序序列L.r[1..n]建成大根堆
int i,n;
n=L.length;
//printf("%d",n);
for(i=n/2;i>0;--i) //反复调用HeapAdjust
HeapAdjust(L,i,n);
} //CreatHeap

堆排序

堆排序利用了大根堆(或 小根堆) 堆顶记录的关键字最大(或最小)这一特征,使得当前无序的序列中选择关键字最大(或最小) 的记录变得简单。下面讨论用大根堆进行排序,堆排序的步骤如下。

  • ①按堆的定义将待排序序列r[1…n]调整为大根堆(这个过程称为建初堆),交换r[1]和r[n],则r[n]为关键字最大的记录。
  • ②将r[1…n-1]重新调整为堆,交换r[1]和r[n-1],则r[n-1]为关键字次大的记录。
  • ③循环n-1次,直到交换了r[1]和r[2]为止,得到了一个非递减的有序序列r[1 …n]。

堆排序

void HeapSort(SqList &L) 
{
//对顺序表L进行堆排序
int i;
ElemType x;
CreatHeap(L); //把无序序列L.r[1..L.length]建成大根堆
for(i=L.length;i>1;--i)
{
x=L.r[1]; //将堆顶记录和当前未经排序子序列L.r[1..i]中最后一个记录互换
L.r[1]=L.r[i];
L.r[i]=x;
HeapAdjust(L,1,i-1); //将L.r[1..i-1]重新调整为大根堆
}//for
}//HeapSort

算法分析

时间复杂度

  • 堆排序的运行时间主要耗费在建初堆和调整堆时进行的反复“筛选”上。
  • 设有n个记录的初始序列所对应的完全二叉树的深度为h,建初堆时,每个非终端结点都要自上而下进行“筛选"。由于第i层上的结点数小于等于数据结构与算法之堆排序_大根堆_04,且第i层结点最大下移的深度为h-i,每下移一层要做两次比较,所以建初堆时关键字总的比较次数为数据结构与算法之堆排序_堆排序_05
    调整建新堆时要做 n-1次“筛选” ,每次“筛选”都要将根结点下移到合适的位置。 n个结点的完全二叉树的深度为数据结构与算法之堆排序_大根堆_06,则重建堆时关键字总的比较次数不超过
    数据结构与算法之堆排序_算法_07
  • 由此,堆排序在最坏的情况下,其时间复杂度也为数据结构与算法之堆排序_算法_08
  • 实验研究表明,平均性能接近于最坏性能

空间复杂度

仅需一个记录大小供交换用的辅助存储空间,所以空间复杂度为O(1)。

算法特点

  • (1)是不稳定排序。
  • (2)只能用于顺序结构,不能用于链式结构
  • (3)初始建堆所需的比较次数较多,因此记录数较少时不宜采用。堆排序在最坏情况下时间复杂度为数据结构与算法之堆排序_算法_08,相对于快速排序最坏情况下的数据结构与算法之堆排序_算法_10而言是一个优点,当记录较多时较为高效。

完整代码

//堆排序
#include<stdlib.h>
#include<stdio.h>
#define MAXSIZE 20 //顺序表的最大长度
typedef struct
{
int key;
char *otherinfo;
}ElemType;
//顺序表的存储结构
typedef struct
{
ElemType *r; //存储空间的基地址
int length; //顺序表长度
}SqList; //顺序表类型

//筛选法调整堆
void HeapAdjust(SqList &L,int s,int m)
{
//假设r[s+1..m]已经是堆,将r[s..m]调整为以r[s]为根的大根堆
ElemType rc;
int j;
rc=L.r[s];
for(j=2*s;j<=m;j*=2)
{ //沿key较大的孩子结点向下筛选
if(j<m&&L.r[j].key<L.r[j+1].key) ++j; //j为key较大的记录的下标,比较左右节点大小
if(rc.key>=L.r[j].key) break; //rc应插入在位置s上
L.r[s]=L.r[j]; s=j;
}
L.r[s]=rc; //插入
}
//HeapAdjust
void Create_Sq(SqList &L)
{
int i,n;
printf("请输入数据个数,不超过%d个\n",MAXSIZE);
scanf("%d",&n); //输入个数
while(n>MAXSIZE)
{
printf("个数超过上限,不能超过%d,请重新输入",MAXSIZE);
scanf("%d",&n);
}
printf("请输入待排序的数据:\n");
for(i=1;i<=n;i++)
{
scanf("%d",&L.r[i].key);
L.length++;
}
}

//建初堆
void CreatHeap(SqList &L)
{
//把无序序列L.r[1..n]建成大根堆
int i,n;
n=L.length;
//printf("%d",n);
for(i=n/2;i>0;--i) //反复调用HeapAdjust
HeapAdjust(L,i,n);
} //CreatHeap

void HeapSort(SqList &L)
{
//对顺序表L进行堆排序
int i;
ElemType x;
CreatHeap(L); //把无序序列L.r[1..L.length]建成大根堆
for(i=L.length;i>1;--i)
{
x=L.r[1]; //将堆顶记录和当前未经排序子序列L.r[1..i]中最后一个记录互换
L.r[1]=L.r[i];
L.r[i]=x;
HeapAdjust(L,1,i-1); //将L.r[1..i-1]重新调整为大根堆
}//for
}//HeapSort
void show(SqList L)
{
int i;
for(i=1;i<=L.length;i++)
printf("%d ",L.r[i].key);
}
int main()
{
SqList L;
L.r=(ElemType*)malloc((MAXSIZE+1)*sizeof(ElemType));
L.length=0;
Create_Sq(L);//创建一个顺序表,里面存储着要排序的初始序列
HeapSort(L);//对初始序列进行堆排序
printf("排序后的结果为:\n");
show(L);//输出排序后的结果为
return 0;
}

输出结果

数据结构与算法之堆排序_结点_11

参考文献

[1] 严蔚敏,吴伟民. 数据结构(C语言版). 北京: 清华大学出版社,2020
[2] 严蔚敏,李冬梅,吴伟民. 数据结构(C语言版)(第二版). 北京: 人民邮电出版社,2021
[3] 吴伟民,李小妹,刘添添,黄剑锋,苏庆,林志毅,李杨.数据结构. 北京:高等教育出版社,2017
[4] 王道论坛. 2022数据结构考研复习指导. 北京:电子工业出版社,2021