/***********************************************************
总结各种排序算法包括但不限于:
1. 插入排序类
1.1 直接插入排序
1.2 二分插入排序
1.3 希尔排序

2. 交换排序类
2.1 冒泡排序
2.2 快速排序

3. 选择排序
3.1 直接选择排序
3.2 堆排序

4. 归并排序
5. 基数排序

以上所有排序算法的实现均为将整形数组data递增排序
************************************************************/

#include <iostream>
#include <time.h>

using namespace std;

/********************** 1 直接插入排序********************************
空间复杂度:只有辅助变量, 没有与问题规模相关的辅存消耗,O(1)
时间复杂度:最好情况,初始数组为正序(此处为递增),O(n);最坏情况,初始数组为反    
          序,O(n2);平均时间复杂度为O(n2).
稳定性:当data[i]=datda[i-1]时,相对位置不变,所以是稳定的排序
思想:将原序列分为有序区和无序区,每次外部循环将无序区的第一个元素插入到有序区的适 
     当位置,同时有序区元素加1,无序区元素减1,这样直到无序区的元素为0
*******************************************************************/
void insertSort(int data[], int n)
{
	int i, j;
	int tmp;
	for (i = 1; i < n; ++i)
	{
		tmp = data[i];
		j = i - 1;
		while (j >= 0 && tmp < data[j])
		{
			data[j + 1] = data[j];
			--j;
		}
		//若j<0则tmp是有序区的最小元素,若tmp>=data[j]则将tmp放在data[j]的
		//后面data[j+1]处
		data[j + 1] = tmp;
	}
}

/************************ 2 二分(折半)插入排序 ***********************
时空复杂度及稳定性与上面是一样的
思想:对于有序的序列二分查找效率比顺序查找高很多,基于此,在将无序区的第一个元素插 
     入到有序区相应位置时,用二分查找寻找该位置而不是顺序查找,可以减少关
     键字比较的次数但是关键字移动的次数仍然是没有改变的,所以其实际的效果与直接插 
     入排序相当,只需注意二分查找思想的运用。
*******************************************************************/
void biInsertSort(int data[], int n)
{
	int i, j, low, high, mid;
	int tmp;
	for (i = 1; i < n; ++i)
	{
		tmp = data[i];
		low = 0, high = i - 1;
		while (low <= high)
		{
			mid = (low + high) / 2;
			if (tmp < data[mid])
				high = mid - 1;
			else
				low = mid + 1;
		}
		for (j = i - 1; j >= high + 1; --j)//high+1 is mid
			data[j + 1] = data[j];
		data[high + 1] = tmp;
	}
}

/************************* 3 希尔排序 ********************************
空间复杂度:只用到了i,j,gap,tmp4个辅助变量,与问题规模无关,空间复杂度为O(1).
时间复杂度:分析较复杂,一般认为平均时间复杂度为O(n^1.3).
稳定性:不稳定
思想:本质上还是属于插入排序,只不过是先对序列分组,然后组内直接插入,同时,分组数
     由多到少,组内元素由少到多,顺序性由差到好,直到最后一步组间距为1时,
     直接插入排序的数组已经基本有序了
*******************************************************************/

void shellSort(int data[], int n)
{
	int i, j, gap;
	int tmp;
	gap = n / 2;
	while (gap > 0)
	{
		//这样记忆,整个for循环其实就是直接插入排序的过程,只不过将直接插入排序
		//的1->gap罢了,最后当gap=1的时候就是直接插入排序了。
		for (i = gap; i < n; ++i)
		{
			tmp = data[i];
			j = i - gap;
			while (j >= 0 && tmp < data[j])
			{
				data[j + gap] = data[j];
				j = j - gap;
			}
			data[j + gap] = tmp;
		}
		gap = gap / 2;
	}
}

/*************************** 4 冒泡排序 ******************************
空间复杂度:只有三个辅助变量,与问题规模无关,空间复杂度为O(1)
时间复杂度:最好情况,数组本身是正序的,O(n);最坏情况,数组是反序的,O(n^2);平
          均时间复杂度为O(n^2)。
稳定性:稳定
思想:将数组头部看成水面,数组尾部看成水底,最小(或最大)的元素上浮(或下沉)直到
     结束,采用的是比较元素大小然后交换元素值的思想,每次都选择未排序的
     元素中最小或最大元素送达指定的位置。
*******************************************************************/

//经典冒泡排序算法,以后以这个为准
void bubbleSort(int data[], int n)
{
	int i, j, tmp, flag;
	for (i = 0; i < n - 1; ++i)
	{
		flag = 0;
		for (j = 0; j < n - i - 1; ++j)
		{
			if (data[j] > data[j + 1])
			{
				tmp = data[j];
				data[j] = data[j + 1];
				data[j + 1] = tmp;
				flag = 1;
			}
		}
		if (flag == 0)
			return;
	}
}
//最小元素上浮
void bubbleSort1(int data[], int n)
{
	int tmp, flag;
	for (int i = 0; i < n - 1; ++i)
	{
		flag = 0;
		for (int j = n - 1; j > i; --j)
		{
			if (data[j] < data[j - 1])
			{
				tmp = data[j];
				data[j] = data[j - 1];
				data[j - 1] = tmp;
				flag = 1;
			}
		}
		if (flag == 0)//no swap in the circulation
			return;
	}
}

//最大元素下沉(备选方案,与上面是一样的)
void bubbleSort2(int data[], int n)
{
	int tmp, flag;
	for (int i = n-1; i > 0; --i)
	{
		flag = 0;
		for (int j = 0; j < i; ++j)
		{
			if (data[j] > data[j + 1])
			{
				tmp = data[j];
				data[j] = data[j + 1];
				data[j + 1] = tmp;
				flag = 1;
			}
		}
		if (flag == 0)
			return;
		
	}
}



/***************************** 5 快速排序 ****************************
空间复杂度:主要是递归时所需的栈空间,平均空间复杂度为O(nlongn)。
时间复杂度:主要的时间都花费在划分上面,最好情况,每次划分的基准都是无序区的‘中
          值’记录,O(nlogn);最坏情况,原数组本身是有序的,此时O(n^2)。
          平均时间复杂度为O(nlogn)。
稳定性: 不稳定
思想:分治的思想,将大问题转化为小问题,递归的思想,最重要的过程就是划分,划分结束
     了,数组也就排好序了,快速排序是排序算法中非常重要的一种
*******************************************************************/

//快排,数据结构书上的方法,递归,以后以这个为准
void quickSort(int data[], int start, int end)
{
	int i = start, j = end;
	int pivot;
	if (start < end)
	{
	   //每次递归都取无序区的第一个元素作为中心基准,这个地方可以改进为随机的方法
		pivot = data[start];
		while (i != j)
		{
			while (j>i && data[j] > pivot)
				--j;
			data[i] = data[j];
			while (i < j && data[i] < pivot)
				++i;
			data[j] = data[i];
		}
		data[i] = pivot;
		quickSort(data, start, i - 1);
		quickSort(data, i + 1, end);
	}
}

//另外一个版本是将划分(上面if里面的代码)过程单独成为一个partition函数,同时采样随机化快排思想(剑指offer)

int randomInRange(int s, int t)
{
	srand((unsigned int)time(NULL));
	return s + rand() % (t - s + 1);
}
void swap(int* left, int* right)
{
	int tmp = *left;
	*left = *right;
	*right = tmp;
}
int partition(int data[], int length, int start, int end)
{
	if (data == NULL || start < 0 || end >= length)
		throw new std::exception("invalid parameters");

	int index = randomInRange(start, end);
	swap(&data[index], &data[end]);

	int small = start - 1;
	for (index = start; index < end; ++index)
	{
		if (data[index] < data[end])
		{
			++small;
			if (small != index)
				swap(&data[index], &data[small]);
		}
	}
	++small;
	swap(&data[small], &data[end]);

	return small;
}

void quickSort1(int data[], int length, int start, int end)
{
	if (start == end)
		return;

	int index = partition(data, length, start, end);
	if (index > start)
		quickSort1(data, length, start, index - 1);
	if (index < end)
		quickSort1(data, length, index + 1, end);
}

/*************************** 6 直接选择排序 **************************
空间复杂度:只用到了i,j,k,tmp四个辅助变量,故空间复杂度为O(1).
时间复杂度:无论表的初始状态如何,比较次数都达到O(n^2),故直接选择排序的最好和最坏
          时间复杂度都是O(n^2).
稳定性:不稳定,如将{5,3,2,5,4,1}排序,第一趟就改变了两个5的相对位置。可以
       看成是交换排序和直接插入排序的综合,但是直接插入和冒泡排序都是稳定的,而该 
       算法是不稳定的
思想:每一趟从待排序的记录中选择关键字最小的记录,顺序放在已排好序子表的最后,知道
     全部记录排序完毕
适用性:适合从大量记录中选择一部分排序记录,如从10000个记录中选择关键字大小为前10
       的记录
*******************************************************************/

void selectSort(int data[], int n)
{
	int tmp, k;
	for (int i = 0; i < n - 1; ++i)
	{
		k = i;
		for (int j = i + 1; j < n; ++j)
		{
			if (data[j] < data[k])
				k = j;
		}
		if (k != i)//若k=i则证明已经是有序的了
		{
			tmp = data[i];
			data[i] = data[k];
			data[k] = tmp;
		}
	}
}


/****************************** 7 堆排序 ****************************
空间复杂度:只用到了四个辅助变量,空间复杂度是O(1).
时间复杂度:最好,最坏,和平均时间复杂度都是O(nlogn).
稳定性:不稳定
思想:本质上是一种树形选择排序思想,将原数组看成为一个完全二叉树的顺序存储结构,利
     用完全二叉树中双亲节点和孩子节点之间的内在关系,在当前无序区中选择关键字
     最大(大根堆)或者最小(小根堆)的记录移动到数组的末尾,然后对剩余的元素作同
     样的操作
适用性:不适宜记录数较少的表,与直接选择排序算法类似
*******************************************************************/

//算法分为两个主要部分,堆调整(采用筛选算法),与排序

//建立大根堆,每次将最大的元素移动到末尾
void heapAdjust(int data[], int start, int end)
{
	int tmp = data[start];
	for (int i = 2 * start + 1; i <= end; i *= 2){
		//这个i<end的判断很重要,若i=end,则证明当前节点start只有一个左孩子节点,就不用继续比较了
		if (i < end && data[i] < data[i + 1])
			++i;
		if (tmp > data[i])
			break;
		data[start] = data[i];
		start = i;
	}
	data[start] = tmp;		
}

void heapAdjust1(int data[], int low, int high)
{
	
	int i = low, j = 2 * i+1;
	int tmp = data[i];
	while (j <= high)
	{
		if (j < high && data[j] < data[j + 1])
			++j;
	    if (tmp < data[j])
	    {
		    data[i] = data[j];
		    i = j;
		    j = 2 * i;
	    }
	    else 
			break;
	}
	data[i] = tmp;
}

void heapSort(int data[], int n)
{
	int i;
	int tmp;
	//建立初始堆
	for (i = n / 2; i >= 0; --i)
	{
		heapAdjust(data, i, n-1);
	}
	//堆排序过程
	for (int i = n-1; i >= 0; --i)
	{
		//交换堆顶和最后一个元素
		tmp = data[0];
		data[0] = data[i];
		data[i] = tmp;
		//调整堆满足大根堆的性质
		heapAdjust(data, 0, i - 1);
	}
}

/*************************** 8 归并排序 ******************************
空间复杂度:O(n),需要一个辅助的数组来存放合并两个有序表之后生成的新表,故归并排序不是就地排序
时间复杂度:最好,最坏,平均时间复杂度均是O(nlogn)
稳定性:归并排序是稳定的排序算法
思想:将两个或两个以上的有序表合并为一个新的有序表,递归的思想
*******************************************************************/

迭代版本,有问题
//void mergeSort_iter(int data[], int n)
//{
//	int *b = new int[n];
//	int *a = data;
//	//外层for循环,一共进行logn趟归并
//	for (int seg = 1; seg < n; seg += seg)
//	{
//		//一趟归并排序
//		for (int start = 0; start < n; start += seg + seg)
//		{
//			int low = start, mid = (start + seg) < n ? (start + seg) : n, high = (start + seg + seg) < n ? (start + seg + seg) : n;
//			int k = low;
//			int start1 = low, end1 = mid;
//			int start2 = mid, end2 = high;
//			while (start1 < end1 && start2 < end2)
//				b[k++] = a[start1] < a[start2] ? a[start1] : a[start2];
//			while (start1 < end1)
//				b[k++] = a[start1++];
//			while (start2 < end2)
//				b[k++] = a[start2++];
//		}
//		//交换a和b
//		int *tmp = a;
//		a = b;
//		b = tmp;
//	}
//	//若发生交换了
//	if (a != data)
//	{
//		for (int i = 0; i < n; ++i)
//			b[i] = a[i];
//		b = a;
//	}
//	delete b;
//}

//一趟归并过程,将两个有序的子表合成一个新的有序表
void merge(int data[], int low, int mid, int high)
{
	int i = low, j = mid + 1, k = 0;
	//临时存储排好序的数组
	int *tmp = new int[high - low + 1];
	while (i <= mid && j <= high)
	{
		if (data[i] < data[j])
			tmp[k++] = data[i++];
		else
			tmp[k++] = data[j++];
	}
	while (i <= mid)
		tmp[k++] = data[i++];
	while (j <= high)
		tmp[k++] = data[j++];

	for (int i = low, k = 0; i <= high; i++, k++)
		data[i] = tmp[k];
	delete tmp;
}

//递归形式分别对数组的左右两个子数组归并排序,然后merge成一个新的有序数组
void mergeSortR(int data[], int low, int high)
{
	int mid;
	if (low < high)
	{
		mid = (low + high) / 2;
		mergeSortR(data, low, mid);
		mergeSortR(data, mid + 1, high);
		merge(data, low, mid, high);
	}
}
//自顶向下的二路归并排序算法
void mergeSort(int data[], int n)
{
	mergeSortR(data, 0, n - 1);
}

/************************* 9 基数排序 ********************************
空间复杂度:空间复杂度为O(n)
时间复杂度:最好、最坏、平均的时间复杂度都是O(d(n+r)),其中d是待排序元素的最大位
          数,n是元素的个数,r是基数(十进制r=10,二进制r=2)。
稳定性:基数排序是稳定的排序方法
思想:通过"分配"和"收集"过程实现排序,不需要进行关键字之间的比较,是一种借助于多
     关键字排序的思想对单关键字排序的方法,分为最低位优先(LSD)和最高位优(MSD)
*******************************************************************/

//辅助函数,求数据的最大位数d
int maxbit(int data[], int n)
{
	int d = 1;//保存最大位数,初始为1
	int p = 10;
	for (int i = 0; i < n; ++i)
	{
		while (data[i] >= p)
		{
			p *= 10;//有溢出的风险
			++d;
		}	
	}
	return d;
}
//基数排序
void radixSort(int data[],int n)
{
	//得到最大位数d
	int d = maxbit(data, n);
	int *tmp = new int[n];
	int *count = new int[10];//计数器
	int i, j, k;
	int radix = 1;
	for (i = 1; i <= d; ++i)
	{
		//清空计数器
		for (j = 0; j < 10; ++j)
			count[j] = 0;
		for (j = 0; j < n; j++)
		{
			k = (data[j] / radix) % 10;//统计每个桶中的记录数
			count[k]++;
		}
		for (j = 1; j < 10; j++)
			count[j] = count[j - 1] + count[j];
		for (j = n - 1; j >= 0; j--)
		{
			k = (data[j] / radix) % 10;
			tmp[count[k] - 1] = data[j];
			count[k]--;
		}
		for (j = 0; j < n; j++)
			data[j] = tmp[j];
		radix = radix * 10;
	}
	delete []tmp;
	delete []count;

}

void print(int data[], int n)
{
	for (int i = 0; i < n; ++i)
		cout << data[i] << " ";
	cout << endl;
}

//测试
int main()
{
	int data[] = { 3, 6, 1, 5, 0, 4, 2, 9, 8, 7 };
	int copy1[] = { 3, 6, 1, 5, 0, 4, 2, 9, 8, 7 };
	int copy2[] = { 3, 6, 1, 5, 0, 4, 2, 9, 8, 7 };
	int copy3[] = { 3, 6, 1, 5, 0, 4, 2, 9, 8, 7 };
	int copy4[] = { 3, 6, 1, 5, 0, 4, 2, 9, 8, 7 };
	int copy5[] = { 3, 6, 1, 5, 0, 4, 2, 9, 8, 7 };
	int copy6[] = { 3, 6, 1, 5, 0, 4, 2, 9, 8, 7 };
	int copy7[] = { 3, 6, 1, 5, 0, 4, 2, 9, 8, 7 };
	int copy8[] = { 3, 6, 1, 5, 0, 4, 2, 9, 8, 7 };
	int copy9[] = { 3, 6, 1, 5, 0, 4, 2, 9, 8, 7 };

	cout << "待排序数组为: ";
	print(data, sizeof(data) / sizeof(int));
	cout << endl << endl;

	cout << "1 直接插入排序: ";
	insertSort(copy1, sizeof(copy1) / sizeof(int));
	print(copy1, sizeof(copy1) / sizeof(int));
	cout << endl;

	cout << "2 二分插入排序: ";
	biInsertSort(copy2, sizeof(copy2) / sizeof(int));
	print(copy1, sizeof(copy2) / sizeof(int));
	cout << endl;

	cout << "3 希尔排序:     ";
	shellSort(copy3, sizeof(copy3) / sizeof(int));
	print(copy1, sizeof(copy3) / sizeof(int));
	cout << endl;

	cout << "4 冒泡排序:     ";
	bubbleSort(copy4, sizeof(copy4) / sizeof(int));
	print(copy1, sizeof(copy4) / sizeof(int));
	cout << endl;

	cout << "5 快速排序:     ";
	quickSort(copy5, 0, sizeof(copy5) / sizeof(int)-1);
	print(copy1, sizeof(copy5) / sizeof(int));
	cout << endl;

	cout << "6 直接选择排序: ";
	selectSort(copy6, sizeof(copy6) / sizeof(int));
	print(copy1, sizeof(copy6) / sizeof(int));
	cout << endl;

	cout << "7 堆排序:       ";
	heapSort(copy7, sizeof(copy6) / sizeof(int));
	print(copy1, sizeof(copy7) / sizeof(int));
	cout << endl;

	cout << "8 归并排序:     ";
	mergeSort(copy8, sizeof(copy8) / sizeof(int));
	print(copy1, sizeof(copy8) / sizeof(int));
	cout << endl;

	cout << "9 基数排序:     ";
	radixSort(copy9, sizeof(copy9) / sizeof(int));
	print(copy1, sizeof(copy9) / sizeof(int));
	cout << endl;

	return 0;
}

python按照分组进行排名 python分组排序_排序算法


python按照分组进行排名 python分组排序_时间复杂度_02