在学校有学习过排序算法,但是那会基本没有认真听,后面期末考试也基本是靠考前突击和人品的爆发,考完也就忘记完了,最近突然想着来研究一下排序算法,所以就一个一个用java实现了一遍,其中也是有一些自己的理解,用博客记录下来,其中有不足和错误的地方,还希望留言指正。

java排序从大的分类来看,可以分为内排序和外排序:其中,在排序过程中只使用了内存的排序称为内排序;内存和外存结合使用的排序成为外排序。

下面讲的都是内排序。

内排序在细分可以这样分:

1、选择排序:直接选择排序,堆排序

2、交换排序:冒泡排序,快速排序

3、插入排序:直接插入排序,二分插入排序,希尔排序

4、归并排序

5、基数排序

是不是觉得这样分类,文字的看着不形象,我也画了一张分类图:

               

java 稳定排序 java中的排序_java排序


下面是实现源码:

package sort;

/**  
 * Package: sort  
 *  
 * File: JavaSorts.java   
 *  
 * Copyright @ 2015 Corpration Name  
 *   
 */
public class JavaSorts {

	/**
	 * 希尔排序
	 * @param array
	 */
	public static void ShellSort(int[] array){
		int d = array.length;
		do {
			d /= 2;   //设置增量,通过设置增量来进行分组,分组后,每一组内采用直接插入排序
			OneShell(array, d);//一个增量对应一趟希尔排序
		} while (d > 1);
	}
	
	/**
	 * 一趟希尔排序
	 * @param array
	 * @param d
	 */
	public static void OneShell(int[] array,int d){
		
		for (int i = 0; i < array.length - d; i++) {
			int temp = array[i+d]; //array[i+d]的拷贝,每一次插入操作所以插入的值
			if (array[i] > array[i + d]) {
				int j = i;
				//此时分组为:j,j+d,j+2d,j+3d····,组内采用直接插入排序
				while(j >= 0 && array[j] > temp){
					array[j + d] = array[j];    //使用while循环寻找temp能够插入的位置,从右往左寻找,大于temp的往后移动
					j -= d;
				}
				array[j + d] = temp;   //插入数据
			}
		}	
	}
	
	/**
	 * 快速排序
	 * @param array
	 * @param l
	 * @param r
	 */
	public static void QuickSort(int[] array,int l,int r){
		if (l < r) {
			int i = l,j = r,temp = array[l];
			while(i < j){
				while(i < j && array[j] > temp){
					j--;         //从右边开始寻找比temp小的数
				}
				if(i < j){
					array[i++] = array[j]; //找到后,将这个数赋值到i位置上,然后i+1,因为下一轮寻找比temp大的数,从i+1位置开始
				}
				while(i < j && array[i] < temp){
					i++;          //从左边寻找比temp大的数
				}
				if(i < j){
					array[j--] = array[i]; //找到后,将这个数赋值到j位置上,然后j-1,因为下一轮寻找比temp小的数从j-1位置开始
				}
			}
			array[i] = temp;  //此时比temp小的数都移动到左边,比temp大的数都移动到了右边,最后将temp赋值到中间位置
			
			QuickSort(array, l, i - 1); //对temp左边的数进行递归
			QuickSort(array, i + 1, r); //对temp右边的数进行递归
		}
	}
	
	/**
	 * 堆排序
	 * @param array
	 */
	public static void HeapSort(int[] array){
		for (int i = 0; i < array.length; i++) {
			BuildMaxHeap(array, array.length - 1 - i);
			Swap(array, 0, array.length - 1 - i);
		}
	}
	/**
	 * 创建最大堆
	 * @param array
	 * @param lastOneIndex
	 */
	public static void BuildMaxHeap(int[] array,int lastOneIndex){
		
		for (int i = (lastOneIndex - 1)/2; i >= 0; i--) {
			int k = i;
			while(2*k + 1 <= lastOneIndex){
				int bigIndex = 2*k + 1;   //bigIndex用于记录一个节点树中最大数的索引
				if (bigIndex < lastOneIndex) {  //满足这个条件,说明堆中有array[2*k+2]这个节点
					if (array[bigIndex] < array[bigIndex + 1]) {
						bigIndex++;      //若满足这个条件,说明k节点下的右子节点大于左子结点,因而bigIndex加1
					}
				}
				
				if (array[k] < array[bigIndex]) {
					Swap(array, bigIndex, k); //若k节点小于它其中一个子节点,则与这个子节点交换值
					k = bigIndex;  //交换完值后,此时k节点下面的bigIndex节点可能不满足堆的性质,所以赋值给k,重新进入下一轮while循环
				}else {
					break;//若k节点满足堆的性质,则直接跳出循环
				}
			}
		}
		
	}
	
	/**
	 * 交换array中array[a]、array[b]
	 * @param array
	 * @param a
	 * @param b
	 */
	public static void Swap(int[] array,int a,int b){
		if (a < array.length && b < array.length) {
			int temp = array[a];
			array[a] = array[b];
			array[b] = temp;
		}
	}
	
	/**
	 * 直接插入排序
	 * @param array
	 */
	public static void DirectInsertSort(int[] array){
		for (int i = 0; i < array.length - 1; i++) {
			int temp = array[i + 1];
			if (array[i] > array[i + 1]) {
				int j = i;
				while(j >= 0 && array[j] > temp){
					array[j + 1] = array[j];
					j--;
				}
				array[j + 1] = temp;
			}
		}
	}
	
	/**
	 * 二分插入排序
	 * @param array
	 */
	public static void BinaryInsertSort(int[] array){
		for (int i = 0; i < array.length - 1; i++) {
			int temp = array[i + 1];  //需要插入的数
			if(array[i] > array[i + 1]){
				int l = 0;   //有序队列中左边标识
				int r = i;   //有序队列中右边标识
				while(l < r){
					int mid = (l + r) / 2; //永远指向l->r中间的那个值,中间值与temp(需要插入的值)比较
					if (array[mid] > temp) {
						r--;              //通过while循环,二分折半搜索temp应该插入的位置
					}else {
						l++;
					}
				}
				//运行到这里,l==r,即是temp应该插入的位置是array[l](或者array[r])
				for (int j = i + 1; j > l; j--) {   
					array[j] = array[j - 1];  //将l -> i的数都往后移动一位
				}
				array[l] = temp;  //将temp插入到l位置
				
			}
				
			}
	}
	/**
	 * 直接选择排序
	 * @param array
	 */
	public static void DirectSelectSort(int[] array){
		for (int i = 0; i < array.length - 1; i++) {
			int min = array[i];
			for (int j = i + 1; j < array.length; j++) {
				if (array[j] < min) {
					min = array[j];
					array[j] = array[i];
					array[i] = min;
				}
			}
		}
	}
	/**
	 * 冒泡排序
	 * @param array
	 */
	public static void BubbleSort(int[] array){
		int temp = 0;
		for (int i = 0; i < array.length; i++) {
			for (int j = 0; j < array.length - 1; j++) {
				if (array[j] > array[j+1]) {
					temp = array[j];
					array[j] = array[j+1];	
					array[j+1] = temp;
				}
			}
		}
	}
	
	/**
	 * 归并排序
	 * @param array
	 */
	public static void MergeSort(int[] array){
		int left = 0;
		int right = array.length - 1;
		MergeSortRecursive(array, left, right);
	}
	/**
	 * 归并排序的递归方法
	 * @param array
	 * @param left
	 * @param right
	 */
	public static void MergeSortRecursive(int[] array,int left,int right){
		if (left >= right) {
			return;  //递归的停止判断,没有这个判断会报StackOverflowError
		}
		int mid = (left + right)/2;
		MergeSortRecursive(array, left, mid);
		MergeSortRecursive(array, mid+1, right);
		Merge(array, left, mid, right);
	}
	
	/**
	 * 归并排序中合并方法
	 * @param array
	 * @param left
	 * @param mid
	 * @param right
	 */
	public static void Merge(int[] array,int left,int mid,int right){
		int r_left = mid + 1; //需要合并数组中右边数组第一个数索引
		int[] tempArray = new int[array.length];//一个临时数组,用于合并时暂时存储
		int newIndex = left;   //临时数组索引
		int tempLeft = left;   //合并完了以后,用于复制数组的索引
		while(left <= mid && r_left <= right){   //将部分的数放入到临时数组中
			if (array[left] < array[r_left]) {
				tempArray[newIndex++] = array[left++];
			}else {
				tempArray[newIndex++] = array[r_left++];
			}
		}
		while (left <= mid) {
			tempArray[newIndex++] = array[left++];  //将左边还剩余的数放入临时数组(若需要合并的左边还剩余数)
		}
		
		while(r_left <= right){
			tempArray[newIndex++] = array[r_left++];//将右边还剩余的数放入临时数组(若需要和并的右边还剩余数)
		}
		while(tempLeft <= right){
			array[tempLeft] = tempArray[tempLeft++];  //将临时数组复制到array
		}
	}
	
	/**
	 * 基数排序
	 * @param array
	 */
	public static void RadixSort(int[] array){
		int bits = FindMaxBit(array);  //得到数组中最大的那个数的位数
		for (int i = 0; i < bits; i++) {
			OneBitSort(array, i+1);  //一位基数的排序
		}
	}
	/**
	 * 一位基数的排序
	 * @param array
	 * @param bit
	 */
	public static void OneBitSort(int[] array,int bit){
		int[] tempArray = new int[array.length];
		int index = 0;
		int tempIndex = 0;
		for (int i = 0; i < 10; i++) {
			for (int j = 0; j < array.length; j++) {
				if (FindBitNum(array[j], bit) == i) {
					tempArray[index++] = array[j];
				}
			}
		}
		while(tempIndex < array.length){
			array[tempIndex] = tempArray[tempIndex++]; //复制数组
		}
	}
	/**
	 * 得到某个数某一位的数(例如:num=1234,n=2,FindBitNum(1234,2)=3)
	 * @param num
	 * @param n
	 * @return
	 */
	public static int FindBitNum(int num,int n){
		int key1 = (int)Math.pow(10, n);
		int key2 = (int)Math.pow(10, n-1);
		num %= key1;
		num /= key2;
		return num;
	}
	/**
	 * 得到一个数组中最大数的位数
	 * @param array
	 * @return
	 */
	public static int FindMaxBit(int[] array){
		
		if (array == null || array.length ==0) {
			return 0;
		}
		int max = array[0];
		for (int i = 1; i < array.length; i++) {
			if (array[i] > max) {
				max = array[i];
			}
		}
		int bit = 0;
		while(max / 10 != 0 || max % 10 != 0){
			max /= 10;
			bit++;
		}
		return bit;
		
	}
	public static void main(String[] args) {
		
		System.out.println("冒泡排序:"+SortThreads.getBubbleSortTime());
		System.out.println("直接选择排序:"+SortThreads.getDirSelectSortTime());
		System.out.println("直接插入排序:"+SortThreads.getDirInsertSortTime());
		System.out.println("二分插入排序:"+SortThreads.getBinaryInsertSortTime());
		System.out.println("快速排序:"+SortThreads.getQuickSortTime());
		System.out.println("希尔排序:"+SortThreads.getShellSortTime());
		System.out.println("归并排序:"+SortThreads.getMergeSortTime());
		System.out.println("基数排序:"+SortThreads.getRadixSortTime());
		System.out.println("堆排序:"+SortThreads.getHeapSortTime());
		
		
	}
}



对于这些排序算法,我对它们的排序速度比较感兴趣,所以自己也测试了一下,数组是通过随机数产生的,我测的时候每一个数是不大于4位数,即不大于10000。

ProduceRandomNum.java产生随机数的数组:

package sort;

import java.util.Random;

/**  
 * Package: sort  
 *  
 * File: SortRunnable.java   
 *  
 * Copyright @ 2015 Corpration Name  
 *   
 */
public class ProduceRandomNum{

	public synchronized static int[] RandomArray(int num,int n){
		Random random = new Random();
		int[] array = new int[num];
		for (int i = 0; i < array.length; i++) {
			array[i] = random.nextInt((int)Math.pow(10, n));
		}
		return array;
	}
	

}


SortThreads.java测试排序的时间的方法,封装都一个类中,这个类我一直想把它写成多线程的方式(即是将这些排序一起运行),但是后面没有找到一个好的方法,所以后面就用了这种最笨的方法,有好办法的大神一定要指出来。


package sort;
/**  
 * Package: sort  
 *  
 * File: SortThreads.java   
 *  
 * Copyright @ 2015 Corpration Name  
 *   
 */
public class SortThreads {

	private static final int arrayNum = 500000;
	private static final int bit = 4;
	public static long getBubbleSortTime(){
		long oldTime = System.currentTimeMillis();
		JavaSorts.BubbleSort(ProduceRandomNum.RandomArray(arrayNum, bit));
		long newTime = System.currentTimeMillis();
		return newTime - oldTime;
	}
	public static long getQuickSortTime(){
		int[] array = ProduceRandomNum.RandomArray(arrayNum, bit);
		long oldTime = System.currentTimeMillis();
		JavaSorts.QuickSort(array, 0, array.length - 1);
		long newTime = System.currentTimeMillis();
		return newTime - oldTime;
	}
	public static long getDirSelectSortTime(){
		long oldTime = System.currentTimeMillis();
		JavaSorts.DirectSelectSort(ProduceRandomNum.RandomArray(arrayNum, bit));
		long newTime = System.currentTimeMillis();
		return newTime - oldTime;
	}
	public static long getDirInsertSortTime(){
		long oldTime = System.currentTimeMillis();
		JavaSorts.DirectInsertSort(ProduceRandomNum.RandomArray(arrayNum, bit));
		long newTime = System.currentTimeMillis();
		return newTime - oldTime;
	}
	
	public static long getBinaryInsertSortTime(){
		long oldTime = System.currentTimeMillis();
		JavaSorts.BinaryInsertSort(ProduceRandomNum.RandomArray(arrayNum, bit));
		long newTime = System.currentTimeMillis();
		return newTime - oldTime;
	}
	
	public static long getShellSortTime(){
		long oldTime = System.currentTimeMillis();
		JavaSorts.ShellSort(ProduceRandomNum.RandomArray(arrayNum, bit));
		long newTime = System.currentTimeMillis();
		return newTime - oldTime;
	}
	public static long getMergeSortTime(){
		long oldTime = System.currentTimeMillis();
		JavaSorts.MergeSort(ProduceRandomNum.RandomArray(arrayNum, bit));
		long newTime = System.currentTimeMillis();
		return newTime - oldTime;
	}
	public static long getRadixSortTime(){
		long oldTime = System.currentTimeMillis();
		JavaSorts.RadixSort(ProduceRandomNum.RandomArray(arrayNum, bit));
		long newTime = System.currentTimeMillis();
		return newTime - oldTime;
	}
	public static long getHeapSortTime(){
		long oldTime = System.currentTimeMillis();
		JavaSorts.HeapSort(ProduceRandomNum.RandomArray(arrayNum, bit));
		long newTime = System.currentTimeMillis();
		return newTime - oldTime;
	}
}


通过测试,我的测试数据(后面数据量大了,有的排序时间太长,我就用*代替了):

java 稳定排序 java中的排序_时间空间复杂度_02

通过测试数据来看,不同排序适用于不同的场景,快速排序也不一定是最快的,在数据量比较小的时候,希尔排序反而更快,只是在不断增加数据量的时候,快速排序比较快也很明显。同时,排序也不能只看排序的速度,还需要看它的空间复杂度,即对内存空间利用的要求。例如,快排、归并、堆排序这三者,通过随机数产生数组,它们的时间复杂度可以说是基本一样的,但是当n比较大的时候,你会发现归并排序会比其他两个慢。

各种排序的时间复杂度、空间复杂度和稳定性,同样图形比较形象:

java 稳定排序 java中的排序_时间空间复杂度_03


最后总结一下:

稳定性:
   1、稳定:冒泡排序、插入排序、归并排序和基数排序
   2、 不稳定:选择排序、快速排序、希尔排序、堆排序
平均时间复杂度
  1、O(n^2):直接插入排序,简单选择排序,冒泡排序。
        2、在数据量特别大的时候,冒泡排序基本是最慢的。
  3、在数据规模较小时(9W内),直接插入排序,简单选择排序差不多。当数据较大时,冒泡排序算法的时间代价最高。性能为O(n^2)的算法基本
上是相邻元素进行比较,基本上都是稳定的。
  1、O(nlogn):快速排序,归并排序,希尔排序,堆排序。
  2、其中,快排是最好的, 其次是归并和希尔,但数据量特别大的时候,归并排序很容易出现内存溢出的错误,如普通机器n>1000万时。
空间复杂度
         1、O(1):冒泡排序、直接插入排序、二分插入排序、希尔排序、直接选择排序、堆排序
         2、 O(n):归并排序
         3、 O(nlog2n):快速排序
         4、O(rd+n):基数排序
排序算法的选择
  1、数据规模较小
    (1)待排序列基本序的情况下,可以选择直接插入排序;
    (2)对稳定性不作要求宜用简单选择排序,对稳定性有要求宜用插入或冒泡
  2、数据规模不是很大
    (1)完全可以用内存空间,序列杂乱无序,对稳定性没有要求,快速排序,此时要付出log(N)的额外空间。
    (2)序列本身可能有序,对稳定性有要求,空间允许下,宜用归并排序
   3、数据规模很大
        (1)对稳定性有求,则可考虑归并排序。
        (2)对稳定性没要求,可以用快速排序。
  4、数组初始基本有序的时候,宜用直接插入排序,否则,可以用希尔排序。