排序算法能够分为内部排序和外部排序。内部排序是数据记录在内存中进行排序,而外部排序是因排序的数据非常大,一次不能容纳全部的排序记录,在排序过程中须要訪问外存。
常见的内部排序算法有:插入排序、希尔排序、选择排序、冒泡排序、归并排序、高速排序、堆排序、基数排序等。
本文将依次介绍上述八大排序算法。
算法一:插入排序
插入排序示意图
插入排序是一种最简单直观的排序算法,它的工作原理是通过构建有序序列,对于未排序数据。在已排序序列中从后向前扫描。找到相应位置并插入。
算法步骤:
1)将第一待排序序列第一个元素看做一个有序序列,把第二个元素到最后一个元素当成是未排序序列。
2)从头到尾依次扫描未排序序列,将扫描到的每一个元素插入有序序列的适当位置。
(假设待插入的元素与有序序列中的某个元素相等,则将待插入元素插入到相等元素的后面。)
算法二:希尔排序
希尔排序示意图
希尔排序,也称递减增量排序算法,是插入排序的一种更高效的改进版本号。但希尔排序是非稳定排序算法。
希尔排序是基于插入排序的下面两点性质而提出改进方法的:
- 插入排序在对差点儿已经排好序的数据操作时。 效率高, 即能够达到线性排序的效率
- 但插入排序一般来说是低效的, 由于插入排序每次仅仅能将数据移动一位
希尔排序的基本思想是:先将整个待排序的记录序列切割成为若干子序列分别进行直接插入排序。待整个序列中的记录“基本有序”时,再对全体记录进行依次直接插入排序。
算法步骤:
1)选择一个增量序列t1。t2,…,tk,当中ti>tj。tk=1;
2)按增量序列个数k,对序列进行k 趟排序;
3)每趟排序。依据相应的增量ti,将待排序列切割成若干长度为m 的子序列,分别对各子表进行直接插入排序。仅增量因子为1 时。整个序列作为一个表来处理,表长度即为整个序列的长度。
算法三:选择排序
选择排序示意图
选择排序(Selection sort)也是一种简单直观的排序算法。
算法步骤:
1)首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置
2)再从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序序列的末尾。
3)反复第二步,直到全部元素均排序完毕。
算法四:冒泡排序
冒泡排序示意图
冒泡排序(Bubble Sort)也是一种简单直观的排序算法。
它反复地走訪过要排序的数列,一次比較两个元素,假设他们的顺序错误就把他们交换过来。
走訪数列的工作是反复地进行直到没有再须要交换。也就是说该数列已经排序完毕。
这个算法的名字由来是由于越小的元素会经由交换慢慢“浮”到数列的顶端。
算法步骤:
1)比較相邻的元素。假设第一个比第二个大,就交换他们两个。
2)对每一对相邻元素作相同的工作,从開始第一对到结尾的最后一对。这步做完后,最后的元素会是最大的数。
3)针对全部的元素反复以上的步骤。除了最后一个。
4)持续每次对越来越少的元素反复上面的步骤。直到没有不论什么一对数字须要比較。
算法五:归并排序
归并排序示意图
归并排序(Merge sort)是建立在归并操作上的一种有效的排序算法。该算法是採用分治法(Divide and Conquer)的一个非常典型的应用。
算法步骤:
1. 申请空间,使其大小为两个已经排序序列之和,该空间用来存放合并后的序列
2. 设定两个指针,最初位置分别为两个已经排序序列的起始位置
3. 比較两个指针所指向的元素。选择相对小的元素放入到合并空间。并移动指针到下一位置
4. 反复步骤3直到某一指针达到序列尾
5. 将还有一序列剩下的全部元素直接拷贝到合并序列尾
具体介绍:归并排序
算法六:高速排序
高速排序示意图
高速排序是由东尼·霍尔所发展的一种排序算法。在平均状况下,排序 n 个项目要Ο(n log n)次比較。在最坏状况下则须要Ο(n2)次比較,但这样的状况并不常见。
其实,高速排序通常明显比其它Ο(n log n) 算法更快,由于它的内部循环(inner loop)能够在大部分的架构上非常有效率地被实现出来。
高速排序使用分治法(Divide and conquer)策略来把一个串行(list)分为两个子串行(sub-lists)。
算法步骤:
1 从数列中挑出一个元素,称为 “基准”(pivot),
2 又一次排序数列。全部元素比基准值小的摆放在基准前面。全部元素比基准值大的摆在基准的后面(相同的数能够到任一边)。在这个分区退出之后,该基准就处于数列的中间位置。这个称为分区(partition)操作。
3 递归地(recursive)把小于基准值元素的子数列和大于基准值元素的子数列排序。
递归的最底部情形,是数列的大小是零或一,也就是永远都已经被排序好了。尽管一直递归下去,可是这个算法总会退出,由于在每次的迭代(iteration)中,它至少会把一个元素摆到它最后的位置去。
具体介绍:高速排序
算法七:堆排序
堆排序示意图
堆排序(Heapsort)是指利用堆这样的数据结构所设计的一种排序算法。
堆积是一个近似全然二叉树的结构,并同一时候满足堆积的性质:即子结点的键值或索引总是小于(或者大于)它的父节点。
堆排序的平均时间复杂度为Ο(nlogn) 。
算法步骤:
1)创建一个堆H[0..n-1]
2)把堆首(最大值)和堆尾互换
3)把堆的尺寸缩小1,并调用shift_down(0),目的是把新的数组顶端数据调整到相应位置
4) 反复步骤2,直到堆的尺寸为1
具体介绍:堆排序
算法八:基数排序
基数排序是一种非比較型整数排序算法。其原理是将整数按位数切割成不同的数字,然后按每一个位数分别比較。由于整数也能够表达字符串(比方名字或日期)和特定格式的浮点数,所以基数排序也不是仅仅能使用于整数。
说基数排序之前,我们简介桶排序:
算法思想:是将阵列分到有限数量的桶子里。
每一个桶子再个别排序(有可能再使用别的排序算法或是以递回方式继续使用桶排序进行排序)。桶排序是鸽巢排序的一种归纳结果。
当要被排序的阵列内的数值是均匀分配的时候。桶排序使用线性时间(Θ(n))。但桶排序并非 比較排序,他不受到 O(n log n) 下限的影响。
简单来说,就是把数据分组。放在一个个的桶中,然后对每一个桶里面的在进行排序。
比如要对大小为[1..1000]范围内的n个整数A[1..n]排序
首先,能够把桶设为大小为10的范围,具体而言,设集合B[1]存储[1..10]的整数,集合B[2]存储 (10..20]的整数,……集合B[i]存储( (i-1)*10, i*10]的整数。i = 1,2,..100。总共同拥有 100个桶。
然后,对A[1..n]从头到尾扫描一遍。把每一个A[i]放入相应的桶B[j]中。 再对这100个桶中每一个桶里的数字排序。这时可用冒泡,选择。乃至快排,一般来说任 何排序法都能够。
最后。依次输出每一个桶里面的数字。且每一个桶中的数字从小到大输出。这 样就得到全部数字排好序的一个序列了。
假设有n个数字。有m个桶,假设数字是平均分布的,则每一个桶里面平均有n/m个数字。假设
对每一个桶中的数字採用高速排序,那么整个算法的复杂度是
O(n + m * n/m*log(n/m)) = O(n + nlogn – nlogm)
从上式看出,当m接近n的时候。桶排序复杂度接近O(n)
当然,以上复杂度的计算是基于输入的n个数字是平均分布这个假设的。这个假设是非常强的 。实际应用中效果并没有这么好。假设全部的数字都落在同一个桶中,那就退化成一般的排序了。
前面说的几大排序算法 ,大部分时间复杂度都是O(n2),也有部分排序算法时间复杂度是O(nlogn)。而桶式排序却能实现O(n)的时间复杂度。但桶排序的缺点是:
1)首先是空间复杂度比較高,须要的额外开销大。排序有两个数组的空间开销。一个存放待排序数组,一个就是所谓的桶。比方待排序值是从0到m-1。那就须要m个桶,这个桶数组就要至少m个空间。
2)其次待排序的元素都要在一定的范围内等等。
总结
各种排序的稳定性,时间复杂度、空间复杂度、稳定性总结例如以下图:
关于时间复杂度:
(1)平方阶(O(n2))排序
各类简单排序:直接插入、直接选择和冒泡排序;
(2)线性对数阶(O(nlog2n))排序
高速排序、堆排序和归并排序;
(3)O(n1+§))排序,§是介于0和1之间的常数。
希尔排序
(4)线性阶(O(n))排序
基数排序。此外还有桶、箱排序。
关于稳定性:
稳定的排序算法:冒泡排序、插入排序、归并排序和基数排序
不是稳定的排序算法:选择排序、高速排序、希尔排序、堆排序