赞
踩
✨✨所属专栏:数据结构✨✨
✨✨作者主页:嶔某✨✨
排序:所谓排序,就是使一串记录,按照其中的某个或某些关键字的大小,递增或递减的排列起来的操作。
稳定性:假定在待排序的记录序列中,存在多个具有相同的关键字的记录,若经过排序,这些记录的相对次序保持不变,即在原序列中,r[i]=r[j],且r[i]在r[j]之前,而在排序后的序列中,r[i]仍在r[j]之前,则称这种排序算法是稳定的;否则称为不稳定的。
内部排序:数据元素全部放在内存中的排序。
外部排序:数据元素太多不能同时放在内存中,根据排序过程的要求不断地在内外存之间移动数据的排序
function/数据结构-排序算法 · 钦某/c-language-learning - 码云 - 开源中国 (gitee.com)
O(n^2)
- //插入排序
- void InsertSort(int* a, int n)
- {
- for (int i = 0; i < n - 1; i++)
- {
- int end = i;
- int tmp = a[end + 1];
- while (end >= 0)
- {
- if (a[end] > tmp)
- {
- a[end + 1] = a[end];
- end--;
- }
- else
- break;
- }
- a[end + 1] = tmp;
- }
- }
先将整个待排序的记录序列分割成为若干子序列分别进行直接插入排序,具体算法描述:
随着增量因子(gap)的减少,这其实是一个使数组逐渐变有序的过程。那么有个问题,gap如何变化才能使算法得到最大的优化呢?
gap越大,大的数可以越快跳到后面,小的数可以越快跳到前面,越不接近有序;gap越小,跳的越慢,但是越接近有序。当 gap == 1时就相当于插入排序。
这个算法的发明者用的是gap /= 2,有人曾今算过(这里需要很高的数学水平,我还是算了)gap = gap / 3 + 1,为最优解。加一是为了让最后一趟排序的gap为1。
第一趟排序分为gap = n / 3组(忽略+1),每组三个数据,最坏情况就是逆序,向前调整(1+2)次,第一趟就的消耗是 n。第二趟gap = n / 9 组每组 9 个数据,最坏情况调整(1+2+......+7+8)次,第二趟的消耗是 4n。
但是,第二趟以后的每一趟都不是最坏的情况,所以第二趟的消耗到不了4n,具体是多少?这里需要加一些概率的公式
最后一趟gap = 1,直接就是插入排序,消耗是n,根据这个我们大概画出了下图。
最后这个排序的时间复杂度大约为:n^(1.3)
- // 希尔排序
- void ShellSort(int* a, int n)
- {
- int gap = n;
- while (gap > 1)
- {
- gap = gap / 3 + 1;
- for (int i = 0; i < n - gap; i++)
- {
- int end = i;
- int tmp = a[end + gap];
- while (end >= 0)
- {
- if (a[end] > a[end + gap])
- {
- a[end + gap] = a[end];
- end -= gap;
- }
- else
- break;
- }
- a[end + gap] = tmp;
- }
- }
- }
n个记录的直接选择排序可经过n-1趟直接选择排序得到有序结果。具体算法描述如下:
另外我们在遍历时可以同时将无序区中最大的数和最小的数的下标分别记录,将最大数放在无序区的末尾,将最小数放在无序区的开头。
注意这里有个坑 :当一趟排序记录的mini == end时,将max处的数交换到end处,这是end处的数就是最大的数了,之后再将mini处的数交换到start处(这时mini处的数是最大的),这样就没有完成任务。
解决办法是:在交换之前,做一个判断更新mini的值。
O(n^2)
- //选择排序
- void SelectSort(int* a, int n)
- {
- int start = 0;
- int end = n - 1;
- while (end > start)
- {
- int mini = start;
- int maxi = end;
- for (int i = start; i <= end; i++)
- {
- if (a[mini] > a[i])
- mini = i;
- if (a[maxi] < a[i])
- maxi = i;
- }
- if (mini == end)
- {
- Swap(&a[maxi], &a[end]);
- mini = maxi;
- Swap(&a[mini], &a[start]);
- }
- else
- {
- Swap(&a[maxi], &a[end]);
- Swap(&a[mini], &a[start]);
- }
- end--;
- start++;
- }
- }
这里参考下数据结构_堆的代码:function/数据结构-堆 · 钦某/c-language-learning - 码云 - 开源中国 (gitee.com)
O(n*log(n))
- void AdjustDown(int* a, int n, int parent)
- {
- int child = parent * 2 + 1;
- while (child < n)
- {
- if (a[child] < a[child + 1] && child + 1 < n)
- child++;
- if (a[child] > a[parent])
- {
- Swap(&a[child], &a[parent]);
- parent = child;
- child = parent * 2 + 1;
- }
- else
- break;
- }
- }
-
- //堆排序
- void HeapSort(int* a, int n)
- {
- for (int i = (n - 2) / 2; i >= 0; i--)
- AdjustDown(a, n, i);
-
- for (int i = n - 1; i > 0; i--)
- {
- Swap(&a[0], &a[i]);
- AdjustDown(a, i, 0);
- }
- }
O(n^2)
- //冒泡排序
- void BubbleSort(int* a, int n)
- {
- for (int i = n; i > 0; i--)
- {
- int prev = 0;
- int cur = 1;
- int falg = 1;
- while (cur < i)
- {
- if (a[prev] > a[cur])
- {
- falg = 0;
- Swap(&a[prev], &a[cur]);
- }
- prev = cur;
- cur++;
- }
- if (falg == 1)
- break;
- }
- }
快速排序使用分治法来把一个串(list)分为两个子串(sub-lists)。具体算法描述如下:
hoare:
单趟:我们定义一个key = left,右边先走,右边end--找小(比a[key]小),左边begin++找大,都找到了就交换,当begin > end跳出循环,再将a[key]和a[begin]交换。
为什么这里要右边先走?为什么相遇时位置比key小?
左边做key,右边先走,可以保证相遇位置比key小
场景:
L遇R:R先走,停下来,R停下条件是遇到比key小的值,一定比key小,L没有找大的,遇到R停下了
R遇L:R先走,找小,没有找到比key小的,直接跟L相遇了。L停留的位置是上一轮交换的位置,上一轮交换,把比key小的值换到L的位置了
相反:如果让右边做key,左边先走,i可以保证相遇位置比key要大
双指针:
单趟:定义一个prev,一个cur,cur找小,找不到小的prev和cur一起加加,找到了就把cur位置和prev++位置的值交换,prev和cur中间的值都是大的,将大的值一起往后挪。最后prev位置的值一定比key位置的值小,将prev和key位置的值交换。
每次递归分别传begin两侧的区间。
我们知道,递归定义的快排随着区间的越来越小,需要递归的次数越来越多,如果次数很多,每次调用函数都要压栈,有可能导致栈溢出。类似二叉树,最后一次递归占总递归次数的50%,倒数第二次占了25%,倒数第三次占12.5%。如果我们能将这部分递归占用缓解,就能使算法优化。所以当区间小于10的时候,我们调用选择排序。
- void QuickSort(int* a, int left, int right)
- {
- if (left >= right)
- return;
- if (right - left + 1 < 10)
- {
- InsertSort(a + left, right - left + 1);//小区间优化
- return;
- }
-
- int keyi = partsort3(a, left, right);
-
- QuickSort(a, left, keyi - 1);
- QuickSort(a, keyi + 1, right);
- }
当数组已经有序,或者第一个数很小,或者很大时,时间复杂度就会退化为O(n^2),这时我们可以改变key值,从第一个值,中间的值和末尾值,三个值中选出中间的那个作为key值,保证每次的key都接近中间数。除了三数取中,还可以产生随机值来改变基准值。
- int Midofthree(int* a,int x, int y, int z)
- {
- if (a[x] > a[y])
- if (a[x] > a[z])
- if (a[y] > a[z])
- return y;
- else
- return z;
- else
- return y;
- else//a<b
- if (a[x] < a[z])
- if (a[y] < a[z])
- return y;
- else//b>c
- return z;
- else//a>c
- return x;
- }
O(n*log(n))
- //hoare版本
- int partsort1(int* a, int left, int right)
- {
-
- int begin = left, end = right;
- int x = Midofthree(a, left, right, (right + left) / 2);
- Swap(&a[x], &a[left]);
- int key = left;
- while (begin < end)
- {
- while (begin < end)
- {
- if (a[end] < a[key])
- break;
- end--;
- }
- while (begin < end)
- {
- if (a[begin] > a[key])
- break;
- begin++;
- }
- Swap(&a[begin], &a[end]);
- }
- Swap(&a[key], &a[begin]);
- return begin;
- }
- //双指针版本
- int partsort2(int* a, int left, int right)
- {
- int x = Midofthree(a, left, right, (right + left) / 2);
- Swap(&a[x], &a[left]);
- int keyi = left;
- int prev = left;
- int cur = prev + 1;
- while (cur <= right)
- {
- if (a[cur] < a[keyi] && ++prev != cur)
- Swap(&a[cur], &a[prev]);
-
- cur++;
- }
- Swap(&a[prev],&a[keyi]);
- return prev;
- }
- //挖坑版本
- int partsort3(int* a, int left, int right)
- {
- int x = Midofthree(a, left, right, (right + left) / 2);
- Swap(&a[x], &a[left]);
- int key = a[left];
- int pit = left;
- int begin = left;
- int end = right;
- while (begin < end)
- {
- while (a[end] >= key && begin < end)
- end--;
-
- a[pit] = a[end];
- pit = end;
-
- while (a[begin] <= key && begin < end)
- begin++;
-
- a[pit] = a[begin];
- pit = begin;
- }
- a[pit] = key;
- return pit;
- }
- void QuickSort(int* a, int left, int right)
- {
- if (left >= right)
- return;
- if (right - left + 1 < 10)
- {
- InsertSort(a + left, right - left + 1);//小区间优化
- return;
- }
-
- int keyi = partsort1(a, left, right);
-
- QuickSort(a, left, keyi - 1);
- QuickSort(a, keyi + 1, right);
- }
这里不一定要用栈,也可以用队列来存储,如果你想,甚至可以用顺序表。栈只是为了更好的模拟递归的过程。
function/数据结构_栈 · 钦某/c-language-learning - 码云 - 开源中国 (gitee.com)
- void QuickSortNonR(int* a, int left, int right)
- {
- ST s;
- STInit(&s);
- STPush(&s, right);
- STPush(&s, left);
-
- while (!STEmpty(&s))
- {
- int begin = STTop(&s);
- STPop(&s);
- int end = STTop(&s);
- STPop(&s);
-
- int mid = partsort1(a, begin, end);
- if (mid + 1 < end)//注意这里需判断
- {
- STPush(&s, end);
- STPush(&s, mid + 1);
- }
- if (begin < mid - 1)//注意这里需判断
- {
- STPush(&s, mid - 1);
- STPush(&s, begin);
- }
- }
- }
归并排序是建立在归并操作上的一种有效的排序算法。该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为2-路归并。
O(n*log(n))
递归:
- void _MergeSort(int* a, int* tmp, int left, int right)
- {
- if (left >= right)
- return;
- int mid = (left + right) / 2;
- _MergeSort(a, tmp, left, mid);
- _MergeSort(a, tmp, mid + 1, right);
-
- int begin1 = left, end1 = mid;
- int begin2 = mid + 1, end2 = right;
- int i = left;
- while (begin1 <= end1 && begin2 <= end2)
- {
- if(a[begin1] < a[begin2])
- tmp[i++] = a[begin1++];
- else
- tmp[i++] = a[begin2++];
- }
- while (begin1 <= end1)
- tmp[i++] = a[begin1++];
-
- while (begin2 <= end2)
- tmp[i++] = a[begin2++];
-
- memcpy(a + left, tmp + left, sizeof(int) * (right - left + 1));
- }
-
-
- void MergeSort(int* a, int n)
- {
- int* tmp = (int*)malloc(sizeof(int) * n);
- if (tmp == NULL)
- {
- perror("malloc is fail");
- return;
- }
- _MergeSort(a, tmp, 0, n - 1);
-
- free(tmp);
- tmp = NULL;
- }
非递归
- void MergeSortNonR(int* a, int n)
- {
- int* tmp = (int*)malloc(sizeof(int) * n);
- if (tmp == NULL)
- {
- perror("malloc is fail");
- return;
- }
- int gap = 1;
- while (gap < n)
- {
- for (int i = 0; i < n; i += 2 * gap)
- {
- int begin1 = i, end1 = i + gap - 1;
- int begin2 = i + gap, end2 = i + 2 * gap - 1;
- int j = i;
- if (begin2 >= n)
- break;
- if (end2 >= n)
- end2 = n - 1;
- while (begin1 <= end1 && begin2 <= end2)
- {
- if (a[begin1] <= a[begin2])
- tmp[j++] = a[begin1++];
- else
- tmp[j++] = a[begin2++];
- }
- while (begin1 <= end1)
- tmp[j++] = a[begin1++];
-
- while (begin2 <= end2)
- tmp[j++] = a[begin2++];
-
- memcpy(a + i, tmp + i, sizeof(int) * (end2 - i + 1));
- }
- gap *= 2;
- }
- free(tmp);
- tmp = NULL;
- }
计数排序不是基于比较的排序算法,其核心在于将输入的数据值转化为键存储在额外开辟的数组空间中。 作为一种线性时间复杂度的排序,计数排序要求输入的数据必须是有确定范围的整数。这就导致了这个排序算法
在理想情况下,这个排序算法的时间复杂度能达到O(n),非常的快。
- void CountSort(int* a, int n)
- {
- int min = a[0];
- int max = a[0];
- for (int i = 0; i < n; i++)
- {
- if (a[i] > max)
- max = a[i];
- if (a[i] < min)
- min = a[i];
- }
- int range = max - min + 1;
- int* x = (int*)calloc(range, sizeof(int));
- if (x == NULL)
- {
- perror("calloc is fail");
- return;
- }
- for (int i = 0; i < n; i++)
- x[a[i] - min]++;
-
- int j = 0;
- for (int i = 0; i < n; i++)
- while (x[i]--)
- a[j++] = i + min;
-
- free(x);
- }
上面的排序分别对同样的十万个随机数进行排序,所消耗的时间如下图:(ps:仅供参考)
本期博客到这里就结束了,如果有什么错误,欢迎指出,如果对你有帮助,请点个赞,谢谢!
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。