当前位置:   article > 正文

数据排序之旅

数据排序之旅

1、排序的概念

排序:所谓排序,就是使一串记录,按照其中的某个或某些关键字的大小,递增或递减的排列起来的操作。

稳定性:假定在待排序的记录序列中,存在多个具有相同的关键字的记录,若经过排序,这些记录的相对次序保持不变,即在原序列中,r[i]=r[j],且r[i]在r[j]之前,而在排序后的序列中,r[i]仍在r[j]之前,则称这种排序算法是稳定的;否则称为不稳定的。

内部排序数据元素全部放在内存中的排序。

外部排序:数据元素太多不能同时放在内存中,根据排序过程的要求不断地在内外存之间移动数据的排序。

平常我们网购的时候,我们有时候会看看销售量最多的是商家或者评论最多的商家等等,这里就需要用到排序。

常见的排序算法:

2、算法实现

2.1插入排序

  1. //插入排序 时间:O(N^2)(最好O(N))
  2. void InsertSort(int* a, int n)
  3. {
  4. for (int i = 0; i < n - 1; i++)
  5. {
  6. int end = i;
  7. int tmp = a[end + 1];
  8. while (end >= 0)
  9. {
  10. if (a[end] > a[end + 1])
  11. {
  12. Swap(&a[end], &a[end + 1]);
  13. end--;
  14. }
  15. else
  16. {
  17. break;
  18. }
  19. }
  20. a[end + 1] = tmp;
  21. }
  22. }
 2.2希尔排序

希尔排序就是在插入排序的基础上增加了预排序,目的就是使数组比原先有序一点

预排序,就是设一个gap为大于1的值(不能打过数组长度),先让数据每隔gap的距离进行排序,

然后让不断gap减小,等gap为1时,就是插入排序了。

  1. //希尔排序 时间:O(N^1.3)
  2. void ShellSort(int* a, int n)
  3. {
  4. //预排序
  5. int gap = n;
  6. while (gap > 1)
  7. {
  8. gap = gap / 3 + 1;
  9. for (int i = 0; i < n - gap; i += gap)
  10. {
  11. int end = i;
  12. int tmp = a[end + gap];
  13. while (end >= 0)
  14. {
  15. if (a[end] > a[end + gap])
  16. {
  17. Swap(&a[end], &a[end + gap]);
  18. end -= gap;
  19. }
  20. else
  21. {
  22. break;
  23. }
  24. }
  25. a[end + gap] = tmp;
  26. }
  27. }
  28. }

 希尔排序的时间复杂度计算涉及的数学知识比较复杂,记住O(N^1.3)就行。

2.3选择排序

选择排序就是找大和找小,最小放到第一位置和最大放到最后位置,然后设数据来记录数组的长度,减小数组长度。

  1. //时间复杂度O(N^2)
  2. void SelectSort(int*a,int n)
  3. {
  4. int begin=0;
  5. int end=n-1;
  6. while(begin<end)
  7. {
  8. int min=begin,max=begin;
  9. for(int i=begin+1;i<=end;i++)
  10. {
  11. if(a[i]<a[min])
  12. min=i;
  13. if(a[i]>a[max])
  14. max=i;
  15. }
  16. Swap(&a[begin],&a[min]);
  17. if(max==begin)
  18. max=min;
  19. Swap(&a[begin],&a[max]);
  20. begin++;
  21. end--;
  22. }
  23. }
 2.4堆排序
  1. //堆排序 时间:O(N * log N)
  2. void AdjustDown(int* a, int n, int parent)
  3. {
  4. int child = 2 * parent + 1;
  5. while (child < n)
  6. {
  7. if (child + 1 < n && a[child] < a[child + 1])
  8. {
  9. child++;
  10. }
  11. if (a[child] > a[parent])
  12. {
  13. Swap(&a[child], &a[parent]);
  14. parent = child;
  15. child = 2 * parent + 1;
  16. }
  17. else
  18. {
  19. break;
  20. }
  21. }
  22. }
  23. void HeapSort(int* a, int n)
  24. {
  25. for (int i = (n - 1 - 1) / 2; i >= 0; i--)
  26. {
  27. AdjustDown(a, n, i);
  28. }
  29. int end = n - 1;
  30. while (end > 0)
  31. {
  32. Swap(&a[0], &a[end]);
  33. AdjustDown(a, end, 0);
  34. end--;
  35. }
  36. }
 2.5冒泡排序

只具有教学意义的排序。核心思想就是两两交换。

  1. //时间复杂度O(N^2)
  2. void BubbleSort(int* a, int n)
  3. {
  4. for (int j = 0; j < n; j++)
  5. {
  6. for (int i = 1; i < n - j; i++)
  7. {
  8. if (a[i] < a[i - 1])
  9. Swap(&a[i], &a[i - 1]);
  10. }
  11. }
  12. }
 2.6快排
2.6.1Hoare版

这个版本的快排就是令两个数据分别指向数组的两端,在令key为数组其中一个元素的值,使key的左边都小于对应key位置的值,key右边的值都大于key位置的值,key对应的值就已经排好了,然后数组就被分为两个小数组,这跟二叉树有点相似,直接使用递归。

  1. void QuickSort01(int* a, int left, int right)
  2. {
  3. if (left >= right)
  4. return;
  5. int key = left;
  6. int begin = left, end = right;
  7. while (begin < end)
  8. {
  9. while (begin < end && a[end] >= a[key])
  10. {
  11. end--;
  12. }
  13. while (begin < end && a[begin] <= a[key])
  14. {
  15. begin++;
  16. }
  17. Swap(&a[begin], &a[end]);
  18. }
  19. Swap(&a[begin], &a[key]);
  20. key = begin;
  21. QuickSort01(a, left, key - 1);
  22. QuickSort01(a, key + 1, right);
  23. }

当有很多数据时,我们希望key对应的值比较适中,不希望出现数组分半后,还是只有一个数组。

 为了更快提高效率,我们在数组长度为10时,使用其他排序算法来实现,减少递归次数。

 优化后:

  1. int GetMid(int* a, int left, int right)
  2. {
  3. int mid = (left + right) / 2;
  4. if (a[left] < a[mid])
  5. {
  6. if (a[mid] < a[right])
  7. {
  8. return mid;
  9. }
  10. else if (a[left] < a[right])
  11. {
  12. return right;
  13. }
  14. else
  15. {
  16. return left;
  17. }
  18. }
  19. else
  20. {
  21. if (a[mid] > a[right])
  22. {
  23. return mid;
  24. }
  25. else if (a[left] > a[right])
  26. {
  27. return right;
  28. }
  29. else
  30. {
  31. return left;
  32. }
  33. }
  34. }
  35. void QuickSort01(int* a, int left, int right)
  36. {
  37. if (left >= right)
  38. return;
  39. //最小区间优化
  40. if (right - left + 1 <= 10)
  41. {
  42. InsertSort(a+left, right - left + 1);
  43. }
  44. else
  45. {
  46. //三数取中
  47. int mid = GetMid(a, left, right);
  48. Swap(&a[left], &a[mid]);
  49. int key = left;
  50. int begin = left, end = right;
  51. while (begin < end)
  52. {
  53. while (begin < end && a[end] >= a[key])
  54. {
  55. end--;
  56. }
  57. while (begin < end && a[begin] <= a[key])
  58. {
  59. begin++;
  60. }
  61. Swap(&a[begin], &a[end]);
  62. }
  63. Swap(&a[begin], &a[key]);
  64. key = begin;
  65. QuickSort01(a, left, key - 1);
  66. QuickSort01(a, key + 1, right);
  67. }
  68. }

 为什么要右边先走?

会出现一种情况,L找大停下了,R没有找到小,与L相遇了,与key互换位置后,逻辑就变了

左边作key,可保证相遇位置比key小,右边作key,则相遇位置比key大。

左边作key:L遇R,R先走,停下来,R的值比key小,L没有遇到大的,遇R停下了。

R遇L,R先走,找小,没有,遇L停下了。L停留的位置是上一轮交换的位置,上一轮交换把比key小的值,换到了L的位置。 

 2.6.2挖坑法

没有效率提升,不用分析,左边作key,右边先走的文体,也不用分析相遇位置为什么就是比key小的问题。

  1. void QuickSort02(int* a, int left,int right)
  2. {
  3. if (left >= right)
  4. return;
  5. int key = a[left];
  6. int begin = left, end = right;
  7. while (begin < end)
  8. {
  9. while ( begin < end &&a[end] >= key)
  10. {
  11. end--;
  12. }
  13. a[begin] = a[end];
  14. while (begin < end && a[begin] <= key)
  15. {
  16. begin++;
  17. }
  18. a[end] = a[begin];
  19. }
  20. a[begin] = key;
  21. QuickSort02(a, left, begin-1);
  22. QuickSort02(a, begin+1, right);
  23. }
2.6.3前后指针法

  1. //前后指针法
  2. int _QuickSort03(int* a, int left, int right)
  3. {
  4. int mid = GetMid(a, left, right);
  5. Swap(&a[left], &a[mid]);
  6. int key = left;
  7. int prev = left;
  8. int pcur = prev + 1;
  9. while (pcur <= right)
  10. {
  11. if (a[pcur] < a[key] && ++prev != pcur)
  12. Swap(&a[prev], &a[pcur]);
  13. pcur++;
  14. }
  15. Swap(&a[key], &a[prev]);
  16. return prev;
  17. }
  18. void QuickSort03(int* a, int left, int right)
  19. {
  20. if (left >= right)
  21. return;
  22. int key = _QuickSort03(a, left, right);
  23. QuickSort03(a, left, key - 1);
  24. QuickSort03(a, key + 1, right);
  25. }
2.6.4非递归版

非递归,要用栈来帮忙实现。再借用一下前后指针法中子函数。

  1. void QuickSortNonR(int* a, int left,int right)
  2. {
  3. ST st;
  4. STInit(&st);
  5. STPush(&st, right);
  6. STPush(&st, left);
  7. while (!STEmpty(&st))
  8. {
  9. int begin = STTop(&st);
  10. STPop(&st);
  11. int end = STTop(&st);
  12. STPop(&st);
  13. int key= _QuickSort03(a, begin, end);
  14. if (key + 1 < end)
  15. {
  16. STPush(&st, end);
  17. STPush(&st, key + 1);
  18. }
  19. if (begin < key - 1)
  20. {
  21. STPush(&st, key - 1);
  22. STPush(&st, begin);
  23. }
  24. }
  25. STDestroy(&st);
  26. }
2.7归并排序 
2.7.1递归版

归并排序的原理就是相当于把两个有序数组合成一个有序数组,而归并就是把一个数组分为很多小数组再进行排序。

  1. /归并排序
  2. //时间复杂度:O(N*logN)
  3. //空间复杂度:O(N)
  4. void _MergeSort(int* a, int* tmp, int begin, int end)
  5. {
  6. if (begin >= end)
  7. return;
  8. int mid = (begin + end) / 2;
  9. _MergeSort(a,tmp,begin,mid);
  10. _MergeSort(a,tmp,mid+1,end);
  11. int begin1 = begin, end1 = mid;
  12. int begin2 = mid + 1, end2 = end;
  13. int i = begin;
  14. while (begin1 <= end1 && begin2 <= end2)
  15. {
  16. if (a[begin1] < a[begin2])
  17. {
  18. tmp[i++] = a[begin1++];
  19. }
  20. else
  21. {
  22. tmp[i++] = a[begin2++];
  23. }
  24. }
  25. while (begin1 <= end1)
  26. {
  27. tmp[i++] = a[begin1++];
  28. }
  29. while (begin2 <= end2)
  30. {
  31. tmp[i++] = a[begin2++];
  32. }
  33. memcpy(a+begin, tmp+begin,sizeof(int)*(end-begin+1));
  34. }
  35. void MergeSort(int*a,int n)
  36. {
  37. int* tmp = (int*)malloc(sizeof(int) * n);
  38. if (tmp == NULL)
  39. {
  40. perror("malloc fail");
  41. return;
  42. }
  43. _MergeSort(a, tmp, 0, n-1);
  44. free(tmp);
  45. tmp = NULL;
  46. }
2.7.2非递归版
  1. void MergeSortNonR(int* a, int n)
  2. {
  3. int* tmp = (int*)malloc(sizeof(int) * n);
  4. if (tmp == NULL)
  5. {
  6. perror("malloc fail");
  7. return;
  8. }
  9. int gap = 1;
  10. while (gap < n)
  11. {
  12. for (int i = 0; i < n; i += 2 * gap)
  13. {
  14. int begin1 = i, end1 = i + gap-1;
  15. int begin2 = i + gap, end2 = i + 2 * gap - 1;
  16. //第二组越界不存在,这一组就不需要归并
  17. if (begin2 >= n)
  18. {
  19. break;
  20. }
  21. //第二组begin2没越界,end2越界了,需要纠正一下,继续归并
  22. if (end2 >= n)
  23. {
  24. end2 = n - 1;
  25. }
  26. int j = i;
  27. while (begin1 <= end1 && begin2 <= end2)
  28. {
  29. if (a[begin1] < a[begin2])
  30. {
  31. tmp[j++] = a[begin1++];
  32. }
  33. else
  34. {
  35. tmp[j++] = a[begin2++];
  36. }
  37. }
  38. while (begin1 <= end1)
  39. {
  40. tmp[j++] = a[begin1++];
  41. }
  42. while (begin2 <= end2)
  43. {
  44. tmp[j++] = a[begin2++];
  45. }
  46. memcpy(a + i, tmp + i, sizeof(int) * (end2-i+1));
  47. }
  48. gap *= 2;
  49. }
  50. free(tmp);
  51. tmp = NULL;
  52. }
2.8计数排序
  1. //计数排序
  2. //时间:O(N+range)
  3. //只适合整数/适合范围集中
  4. //空间:O(range)
  5. void CountSort(int* a, int n)
  6. {
  7. int min = a[0];
  8. int max = a[0];
  9. for (int i = 0; i < n; i++)
  10. {
  11. if (a[i] > max)
  12. {
  13. max = a[i];
  14. }
  15. if (a[i] < min)
  16. {
  17. min = a[i];
  18. }
  19. }
  20. int range = max - min + 1;
  21. int* count = (int*)calloc(range, sizeof(int));
  22. if (count == NULL)
  23. {
  24. perror("calloc fail");
  25. return;
  26. }
  27. for (int i = 0; i < n; i++)
  28. {
  29. count[a[i] - min]++;
  30. }
  31. int i = 0;
  32. for (int j = 0; j < range; j++)
  33. {
  34. while (count[j]--)
  35. {
  36. a[i++] = j + min;
  37. }
  38. }
  39. free(count);
  40. }

3.排序性能测试

  1. void TestOP()
  2. {
  3. srand(time(0));
  4. const int N = 100000;
  5. int* a1 = (int*)malloc(sizeof(int) * N);
  6. int* a2 = (int*)malloc(sizeof(int) * N);
  7. int* a3 = (int*)malloc(sizeof(int) * N);
  8. int* a4 = (int*)malloc(sizeof(int) * N);
  9. int* a5 = (int*)malloc(sizeof(int) * N);
  10. int* a6 = (int*)malloc(sizeof(int) * N);
  11. int* a7 = (int*)malloc(sizeof(int) * N);
  12. for (int i = 0; i < N; i++)
  13. {
  14. a1[i] = rand()+i;
  15. a2[i] = a1[i];
  16. a3[i] = a1[i];
  17. a4[i] = a1[i];
  18. a5[i] = a1[i];
  19. a6[i] = a1[i];
  20. a7[i] = a1[i];
  21. }
  22. int begin1 = clock();
  23. InsertSort(a1, N);
  24. int end1 = clock();
  25. int begin2 = clock();
  26. ShellSort(a2, N);
  27. int end2 = clock();
  28. int begin3 = clock();
  29. SelectSort(a3, N);
  30. int end3 = clock();
  31. int begin4 = clock();
  32. HeapSort(a4, N);
  33. int end4 = clock();
  34. int begin5 = clock();
  35. QuickSort(a5,0, N-1);
  36. int end5 = clock();
  37. int begin6 = clock();
  38. MergeSort(a6, N);
  39. int end6 = clock();
  40. int begin7= clock();
  41. BubbleSort(a7, N);
  42. int end7 = clock();
  43. printf("InsertSort:%d\n", end1 - begin1);
  44. printf("ShellSort:%d\n", end2 - begin2);
  45. printf("SelectSort:%d\n", end3 - begin3);
  46. printf("HeapSort:%d\n", end4 - begin4);
  47. printf("QuickSort:%d\n", end5 - begin5);
  48. printf("MergeSort:%d\n", end6 - begin6);
  49. printf("BubbleSort:%d\n", end7 - begin7);
  50. free(a1);
  51. free(a2);
  52. free(a3);
  53. free(a4);
  54. free(a5);
  55. free(a6);
  56. free(a7);
  57. }

我们随机创建十万个数 ,看看那个排序快。

首先我们看看插入,希尔,堆,选择和冒泡:

 这样来看冒泡和选择太慢了,与其他排序不是一个桌子的。

把选择,冒泡和插入和希尔去掉,我们来比较一下快排。

这么一比,hoare版本和挖坑法的快排性能好。

再看看归并排序:

 

 两种都差不多。

时间复杂度空间复杂度稳定性
插入排序O(N^2)O(1)稳定
希尔排序O(N^1.3)O(1)不稳定
选择排序O(N^2)O(1)不稳定
堆排序O(N*logN)O(1)不稳定
冒泡排序O(N^2)O(1)稳定
快排序O(N*logN)O(logN)不稳定
归并排序O(N*logN)O(N)稳定

 完

本文内容由网友自发贡献,转载请注明出处:https://www.wpsshop.cn/w/小舞很执着/article/detail/955134
推荐阅读
相关标签
  

闽ICP备14008679号