当前位置:   article > 正文

数据结构:大顶堆、小顶堆

小顶堆

前言:

       堆是其中一种非常重要且实用的数据结构。堆可以用于实现优先队列,进行堆排序,以及解决各种与查找和排序相关的问题。本文将深入探讨两种常见的堆结构:大顶堆和小顶堆,并通过 C++ 语言展示如何实现和使用它们。

1. 什么是大顶堆和小顶堆?

前提:

        堆是一种完全二叉树。完全二叉树的定义:所有节点从上往下,从左往右的依次排列,不能有空位置,是为完全二叉树

        下面是完全二叉树和不完全二叉树的示意图:

在这里插入图片描述

大顶堆:

        根节点(堆顶元素)是所有节点中的最大值(父节点都大于左右子节点)。大顶堆常用于实现优先队列,且可用于构建堆排序算法。

小顶堆:

        小顶堆中的根节点是所有节点中的最小值(父节点都小于左右子节点)。小顶堆常用于问题如:查找流中的前 K 个最小元素。

示意图:
在这里插入图片描述

2. 大小顶堆的底层实现

        一般来说,定义二叉树都是定义一个节点类,节点类中包含本节点的数据元素和两个节点指针,分别指向左右子节点,通过这两个节点指针将整个树节点连起来。

代码:

  1. template <typename Type>
  2. class BstNode
  3. {
  4. public:
  5. BstNode():leftChild(nullptr), rightChild(nullptr){};
  6. BstNode(Type _content) :leftChild(nullptr), rightChild(nullptr)
  7. {
  8. content = _content;
  9. };
  10. private:
  11. Type content;
  12. BstNode<Type> *leftChild;
  13. BstNode<Type> *rightChild;
  14. };

         实际上,堆一般用数组表示,如下图。究其原因,我认为的是通过节点类的方式占用的内存空间多,多加了两个指针。并且当我们做插入操作向上渗透时,需要找到节点的父节点(文章后面会详细描述),这样实际的节点应该再加一个标识父节点的指针。这样实际是多了3个指针。

图示: 

3. 代码实现小顶堆

3.1 定义小顶堆类

  1. template<typename T>
  2. class MinHeap
  3. {
  4. public:
  5. MinHeap(int _maxsize = 10);
  6. ~MinHeap();
  7. void Push(T _data);//插入数据
  8. void Pop();//删除堆顶数据
  9. T& Top();//获取堆顶数据
  10. void ShowHeap();//打印堆
  11. private:
  12. T *heap;
  13. int MaxSize;//堆数组的最大大小
  14. int currentSize;//堆数组当前大小
  15. };

3.2 构造函数

  1. template<typename T>
  2. MinHeap<T>::MinHeap(int _maxsize)
  3. :MaxSize(_maxsize)
  4. {
  5. try{
  6. if (MaxSize < 1)
  7. throw "Error Size,< 1";
  8. heap = new T[MaxSize];
  9. currentSize = 0;
  10. }
  11. catch (const char* cp){
  12. //1.提示用户错误信息,提示用户重新输入
  13. int size = 0;
  14. while (size < 1){
  15. std::cout << cp << std::endl;
  16. std::cout << "please Enter size again" << std::endl;
  17. std::cin >> size;
  18. }
  19. //2.初始化MinHeap类的数据成员
  20. MaxSize = size;
  21. heap = new T[MaxSize];
  22. currentSize = 0;
  23. }
  24. }

        解释:这里我做了异常处理。当堆数组的大小MaxSize<1时,抛出异常,并提示输入大小,一直到输入的大小>=1。

3.3 插入

插入方法:
  1. 首先将需插入的数据放在堆的最后一个位置
  2. 然后依次和父节点比较,比父节点小就和父节点交换,再向上比较;比父节点大就停止比较。

比如我按20->30->15->10->9->8->12依次插入,插入示意图如下:

在这里插入图片描述

代码入下:
  1. template<typename T>
  2. void MinHeap<T>::Push(T _data)
  3. {
  4. if (currentSize == MaxSize){
  5. //堆满了,扩容
  6. }
  7. //将数据放入最后一个位置
  8. //注意:currentSize和数组索引值差1:
  9. //比如currentSize = 3,对应的数组索引为2
  10. //所以,当currentSize=3时,即堆数组有3个数据时,新插入的数据应在数组索引3上
  11. heap[currentSize] = _data;
  12. int sonIndex = currentSize;//最后一个位置的数组索引
  13. int fatherIndex = (currentSize - 1)/ 2;//最后一个位置的父节点的数组索引
  14. while (sonIndex > 0){
  15. if (heap[sonIndex] < heap[fatherIndex]){
  16. std::swap(heap[sonIndex], heap[fatherIndex]);//交换父子节点元素
  17. //继续向上
  18. sonIndex = fatherIndex;
  19. fatherIndex = (fatherIndex - 1) / 2;
  20. }
  21. else break;
  22. }
  23. currentSize++;//堆数组当前大小加1
  24. }

        currentSize表示的是当前堆数组有多少个元素。如下图,比如currentSize = 3,表明当前有3个数据。再push一个数据时,在数组的存储的位置刚好是索引3。

示意图:

        如下图,节点7和节点4的父节点都是节点2。节点7的索引为1,节点4索引为2,节点2的索引为0,所以计算7 4 节点的父节点公式为==(索引-1)/2==,其他节点也一样。这里你不从数组索引角度,从树的层序角度也是一样,只不过公式要变为:层序号/2。

扩大堆数组容量
        在上述代码中,当currentSize == MaxSize时,表示堆数组已经满了,此时我们需要扩大数组的大小,这和循环队列和顺序栈是一样的原理。
循环队列:带你一步步用C++实现循环队列
顺序栈:用C++实现顺序栈(以数组为底层数据结构,可自动扩容。
代码如下:

  1. template<typename T>
  2. void MinHeap<T>::ChangeSize()
  3. {
  4. int size = MaxSize * 2;//堆数组容量扩大1倍
  5. T* tmp = new T[size];//1.申请一块原来2倍大小的空间。
  6. std::copy(heap, heap + MaxSize, tmp);//2.将栈中的数据赋值到新的内存空间
  7. delete[] heap;//3.删除老的空间
  8. heap = tmp;//4.heap指向新地址
  9. MaxSize = size;//5.改变MaxSize
  10. }

        注意:由于C++编译器是不检查数组越界的,所以,即使程序员不自己扩容,使用越界的索引程序也不会报错,只是它会继续向下占用一块内存。程序员必须注意数组越界的问题。

3.4 删除

删除步骤:
  1. 首先把堆顶元素删除
  2. 接着把堆的最后一个数据放在堆顶
  3. 最后把堆顶数据向下渗透,不断的和两个子节点比较,若父节点不比两个子节点的任意一个小,取两个子节点中小的和父节点交换,一直这样下去,直到父节点比左右子节点都小。
示意图:

在这里插入图片描述

代码如下:
  1. template<typename T>
  2. void MinHeap<T>::Pop()
  3. {
  4. if (currentSize == 0){
  5. std::cout << "Error!The heap is empty,Invalid operation." << std::endl;
  6. return;
  7. }
  8. heap[0] = heap[--currentSize];//删除堆顶,并将最后一个数据放在堆顶
  9. int fatherIndex = 0;//父节点索引为堆顶
  10. int leftSonIndex = fatherIndex * 2 + 1;//获得左子节点索引
  11. int RightSonIndex = leftSonIndex + 1;//获得右子节点索引
  12. //确认循环条件
  13. while (leftSonIndex < currentSize ){
  14. /**1.找左右子节点中最小值的数组索引***/
  15. int minIndex;
  16. //如果RightSonIndex < currentSize,表明fatherIndex有右子节点
  17. if (RightSonIndex < currentSize){
  18. minIndex = heap[leftSonIndex] > heap[RightSonIndex] ? RightSonIndex: leftSonIndex;
  19. }
  20. else{
  21. minIndex = leftSonIndex;
  22. }
  23. /**2.父节点大就交换,否则退出循环***/
  24. if (heap[fatherIndex] > heap[minIndex])
  25. std::swap(heap[fatherIndex], heap[minIndex]);
  26. else break;
  27. fatherIndex = minIndex;
  28. leftSonIndex = fatherIndex * 2 + 1;
  29. RightSonIndex = leftSonIndex + 1;
  30. }
  31. }

对于while循环条件说明:
        使用左子节点leftSonIndex和currentSize比较,不要使用右子节点RightSonIndex,因为右子节点RightSonIndex可能没有。当然,你也可以使用父节点fatherIndex和currentSize比较:fatherIndex<currentSize/2。
验证循环的真确性,只需考虑以下三种情况,大家可自行验证。


析构函数:
        析构只需将申请的内存释放即可。

  1. template<typename T>
  2. MinHeap<T>::~MinHeap()
  3. {
  4. delete []heap;
  5. }

4. 代码实现大顶堆

        原理和小顶堆一样,直接给出代码

  1. #ifndef _MAX_HEAP_H
  2. #define _MAX_HEAP_H
  3. template<typename T>
  4. class MaxHeap
  5. {
  6. public:
  7. MaxHeap(int _maxsize = 10);
  8. ~MaxHeap();
  9. void Push(T _data);//插入数据
  10. void Pop();//删除堆顶数据
  11. T& Top();//获取堆顶数据
  12. void ShowHeap();
  13. private:
  14. T *heap;
  15. int MaxSize;//堆数组的最大大小
  16. int currentSize;//堆数组当前大小
  17. void ChangeSize();//扩大堆数组的大小
  18. };
  19. template<typename T>
  20. MaxHeap<T>::MaxHeap(int _maxsize)
  21. :MaxSize(_maxsize)
  22. {
  23. try{
  24. if (MaxSize < 1)
  25. throw "Error Size,< 1";
  26. heap = new T[MaxSize];
  27. currentSize = 0;
  28. }
  29. catch (const char* cp){
  30. //1.提示用户错误信息,提示用户重新输入
  31. int size = 0;
  32. while (size < 1){
  33. std::cout << cp << std::endl;
  34. std::cout << "please Enter size again" << std::endl;
  35. std::cin >> size;
  36. }
  37. //2.初始化MaxHeap类的数据成员
  38. MaxSize = size;
  39. heap = new T[MaxSize];
  40. currentSize = 0;
  41. }
  42. }
  43. template<typename T>
  44. MaxHeap<T>::~MaxHeap()
  45. {
  46. delete[]heap;
  47. }
  48. template<typename T>
  49. void MaxHeap<T>::Push(T _data)
  50. {
  51. if (currentSize == MaxSize){
  52. //堆满了,扩容
  53. ChangeSize();
  54. }
  55. //将数据放入最后一个位置
  56. //注意:currentSize和数组索引值差1:
  57. //比如currentSize = 3,对应的数组索引为2
  58. //所以,当currentSize=3时,即堆数组有3个数据时,新插入的数据应在数组索引3上
  59. heap[currentSize] = _data;
  60. int sonIndex = currentSize;//最后一个位置的数组索引
  61. int fatherIndex = (currentSize - 1) / 2;//最后一个位置的父节点的数组索引
  62. while (sonIndex > 0){
  63. if (heap[sonIndex] > heap[fatherIndex]){
  64. std::swap(heap[sonIndex], heap[fatherIndex]);
  65. //继续向上
  66. sonIndex = fatherIndex;
  67. fatherIndex = (fatherIndex - 1) / 2;
  68. }
  69. else break;
  70. }
  71. currentSize++;
  72. }
  73. template<typename T>
  74. void MaxHeap<T>::Pop()
  75. {
  76. if (currentSize == 0){
  77. std::cout << "Error!The heap is empty,Invalid operation." << std::endl;
  78. return;
  79. }
  80. heap[0] = heap[--currentSize];//删除堆顶,并将最后一个数据放在堆顶
  81. int fatherIndex = 0;//父节点索引为堆顶
  82. int leftSonIndex = fatherIndex * 2 + 1;//获得左子节点索引
  83. int RightSonIndex = leftSonIndex + 1;//获得右子节点索引
  84. //确认循环条件
  85. while (leftSonIndex < currentSize){
  86. /**1.找左右子节点中最小值的数组索引***/
  87. int maxIndex;
  88. //如果RightSonIndex < currentSize,表明fatherIndex有右子节点
  89. if (RightSonIndex < currentSize){
  90. maxIndex = heap[leftSonIndex] < heap[RightSonIndex] ? RightSonIndex : leftSonIndex;
  91. }
  92. else{
  93. maxIndex = leftSonIndex;
  94. }
  95. /**2.父节点小就交换,否则退出循环***/
  96. if (heap[fatherIndex] < heap[maxIndex])
  97. std::swap(heap[fatherIndex], heap[maxIndex]);
  98. else break;
  99. fatherIndex = maxIndex;
  100. leftSonIndex = fatherIndex * 2 + 1;
  101. RightSonIndex = leftSonIndex + 1;
  102. }
  103. }
  104. template<typename T>
  105. T& MaxHeap<T>::Top()
  106. {
  107. if (currentSize == 0)
  108. throw "Error.The heap is empty,there is not data.";
  109. return heap[0];
  110. }
  111. template<typename T>
  112. void MaxHeap<T>::ChangeSize()
  113. {
  114. int size = MaxSize * 2;//堆数组容量扩大1倍
  115. T* tmp = new T[size];//1.申请一块原来2倍大小的空间。
  116. std::copy(heap, heap + MaxSize, tmp);//2.将栈中的数据赋值到新的内存空间
  117. delete[] heap;//3.删除老的空间
  118. heap = tmp;//4.heap指向新地址
  119. MaxSize = size;//5.改变MaxSize
  120. }
  121. template<typename T>
  122. void MaxHeap<T>::ShowHeap()
  123. {
  124. int size = 1;
  125. for (int i = 0; i < currentSize;){
  126. std::cout << "[ ";
  127. for (int j = 0; j < size && i < currentSize; j++){
  128. std::cout << heap[i++] << " ";
  129. }
  130. std::cout << "]" << std::endl;
  131. size *= 2;
  132. }
  133. }
  134. #endif

5. 测试

        下面只测试小顶堆,大顶堆可自行测试。

MinHeap.h

  1. #ifndef _MIN_HEAP_H
  2. #define _MIN_HEAP_H
  3. template<typename T>
  4. class MinHeap
  5. {
  6. public:
  7. MinHeap(int _maxsize = 10);
  8. ~MinHeap();
  9. void Push(T _data);//插入数据
  10. void Pop();//删除堆顶数据
  11. T& Top();//获取堆顶数据
  12. void ShowHeap();
  13. private:
  14. T *heap;
  15. int MaxSize;//堆数组的最大大小
  16. int currentSize;//堆数组当前大小
  17. void ChangeSize();//扩大堆数组的大小
  18. };
  19. template<typename T>
  20. MinHeap<T>::MinHeap(int _maxsize)
  21. :MaxSize(_maxsize)
  22. {
  23. try{
  24. if (MaxSize < 1)
  25. throw "Error Size,< 1";
  26. heap = new T[MaxSize];
  27. currentSize = 0;
  28. }
  29. catch (const char* cp){
  30. //1.提示用户错误信息,提示用户重新输入
  31. int size = 0;
  32. while (size < 1){
  33. std::cout << cp << std::endl;
  34. std::cout << "please Enter size again" << std::endl;
  35. std::cin >> size;
  36. }
  37. //2.初始化MinHeap类的数据成员
  38. MaxSize = size;
  39. heap = new T[MaxSize];
  40. currentSize = 0;
  41. }
  42. }
  43. template<typename T>
  44. MinHeap<T>::~MinHeap()
  45. {
  46. delete []heap;
  47. }
  48. template<typename T>
  49. void MinHeap<T>::Push(T _data)
  50. {
  51. if (currentSize == MaxSize){
  52. //堆满了,扩容
  53. ChangeSize();
  54. }
  55. //将数据放入最后一个位置
  56. //注意:currentSize和数组索引值差1:
  57. //比如currentSize = 3,对应的数组索引为2
  58. //所以,当currentSize=3时,即堆数组有3个数据时,新插入的数据应在数组索引3上
  59. heap[currentSize] = _data;
  60. int sonIndex = currentSize;//最后一个位置的数组索引
  61. int fatherIndex = (currentSize - 1)/ 2;//最后一个位置的父节点的数组索引
  62. while (sonIndex > 0){
  63. if (heap[sonIndex] < heap[fatherIndex]){
  64. std::swap(heap[sonIndex], heap[fatherIndex]);
  65. //继续向上
  66. sonIndex = fatherIndex;
  67. fatherIndex = (fatherIndex - 1) / 2;
  68. }
  69. else break;
  70. }
  71. currentSize++;
  72. }
  73. template<typename T>
  74. void MinHeap<T>::Pop()
  75. {
  76. if (currentSize == 0){
  77. std::cout << "Error!The heap is empty,Invalid operation." << std::endl;
  78. return;
  79. }
  80. heap[0] = heap[--currentSize];//删除堆顶,并将最后一个数据放在堆顶
  81. int fatherIndex = 0;//父节点索引为堆顶
  82. int leftSonIndex = fatherIndex * 2 + 1;//获得左子节点索引
  83. int RightSonIndex = leftSonIndex + 1;//获得右子节点索引
  84. //确认循环条件
  85. while (leftSonIndex < currentSize ){
  86. /**1.找左右子节点中最小值的数组索引***/
  87. int minIndex;
  88. //如果RightSonIndex < currentSize,表明fatherIndex有右子节点
  89. if (RightSonIndex < currentSize){
  90. minIndex = heap[leftSonIndex] > heap[RightSonIndex] ? RightSonIndex: leftSonIndex;
  91. }
  92. else{
  93. minIndex = leftSonIndex;
  94. }
  95. /**2.父节点大就交换,否则退出循环***/
  96. if (heap[fatherIndex] > heap[minIndex])
  97. std::swap(heap[fatherIndex], heap[minIndex]);
  98. else break;
  99. fatherIndex = minIndex;
  100. leftSonIndex = fatherIndex * 2 + 1;
  101. RightSonIndex = leftSonIndex + 1;
  102. }
  103. }
  104. template<typename T>
  105. T& MinHeap<T>::Top()
  106. {
  107. if (currentSize == 0)
  108. throw "Error.The heap is empty,there is not data.";
  109. return heap[0];
  110. }
  111. template<typename T>
  112. void MinHeap<T>::ChangeSize()
  113. {
  114. int size = MaxSize * 2;//堆数组容量扩大1倍
  115. T* tmp = new T[size];//1.申请一块原来2倍大小的空间。
  116. std::copy(heap, heap + MaxSize, tmp);//2.将栈中的数据赋值到新的内存空间
  117. delete[] heap;//3.删除老的空间
  118. heap = tmp;//4.heap指向新地址
  119. MaxSize = size;//5.改变MaxSize
  120. }
  121. template<typename T>
  122. void MinHeap<T>::ShowHeap()
  123. {
  124. int size = 1;
  125. for (int i = 0; i < currentSize;){
  126. std::cout << "[ ";
  127. for (int j = 0; j < size && i < currentSize; j++){
  128. std::cout <<heap[i++] <<" ";
  129. }
  130. std::cout << "]"<<std::endl;
  131. size *= 2;
  132. }
  133. }
  134. #endif

Main.cpp

  1. #include <iostream>
  2. #include "MinHeap.h"
  3. #include "MaxHeap.h"
  4. using namespace std;
  5. int main()
  6. {
  7. MinHeap<int> a(4);
  8. /*************插入***********/
  9. a.Push(20);
  10. a.ShowHeap();
  11. cout << endl;
  12. a.Push(30);
  13. a.ShowHeap();
  14. cout << endl;
  15. a.Push(15);
  16. a.ShowHeap();
  17. cout << endl;
  18. a.Push(10);
  19. a.ShowHeap();
  20. cout << endl;
  21. a.Push(9);
  22. a.ShowHeap();
  23. cout << endl;
  24. a.Push(8);
  25. a.ShowHeap();
  26. cout << endl;
  27. a.Push(12);
  28. a.ShowHeap();
  29. cout << endl;
  30. /*************删除***********/
  31. cout << "**********删除************" << endl;
  32. cout << a.Top() << endl;
  33. a.Pop();
  34. a.ShowHeap();
  35. cout << endl;
  36. cout << a.Top() << endl;
  37. a.Pop();
  38. a.ShowHeap();
  39. cout << endl;
  40. cout << a.Top() << endl;
  41. a.Pop();
  42. a.ShowHeap();
  43. cout << endl;
  44. cout << a.Top() << endl;
  45. a.Pop();
  46. a.ShowHeap();
  47. cout << endl;
  48. cout << a.Top() << endl;
  49. a.Pop();
  50. a.ShowHeap();
  51. cout << endl;
  52. cout << a.Top() << endl;
  53. a.Pop();
  54. a.ShowHeap();
  55. cout << endl;
  56. cout << a.Top() << endl;
  57. a.Pop();
  58. a.ShowHeap();
  59. cout << endl;
  60. a.Pop();
  61. system("pause");
  62. return 0;
  63. }

结果展示

 

总结

        大顶堆和小顶堆都是堆数据结构的变种,它们分别能够在 O(1) 时间内访问最大和最小元素。在 C++ 中,可以方便地使用 std::priority_queue 创建并操作这两种堆。无论是大顶堆还是小顶堆,插入元素和删除堆顶元素的时间复杂度都是 O(log n),其中 n 为堆中的元素数量。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/知新_RL/article/detail/623113
推荐阅读
相关标签
  

闽ICP备14008679号