赞
踩
先来回顾一下二叉搜索树,二叉搜索树虽然可以缩短查找的效率,但是如果数据有序或者接近有序的话,二叉搜索树就会退化成单支树,查找元素相当于在顺序表中搜索元素,效率非常低。因此,两位俄罗斯的数学家G.M.Adelson-Velskii和E.M.Landis在1962年发明了一种解决上述问题的方法:当向二叉搜索树中插入新的结点后,如果能保证每个结点的左右子树高度之差的绝对值不超过1(需要对树中的结点进行调整),即可降低树的高度,从而减少平均搜索长度。
一颗AVL树或者是空树,或者是具有以下性质的二叉搜索树:
1.它的左右子树都是AVL树。
2.左右子树高度之差(简称平衡因子)的绝对值不超过1(-1/0/1)。
例如下图:如果一颗二叉搜索树是高度平衡的,它就是AVL树。如果它有N个结点,其高度可保持在O(logN),搜索时间复杂度为O(lonN)。
在结点的定义中,我们直接定义成KV模型的结点,并新增一个平衡因子,还有一个_parent指针,也就是说,该结点拥有三个指针+一对键值对+一个平衡因子,在初始化时指针都初始化为空,平衡因子设定成0。
- template<class K,class V>
- struct AVLTreeNode
- {
- AVLTreeNode<K, V>* _left; //左子树指针
- AVLTreeNode<K, V>* _right;//右子树指针
- AVLTreeNode<K, V>* _parent;//每个结点都包含了一个父结点地址
- pair<K, V> _kv;//键值对
- int _bf;//平衡因子
-
- //构造函数
- AVLTreeNode(const pair<K, V>& kv)
- :_left(nullptr)
- , _right(nullptr)
- , _parent(nullptr)
- , _kv(kv)
- , _bf(0)
- {}
- };
首先为什么结点已经有了_parent,为什么还要新定义一个parent呢?这两个的含义不同,_parent的是每个结点都含有对父结点的链接,而parent则是定义成cur指针的父结点指针,也就是随时会发生变动,容易处理。也是为了和二叉搜索树的cur parent配合。
AVL树的插入:在AVL树的插入中,和二叉搜索树的插入相同,这里就不多赘述了。
AVL树的平衡因子:在前面可以知道,新插入的结点的平衡因子都初始化成0,那么该结点的父结点就需要进行更改了。
步骤一:更改平衡因子
1.如果cur插入在parent的左边,那么parent的平衡因子-1
2.如果cur插入在parent的右边,那么parent的平衡因子+1
步骤二:检查平衡因子
1.如果parent的平衡因子为0,那么说明插入前为±1,那么说明此时插入后不会增加高度。
2.如果parent的平衡因子为±1,那么说明插入前为0,那么说明此时插入后会增加高度。那么此时需要对祖先结点进行更新,让cur和parent各自返回上一层,然后重复步骤一和步骤二进行循环。
3.如果parent的平衡因子为±2,那么说明插入后违反了AVL树的性质,需要旋转处理。
- //插入函数
- bool insert(const pair<K,T>& kv)
- {
- //按照二叉树搜索树插入
- if (_root == nullptr)//根结点为空时new一个最初的根结点
- {
- _root = new Node(kv);
- return true;
- }
-
- Node* parent = nullptr;//这个为当前指针cur的父结点指针
- Node* cur = _root;//当前指针指向根
-
- while (cur)//当不为空,说明存在值,那么继续搜索可插入的地方
- {
- if (cur->_kv.first < kv.first)//key大于结点值,往右走
- {
- parent = cur;
- cur = cur->_right;
- }
- else if (cur->_kv.first > kv.first)//key小于结点值,往左走
- {
- parent = cur;
- cur = cur->_left;
- }
- else//相等,那么不插入,插入失败
- {
- return false;
- }
- }
- //找到地方插入,new一个新结点
- cur = new Node(kv);
-
- if (parent->_kv.first < kv.first)//key大于父结点值,插右边
- {
- parent->_right = cur;
- cur->_parent = parent;
- }
- else//小于那么插左边
- {
- parent->_left = cur;
- cur->_parent = parent;
- }
-
- return true;//插入成功
-
- //开始更新平衡因子
- while (cur != _root)//最差的情况就是一直更新回根结点
- {
- //处理因子
- if (cur == parent->_left)//如果插入的结点在父节点的左边
- {
- parent->_bf--;//因子-1
- }
- else//如果插入的结点在父节点的右边
- {
- parent->_bf++;//因子+1
- }
-
- //处理完成,开始检查因子
- if (parent->_bf == 0)//等于0,说明平衡,不需要处理
- {
- break;
- }
- //等于1或-1,说明高度变化了,那么要处理祖先结点因子
- else if (parent->_bf == 1 || parent->_bf == -1)
- {
- cur = parent;
- parent = parent->_parent;
- }
-
- else if (parent->_bf == 2 || parent->_bf == -2)// 如果等于2或-2,需要旋转解决
- {
- if (parent->_bf == 2 && cur->_bf == 1)//说明右边高,需左旋
- {
- RotateL(parent);
- }
- else if (parent->_bf == -2 && cur->_bf == -1)//说明左边高,需右旋
- {
- RotateR(parent);
- }
- else if (parent->_bf == 2 && cur->_bf == -1)//左子树的右子树高
- {
- RotateRL(parent);
- }
- else if (parent->_bf == -2 && cur->_bf == 1)//右子树的左子树高
- {
- RotateLR(parent);
- }
- break;
- }
- else
- {
- assert(false);//当平衡因子不为预期值,直接断言出错
- }
-
- }
- }
在上述检查平衡因子时,当遇到parent = 2 的情况时,需要进行旋转处理。
AVL树的旋转有四种:左单旋,右单旋,左右双旋,右左双旋。
但是我们怎么判断什么情况下用什么旋转呢?
cur = 1 | cur = -1 | |
---|---|---|
parent = 2 | 左单旋 | 右左双旋 |
parent = -2 | 左右双旋 | 右单旋 |
如下图所示:此时parent = 2 ,cur = 1
此时为:右子树的右子树新增结点导致二叉树失衡。需要进行左旋转处理。就是,右高了,左旋使两边平衡
左单旋的步骤如下:由上图可以看到,c中新增了一个结点使二叉树失衡,只看开头和结果的话,就是b当成了30结点的右子树,然后60结点当成了根结点,然后30结点当成了60结点的左子树。
那么我们将30结点定义成parent,60结点定义成subR,b结点定义成subRL。
第一步:让subRL链接parent结点
第二步:让parent结点链接subR结点
第三步:让subR结点成为_root根结点。
注意:因为每两个结点都是相互链接的,所以更新链接的时候,需要双向各自取消链接再重新链接
- //左单旋
- void RotateL(Node* parent)
- {
- //定义新指针,方便操作
- Node* subR = parent->_right;
- Node* subRL = subR->_left;
- Node* pp = parent->_parent;//方便更改_root的操作
-
- parent->_right = subRL;//让parent结点链接subRL
- subR->_left = parent;//让subR的左子树链接parent
- parent->_parent = subR;//由于parent的_parent由nullptr变成了subR,所以也需要重新链接
- if (subRL)
- //判断subRL是否为空,如果为空的话就不需要对subRL进行操作了,不然会出现对空指针进行解引用的问题
- {
- subRL->_parent = parent;//不为空,那么让subRL链接parent
- }
- if (_root = parent)//如果parent是整棵树的根结点
- {
- _root = subR;//subR变为根结点
- subR->_parent = nullptr;//subR的_parent为空
- }
- else//如果parent不是整棵树的根结点,那么将新的parent重新链接上一个结点
- {
- if (pp->_left = parent)//如果parent是上一个结点的左子树,那么新的parent也是
- {
- pp->_left = subR;
- }
- else//如果parent是上一个结点的右子树,那么新的parent也是
- {
- pp->_right = subR;
- }
- subR->_parent = pp;//更新subR的父结点
- }
- parent->_bf = subR->_bf = 0;//由于旋转后,整棵树的高度变回插入前的,那么此时parent和subR(cur)的因子都变回0
- }
右单旋的逻辑与左单旋相同,这里就不多赘述了。
- //右单旋
- void RotateR(Node* parent)
- {
- Node* subL = parent->_left;
- Node* subRR = subL->_right;
- Node* pp = parent->_parent;
-
- //建立subL和parent之间的关系
- parent->_left = subRR;
- subL->_right = parent;
-
- //建立parent和subRR之间的关系
- parent->_parent = subL;
- if (subRR != nullptr)
- {
- subRR->_parent = parent;
- }
-
- //建立PP和subL之间的关系
- if (_root == parent)
- {
- _root = subL;
- subL->_parent = nullptr;
- }
- else
- {
- if (pp->_left == parent)
- {
- pp->_left = subL;
- }
- else
- {
- pp->_right = parent;
- }
- subL->_parent = pp;
- }
- //更新平衡因子
- subL->_bf = parent->_bf = 0;
- }
如下图,原本->插入结点->左旋->右旋
这里需要用到左右双旋是因为插入的结点不在左子树的左子树,也就是说,使二叉树失衡的是左子树的右子树新增的结点。
那么此时就需要先将新增结点的树放到最左边,变成左子树的左子树,这样就可以进行右旋了,那么怎么变呢,我们只需要将30结点和60结点当成我们上面所学的左单旋例子即可
也就是说,用30结点子树传入进行左单旋(图的右下角),然后在让90结点的子树进行右旋(图的左下角)
我们看原本和结果:b成了30结点右子树,c成了90结点左子树,30和90分别成了60结点的左右子树,60结点成为了根结点。
那么我们左旋传入的结点就是30结点,旋转完成后,再将 90 结点传入进行右旋。
平衡因子的更新:
在双旋之后,我们可以发现,原本60结点的左子树,变成了30结点的右子树,60结点的右子树,变成了90结点的左子树,那么我们只需要根据60结点的平衡因子,就能知道到底是30结点的平衡因子改变了还是90结点的平衡因子改变了。当然,subR/subL结点的平衡因子由图所示都更新成0
- void RotateLR(Node* parent)//左右双旋
- {
- Node* subL = parent->_left;
- Node* subLR = subL->_right;
-
- int bf = subLR->_bf;
-
- RotateL(parent->_left);
- RotateR(parent);
-
- if (bf == 0)
- {
- //subLR自己就是新增
- subLR->_bf = 0;
- subL->_bf = 0;
- parent->_bf = 0;
- }
- else if (bf == -1)
- {
- //subLR的左子树新增
- subLR->_bf = 0;
- subL->_bf = 0;
- parent->_bf = 1;
- }
- else if(bf == 1)
- {
- //subLR的右子树新增
- subLR->_bf = 0;
- subL->_bf = -1;
- parent->_bf = 0;
- }
- else
- {
- assert(false);
- }
- }
也是和左右双旋基本相同,先记录需要记录的值,然后先右旋,再左旋,最后更新平衡因子即可。
- void RotateRL(Node* parent)//右左双旋
- {
- Node* subR = parent->_right;
- Node* subRL = subR->_left;
- int bf = subRL->_bf;
-
- RotateR(parent->_right);
- RotateL(parent);
-
- if (bf == 0)
- {
- //subRL自己就是新增
- parent->_bf = subR->_bf = subRL->_bf = 0;
- }
- else if (bf == -1)
- {
- //subRL的左子树新增
- parent->_bf = 0;
- subRL->_bf = 0;
- subR->_bf = 1;
- }
- else if (bf == 1)
- {
- //subRL的右子树新增
- parent->_bf = -1;
- subRL->_bf = 0;
- subR->_bf = 0;
- }
- else
- {
- assert(false);
- }
- }
想要验证为二叉搜索树,即采用中序遍历,如果为升序,那么就是二叉搜索树
还是一样,需要在内部类调用私有成员。
- //中序遍历副函数
- void Inorder()
- {
- _Inorder(_root);
- }
- //中序遍历主函数
- void _Inorder(Node* root)
- {
- if (root == nullptr)
- return;
- _Inorder(root->_left);
- cout << root->_kv.first << " ";
- _Inorder(root->_right);
- }
1.每个节点子树高度差的绝对值不超过1(注意节点中如果没有平衡因子)
2.节点的平衡因子是否计算正确。
那么,步骤也就变成了:采用后序遍历
1.从叶子结点处开始计算每课子树的高度。(每棵子树的高度 = 左右子树中高度的较大值 + 1)
2.先判断左子树是否是平衡二叉树。
3.再判断右子树是否是平衡二叉树。
4.若左右子树均为平衡二叉树,则返回当前子树的高度给上一层,继续判断上一层的子树是否是平衡二叉树,直到判断到根为止。(若判断过程中,某一棵子树不是平衡二叉树,则该树也就不是平衡二叉树了)
- //判断是否为AVL树
- bool IsAVLTree()
- {
- int hight = 0; //输出型参数
- return _IsBalanced(_root, hight);
- }
- //检测二叉树是否平衡
- bool _IsBalanced(Node* root, int& hight)
- {
- if (root == nullptr) //空树是平衡二叉树
- {
- hight = 0; //空树的高度为0
- return true;
- }
- //先判断左子树
- int leftHight = 0;
- if (_IsBalanced(root->_left, leftHight) == false)
- return false;
- //再判断右子树
- int rightHight = 0;
- if (_IsBalanced(root->_right, rightHight) == false)
- return false;
- //检查该结点的平衡因子
- if (rightHight - leftHight != root->_bf)
- {
- cout << "平衡因子设置异常:" << root->_kv.first << endl;
- }
- //把左右子树的高度中的较大值+1作为当前树的高度返回给上一层
- hight = max(leftHight, rightHight) + 1;
- return abs(rightHight - leftHight) < 2; //平衡二叉树的条件
- }
AVL树是一颗绝对平衡的二叉树,其要求每个结点的左右子树高度差的绝对值都不超过1,这样可以保证查询时高效的时间复杂度,即O(logN)。但是要对AVL树做一些结构修改的操作,性能非常低下,比如:插入时要维护其绝对平衡,旋转的次数比较多,更差的是在删除时,有可能一直要让旋转到根的位置。因此:如果需要一种查询高效且有序的数据结构,而且数据的个数为静态的(即不会改变),可以考虑AVL树,但一个结构经常修改,就不太适合。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。