当前位置:   article > 正文

高级数据结构 <AVL树>

高级数据结构 <AVL树>

AVL树标题

本文已收录至《数据结构(C/C++语言)》专栏!
作者:ARMCSKGT

CSDN



前言

前面我们学习了二叉树,普通的二叉树没有任何特殊性质,所以后面我们又学习了二叉搜索树,这种有序的结构一定程度上优化了二叉树的性能,但是普通的二叉搜索树在特殊情况下,例如插入序列从大到小有序时,二叉搜索树会退化成类似于链表的单支数,此时性能变为O(n),为了解决这个问题,科学家在二叉搜索树的基础上再次进行升级,而有了我们现在常见的 AVL树红黑树 ,本节我们将介绍AVL树的基础性质。
AVL树配图


正文

在介绍AVL树之前,如果你没有了解过 二叉搜索树二叉树,请移步先了解前置知识!
本节介绍AVL树默认中序遍历为升序序列

AVL树的性质


二叉搜索树虽可以缩短查找的效率,但如果数据有序或接近有序二叉搜索树将退化为单支树,查找元素相当于在顺序表中搜索元素,效率低下。

因此,两位俄罗斯的数学家 G.M.Adelson-VelskiiE.M.Landis 在1962年发明了一种解决上述问题的方法:当向二叉搜索树中插入新结点后,如果能保证每个结点的左右子树高度之差的绝对值不超过1(需要对树中的结点进行调整),即可降低树的高度,从而减少平均搜索长度

简而言之,AVL树通过一个 平衡因子bf(右子树深度减去左子树深度) 来记录根节点左右子树深度的差,一般情况下,平衡因子只会有五种情况:

  • 左子树比右子树深度高两层,此时平衡因子为 -2 ,此时需要对树进行旋转调整
  • 左子树比右子树深度高一层,此时平衡因子为 -1
  • 左子树与右子树深度相等,此时平衡因子为 0
  • 左子树比右子树深度低一层,此时平衡因子为 1
  • 左子树比右子树深度低两层,此时平衡因子为 2 ,此时需要对树进行旋转调整


综上,如果二叉搜索树具备以下性质,则为AVL树:

  • 左右子树的高度之差(平衡因子)的绝对值不超过 1
  • 它的左右子树都是 AVL 树

AVL树结构(节点上的数字就是平衡因子):

这颗树没有出现不平衡的情况,每个节点的平衡因子的绝对值不超过2。

这样看来,AVL树是一颗高度平衡的二叉搜索树,如果AVL树有N个节点,则AVL树的高度为 log ⁡ n \log_n logn,此时找到任意节点的时间复杂度都是O( log ⁡ 2 N \log_2N log2N)。

我们学习AVL树主要是研究其插入节点后如何保持平衡的思想!


AVL树的定义


AVL树在二叉树的基础上,增加了一个指针指向了父节点以及一个平衡因子,所以AVL树是三叉链结构!

节点定义代码:

#include <iostream>

template<class K,class V>
struct TreeNode
{
	TreeNode<K, V>*  _left;     // 左子树
	TreeNode<K, V>*  _right;	// 右子树
	TreeNode<K, V>*  _parent;   // 父节点
	std::pair<K, V>  _val;      // 节点键值对(节点值)
	int              _bf;	    // 平衡因子

	TreeNode()
		:_left  (nullptr)
		,_right (nullptr)
		,_parent(nullptr)
		,_val(pair<K,V>())
		,_bf(0)
	{}

	TreeNode(const pair<K,V>& val)
		:_left   (nullptr)
		, _right (nullptr)
		, _parent(nullptr)
		, _val(val)
		, _bf(0)
	{}

	TreeNode(const K& key,const V& val)
		:_left(nullptr)
		, _right(nullptr)
		, _parent(nullptr)
		, _val({key,val})
		, _bf(0)
	{}
};
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35

AVL树的定义比较简单,只需要一个根节点_root记录即可。
但是为了我们可以控制对比的函数,以便随我们指定的方式去插入,就像sort函数一样,可以通过仿函数控制升序和降序排序,所以我们还需要一个模板参数去作为比较函数!
AVL树定义:

//仿函数控制比较方式
template<class T> //升序
struct less { bool operator()(const T& left, const T& right) { return left < right; } };
template<class T> //降序
struct greater { bool operator()(const T& left, const T& right) { return left > right; } };

//AVL树定义 默认升序(按中序输出序列)
template<class K, class V, class Compare = less<K>>
class AVLTree
{
	typedef std::pair<K, V> val_type; //值类型
	typedef TreeNode<K, V>  Node;     //节点类型
public:
	AVLTree() :_root(nullptr), _size(0) {}

private:
	Node*   _root; //根节点
	size_t  _size; //节点数量
	Compare _com;  //比较函数
};
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20

AVL树的插入函数


在二叉搜索树的插入函数基础上,AVL树的插入操作还需要对父节点的平衡因子进行调节,并在失衡的根节点处进行旋转调整。


AVL树插入流程:

  • 如果是第一次插入节点,直接赋值给 _root 作为根节点,_size+1。
  • 将插入值的key与当前节点值传入 _com函数 中对比,当函数返回true时向左子树走,返回false时向右子树走,如果走到空则跳出准备插入,如果相等则返回当前节点值。
  • 根据节点值与插入值key在_com函数中的对比结果,决定插入到父节点的左子树还是右子树。
  • 调整父节点的平衡因子,如果出现失衡(平衡因子绝对值为2)则进行旋转,并依次向上继续调整祖父节点,直到当前父节点平衡因子为0或节点为树的根节点为止。
  • _size+1并返回插入结果。

关于AVL树的返回值:AVL树返回值为 pair<val_type,bool>,当插入成功在返回节点值的同时并返回true,当插入失败(遇到相等值节点时)返回false。


插入函数代码:

//插入函数
pair<val_type, bool> insert(const val_type& data)
{
	//首次插入特殊处理
	if (nullptr == _root)
	{
		Node* newnode = new Node(data);
		_root = newnode;
		++_size;
		return { data,true };
	}

	//寻找合适的插入位置
	Node* newnode = new Node(data);
	Node* parent = _root;
	Node* cur = _root;
	while (cur)
	{
		if (_com(data.first, cur->_val.first))      // <
		{
			parent = cur;
			cur = cur->_left;
		}
		else if (_com(cur->_val.first, data.first)) // >
		{
			parent = cur;
			cur = cur->_right;
		}
		//找到相同值节点 返回false和节点值
		else return { data,false};                 // ==
	}

	//将新节点插入所寻找的父节点下
	if (_com(data.first, parent->_val.first)) parent->_left = newnode;
	else parent->_right = newnode;
	newnode->_parent = parent;
	cur = newnode;

	while (parent)
	{
		//调整父节点平衡因子
		if (parent->_left == cur) --(parent->_bf);
		else if (parent->_right == cur) ++(parent->_bf);

		//调整和旋转
		if (parent->_bf == 1 || parent->_bf == -1)
		{
			parent = parent->_parent;
			cur = cur->_parent;
		}
		else if (parent->_bf == 0) break;
		else //开始调整和旋转
		{
			if (parent->_bf == -2 && cur->_bf == -1) RotateR(parent);    //右单旋
			else if (parent->_bf == 2 && cur->_bf == 1) RotateL(parent); //左单旋
			else if (parent->_bf == -2 && cur->_bf == 1) RotateLR(parent); //左右旋
			else if (parent->_bf == 2 && cur->_bf == -1) RotateRL(parent); //右左旋
			else { assert(false); }
		}
	}
	++_size;
	return { data,true };
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
  • 44
  • 45
  • 46
  • 47
  • 48
  • 49
  • 50
  • 51
  • 52
  • 53
  • 54
  • 55
  • 56
  • 57
  • 58
  • 59
  • 60
  • 61
  • 62
  • 63

关于节点调整流程:

关于旋转调整节点,我们接下来进行详细探究!

关于需要调整的情况,一共可以分为四大类:
旋转
是否旋转,取决于parent和cur节点的平衡因子:

parent(父节点)平衡因子cur(子节点)平衡因子操作
-2-1右单旋
21左单旋
-21左右双旋
2-1右左双旋

左单旋

当根节点的右子树平衡因子为1的情况下,仍然向右子树中插入比右子树节点值大的节点,此时就会导致根节点平衡因子为2,右子树平衡因子为1,此时就需要左单旋。
在这里插入图片描述
当我们向20节点的右子树中插入35时,35是该树中的最大节点,便会插入在最右节点,此时30节点的平衡因子变为1,25节点则变为2,需要对其进行左单旋。


左单旋的函数代码:

//左单旋
void RotateL(Node* parent)
{
	//parent右子节点
	Node* childR = parent->_right;
	//parent右子节点的左子节点
	Node* childRL = childR->_left;
	//parent右子节点的右子节点
	Node* childRR = childR->_right;
	//parent节点的父节点
	Node* pparent = parent->_parent;

	//parent节点的右指向childR的左子树
	parent->_right = childRL;
	//如果childRL节点存在 则链接与parent节点的关系 否则parent->_right指向空
	if (childRL) childRL->_parent = parent;
	//将childR的左指向parent 构建链接关系
	childR->_left = parent;
	parent->_parent = childR;

	//与pparent构建链接关系 如果pparent为_root根节点 则设置_root
	if (pparent == nullptr)
	{
		_root = childR;
		_root->_parent = nullptr;
	}
	else //否则查看原parent节点是pparent的左还是右子树 插入原parent位置
	{
		if (pparent->_left = parent) pparent->_left = childR;
		else pparent->_right = childR;

		childR->_parent = pparent;
	}
	//更新受影响节点的平衡因子
	parent->_bf = childR->_bf = 0;
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36

旋转过程简而言之就是更改节点的链接关系,使其深度降低!

对于上面图中的树,我们根据左单旋进行调整:
左单旋

左单旋过程梳理:

  • parent节点与childRL节点构建链接关系
  • childR节点的左子树置为parent,并相互构建链接关系
  • 判断pparent是否为空,不为空则将childR与pparent构建链接关系
  • 将parent节点与childR节点的平衡因子置为0

注意:这里在构建链接关系时,一定要注意构建与父节点的关系,容易忘记;childRL节点可能为空,如果为空则不需要与其新父节点(parent)构建链接关系,需要if判断!



右单旋

当根节点的左子树平衡因子为-1的情况下,仍然向左子树中插入比左子树节点值小的节点,此时就会导致根节点平衡因子为-2,左子树平衡因子为-1,此时就需要右单旋。
右单旋
右单旋与左单旋相似,只不过指针的调整方式不同。
当节点3插入后,节点10的平衡因子(左右子树高度差为2)为-2,此时插入的节点位于左子树的左侧,此时需要右旋转。


右单旋的函数代码:

//右单旋
void RotateR(Node* parent)
{
	Node* childL = parent->_left;
	Node* childLL = childL->_left;
	Node* childLR = childL->_right;
	Node* pparent = parent->_parent;

	parent->_left = childLR;
	if (childLR) childLR->_parent = parent;
	childL->_right = parent;
	parent->_parent = childL;

	if (pparent == nullptr)
	{
		_root = childL;
		_root->_parent = nullptr;
	}
	else
	{
		if (pparent->_left == parent) pparent->_left = childL;
		else pparent->_right = childL;

		childL->_parent = pparent;
	}
	parent->_bf = childL->_bf = 0;
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27

对于上面图中的树,我们根据右单旋进行调整:
右单旋


右单旋过程梳理:

  • parent节点与childLR节点构建链接关系
  • childL节点的右子树置为parent,并相互构建链接关系
  • 判断pparent是否为空,不为空则将childL与pparent构建链接关系
  • 将parent节点与childL节点的平衡因子置为0

注意:这里在构建链接关系时,一定要注意构建与父节点的关系,容易忘记;childLR节点可能为空,如果为空则不需要与其新父节点(parent)构建链接关系,需要if判断!


右左双旋

当我们将值插入(高度差为1的树时)右子树右侧时会引发左单旋,当插入左子树左侧时会引发右单旋。

相反,如果将值插入右子树左侧或左子树右侧,则会引发双旋。
如果插入的是右子树左侧,此时parent平衡因子为,那么单旋就不能解决问题了,此时需要右左双旋,详细解释就是先 进行右单旋 再进行左单旋,这样才能降低高度。


关于以下情况,就是需要进行右左双旋:
右左双旋插入情况


右左双旋代码:

//右左双旋
void RotateRL(Node* parent)
{
	Node* childR  = parent->_right;
	Node* childRL = childR->_left;
	int bf = childRL->_bf;

	RotateR(childR);
	RotateL(parent);

	/*
			A
		B        C
			    D
			  E
	*/
	if (bf == -1)
	{
		parent->_bf = 0;
		childR->_bf = 1;
		childRL->_bf = 0;
	}
	/*
			A
		B        C
			    D
			     E
	*/
	else if (bf == 1)
	{
		parent->_bf = -1;
		childR->_bf = 0;
		childRL->_bf = 0;
	}
	/*
		A
		    B
		  C
	*/
	else if (bf == 0)
	{
		parent->_bf = 0;
		childR->_bf = 0;
		childRL->_bf = 0;
	}
	//如果出现其他情况,则表示代码有问题,需要检查
	else assert(false);
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
  • 44
  • 45
  • 46
  • 47
  • 48

关于右左双旋,可以结合下图理解(三列情况,对应三种不同的平衡因子调整):
右左双旋


关于右左双旋的过程:

  • 先确定parent和childR和childRL节点
  • 对childR进行右单旋(将childRL变成childR的父节点)
  • 对parent进行左单旋(再将childRL变成childR的父节点)
  • 调整parent,childR和childRL节点的平衡因子(根据childRL节点平衡因子调整)

关于节点平衡因子的调整,从上图看出来,需要根据childRL节点来进行判断:

  • 当childRL平衡因子为 0parent的平衡因子调整为0childR的平衡因子调整为0childRL平衡因子调整为0
  • 当childRL平衡因子为 -1parent的平衡因子调整为0childR的平衡因子调整为1childRL平衡因子调整为0
  • 当childRL平衡因子为 1parent的平衡因子调整为-1childR的平衡因子调整为0childRL平衡因子调整为0

注意:右左双旋中,对childR进行右单旋转再对parent进行左单旋,这个顺序不能颠倒,且平衡因子的调整必须根据childRL平衡因子进行调整。


左右双旋

当节点插入到左子树的右侧时,此时parent平衡因子为-2且childR平衡因子为1,此时需要左右双旋,即需要 先进行左单旋,再进行右单旋 才能降低高度。


关于以下插入情况,此时的树需要进行左右双旋:
左右双旋插入情况


左右双旋代码:

//左右双旋
void RotateLR(Node* parent)
{
	Node* childL  = parent->_left;
	Node* childLR = childL->_right;
	int bf = childLR->_bf;

	RotateL(childL);
	RotateR(parent);

	/*
				A
			B		C
		D		E
			  F
	*/
	if (bf == -1)
	{
		childL->_bf = 0;
		childLR->_bf = 0;
		parent->_bf = 1;
	}
	/*
				A
			B		 C
		D	  E
			   F
	*/
	else if (bf == 1)
	{
		childL->_bf = -1;
		childLR->_bf = 0;
		parent->_bf = 0;
	}
	/*
	*	   A
	*	B
	*	  C
	*/
	else if (bf == 0)
	{
		childL->_bf = 0;
		childLR->_bf = 0;
		parent->_bf = 0;
	}
	//如果出现其他情况,则表示代码有问题,需要检查
	else assert(false);
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
  • 44
  • 45
  • 46
  • 47
  • 48

关于右左双旋,可以结合下图理解(三列情况,对应三种不同的平衡因子调整):
左右双旋


关于左右双旋的过程:

  • 先确定parent和childL和childLR节点
  • 对childL进行左单旋(将childLR变成childL的父节点)
  • 对parent进行右单旋(再将childLR变成parent的父节点)
  • 调整parent,childL和childLR节点的平衡因子(根据childLR节点平衡因子调整)

关于节点平衡因子的调整,从上图看出来,需要根据childRL节点来进行判断:

  • 当childLR平衡因子为 0parent的平衡因子调整为0childL的平衡因子调整为0childLR平衡因子调整为0
  • 当childLR平衡因子为 -1parent的平衡因子调整为1childL的平衡因子调整为0childLR平衡因子调整为0
  • 当childLR平衡因子为 1parent的平衡因子调整为0childL的平衡因子调整为-1childLR平衡因子调整为0

注意:左右双旋中,对childL进行右单旋转再对parent进行左单旋,这个顺序不能颠倒,且平衡因子的调整必须根据childLR平衡因子进行调整。


AVL树主要值得学习的地方就在插入,学习其控制树的高度差的思想和旋转思想。

检验AVL树的合法性


检验AVL树是否合格(是否没有bug),还需要从其定义入手。


空树是满足AVL树性质,且满足以下条件,则是AVL树:

  • 右子树减去左子树深度的绝对值不超过1
  • 右子树减去左子树深度等于根节点平衡因子
  • 每棵子树都满足该条件

以上条件满足任意一个,就是AVL树。


我们代码实现采用递归方式,在类中需要写一个递归函数再进行封装!

代码实现:

//检查AVL树合法性-调用函数
bool isAVL() { return _isAVL(_root); }

//获取AVL树高度-调用函数
int getHigh() { return _getHigh(_root); }

//检查AVL树合法性-执行函数
bool _isAVL(Node* root)
{
	if (root == nullptr) return true;
	//获取左右子树高度
	int left = _getHigh(root->_left);
	int right = _getHigh(root->_right);
	//如果右子树减左子树高度差的绝对值小于1 且差值与根的平衡因子相等 就继续检查子树
	if (abs(right - left) <= 1 && (right - left) == root->_bf) return true && _isAVL(root->_left) && >_isAVL(root->_right);
	return false;
}

//获取树的深度-执行函数
int _getHigh(Node* root)
{
	if (root == nullptr) return 0;
	int left = _getHigh(root->_left);
	int right = _getHigh(root->_right);
	return left > right ? left + 1 : right + 1;
}

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27

测试代码:

int main()
{
   const int N = 10000;
   AVLTree::AVLTree<int,int> t;
   for (int i = 0; i <= N; ++i) t.insert({i,i});
   if (t.isAVL()) cout << "合法" << endl;
   else cout << "不合法" << endl;
   cout << "树高度:" << t.getHigh() << endl;
   return 0;
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10


我们插入10001个节点,此时树合法且高度为14!
2 13 = 8192 , 2 14 = 16384 2^{13}=8192 ,2^{14}=16384 213=8192214=16384
通过对高度的平方运算,结果符合要求!


关于AVL树


AVL树是一棵对身材要求及其严格的树,时时刻刻要求自己左右接近对称(左右高度差不超过1)。

AVL树的优缺点:

  • 优点: 因为其严格的要求,当树中稍微出现退化趋势就会立刻被调整,所以对于AVL树的查询时间非常快,约为 l o g 2 N log_2N log2N
  • 缺点: 因为其严格的条件,导致AVL树在碰到有序序列时可能会频繁旋转调整,在删除情况下更是有可能一直调整到根节点,因为频繁旋转非常浪费性能,所以导致插入效率下降。

AVL树的使用场景:

AVL树严格的平衡条件,导致其查询效率极高,在不频繁增删的情况下,也就是静态树(只查只读) 的情况下,使用AVL树会的查询效率是极好的,但是在很多场景中,增删查改是并存的,此时我们不得不考虑摒弃一些查询时间去弥补插入删除的效率,也就是需要一棵与AVL树差不多,但是没有AVL树要求这么严格的二叉搜索树,这棵树就是红黑树,红黑树可以做的比AVL树调整次数少的情况下,性能差距不超过2倍,下一节我们将介绍红黑树!


最后

AVL树的介绍到这里就差不多了,我们首先说明了二叉搜索树的缺点,引入AVL树对其进行强化,AVL树的复杂之处在于其旋转调整,所以我们通过AVL树的插入介绍旋转调整,至于删除操作相对于插入函数更加复杂,有兴趣的小伙伴可以了解,对于AVL树的基本性质就是这些了!

本次 <AVL树> 就先介绍到这里啦,希望能够尽可能帮助到大家。

如果文章中有瑕疵,还请各位大佬细心点评和留言,我将立即修补错误,谢谢!

本节涉及代码:AVL树博客代码

博客结尾

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Cpp五条/article/detail/402091
推荐阅读
相关标签