赞
踩
前言:本章主要是讲述数据结构中的树,主要从基本的树结构到二叉搜索树,然后再对红黑树的原理与实现
目录
树(tree)是一种抽象数据类型(ADT),用来模拟具有树状结构性质的数据集合。它是由n(n>0)个有限节点通过连接它们的边组成一个具有层次关系的集合。把它叫做“树”是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。树有很多种,向上面的一个节点有多余两个的子节点的树,称为多路树,而每个节点最多只能有两个子节点的一种形式称为二叉树。
1、二叉树:树的每个节点最多只能有两个子节点。
上图的第一幅图B节点有DEF三个子节点,就不是二叉树,称为多路树。只有每个节点最多只有两个节点才是二叉树,并且二叉树的子节点称为“左子节点”和“右子节点”
2、二叉搜索树:如果我们给二叉树加一个额外的条件,就可以得到一种被称作二叉搜索树(binary search tree)的特殊二叉树。
二叉搜索树要求:
3、二叉搜索树-查找节点:查找某个节点,我们必须从根节点开始查找。
4、二叉搜索树-插入节点:要插入节点,必须先找到插入的位置。与查找操作相似,由于二叉搜索树的特殊性,
待插入的节点也需要从根节点开始进行比较,小于根节点则与根节点左子树比较,
反之则与右子树比较,直到左子树为空或右子树为空,则插入到相应为空的位置。
5、二叉搜索树-遍历节点:遍历树是根据一种特定的顺序访问树的每一个节点。比较常用的有前序遍历,中序遍历和后序遍历。而二叉搜索树最常用的是中序遍历。
6、二叉搜索树-查找最大值和最小值
7、二叉搜索树-删除节点:
删除节点是二叉搜索树中最复杂的操作,删除的节点有三种情况,前两种比较简单,但是第三种却很复杂。
①、该节点是叶节点(没有子节点):要删除叶节点,只需要改变该节点的父节点引用该节点的值,即将其引用改为 null 即可。
②、该节点有一个子节点:删除有一个子节点的节点,我们只需要将其父节点原本指向该节点的引用,改为指向该节点的子节点即可。
③、该节点有两个子节点
当删除的节点存在两个子节点,那么删除之后,两个子节点的位置我们就没办法处理了。既然处理不了,我们就想到一种办法,用另一个节点来代替被删除的节点,那么用哪一个节点来代替呢?我们知道二叉搜索树中的节点是按照关键字来进行排列的,某个节点的关键字次高节点是它的中序遍历后继节点。用后继节点来代替删除的节点,显然该二叉搜索树还是有序的。
那么如何找到删除节点的中序后继节点呢?
其实我们稍微分析,这实际上就是要找比删除节点关键值大的节点集合中最小的一个节点,只有这样代替删除节点后才能满足二叉搜索树的特性。后继节点也就是:比删除节点大的最小节点。
④、删除有必要吗?
通过上面的删除分类讨论,我们发现删除其实是挺复杂的,那么其实我们可以不用真正的删除该节点,只需要在Node类中增加一个标识字段isDelete,当该字段为true时,表示该节点已经删除,反之则没有删除。这样删除节点就不会改变树的结构了。影响就是查询时需要判断一下节点是否已被删除。
8、二叉搜索树-时间复杂度分析:
暴力算法:运气好时 性能不错,运气不好时 性能暴跌。
二分查找算法:数据源必须是有序数组,性能非常不错,每次迭代查询可以排除掉一半的结果。
强制依赖 有序数组,性能才能不错。
没有办法快速插入,也没有办法扩容
二叉搜索树
9、普通二叉搜索树致命缺陷:
O(N)
如果插入元素时,树可以自动调整两边平衡,会保持不错的查找性能。
10、AVL树简介:
平衡树基于这种特点就可以保证不会出现大量节点偏向于一边的情况了!(插入或者删除时,会发生左旋、右旋操作,使这棵树再次左右保持一定的平衡)
虽然平衡树解决了二叉查找树退化为近似链表的缺点,能够把查找时间控制在 O(logn),不过却不是最佳的,因为平衡树要求每个节点的左子树和右子树的高度差至多等于1,这个要求实在是太严了,导致每次进行插入/删除节点的时候,几乎都会破坏平衡树的第二个规则,进而我们都需要通过左旋和右旋来进行调整,使之再次成为一颗符合要求的平衡树。显然,如果在那种插入、删除很频繁的场景中,平衡树需要频繁着进行调整,这会使平衡树的性能大打折扣,为了解决这个问题,于是有了红黑树!!!
1、红黑树性质:
性质1:每个节点要么是黑色,要么是红色。 |
性质2:根节点是黑色。 |
性质3:每个叶子节点(NIL)是黑色。 |
性质4:每个红色节点的两个子节点一定都是黑色。 不能有两个红色节点相连。 |
性质5:任意一节点到每个叶子节点的路径都包含数量相同的黑结点。俗称:黑高! |
从性质5又可以推出: 性质5.1:如果一个节点存在黑子节点,那么该结点肯定有两个子节点 |
红黑树如图:
红黑树并不是一个完美平衡二叉查找树,从图上可以看到,根结点P的左子树显然比右子树高,但左子树和右子树的黑结点的层数是相等的,也即任意一个结点到到每个叶子结点的路径都包含数量相同的黑结点(性质5)。所以我们叫红黑树这种平衡为黑色完美平衡。
红黑树的性质讲完了,只要这棵树满足以上性质,这棵树就是趋近与平衡状态的,不要问为什么,发明红黑树的科学家就是这么牛逼!
前面讲到红黑树能自平衡,它靠的是什么?三种操作:左旋、右旋和变色。
左旋图示:
右旋图示:
2、红黑树查找:同二叉搜索树一样
3、红黑树插入:
插入操作包括两部分工作:
注意:插入节点,必须为红色,理由很简单,红色在父节点(如果存在)为黑色节点时,红黑树的黑色平衡没被破坏,不需要做自平衡操作。但如果插入结点是黑色,那么插入位置所在的子树黑色结点总是多1,必须做自平衡。
在开始每个情景的讲解前,我们还是先来约定下:
情景1:红黑树为空树
最简单的一种情景,直接把插入结点作为根结点就行。注意:根据红黑树性质2:根节点是黑色。还需要把插入结点设为黑色。
情景2:插入结点的Key已存在
处理:更新当前节点的值,为插入节点的值,也可以忽略,根据业务需要决定。
情景3:插入结点的父结点为黑结点
由于插入的结点是红色的,当插入结点的黑色时,并不会影响红黑树的平衡,直接插入即可,无需做自平衡。
情景4:插入节点的父节点为红色
再次回想下红黑树的性质2:根结点是黑色。如果插入节点的父结点为红结点,那么该父结点不可能为根结点,所以插入结点总是存在祖父结点。这一点很关键,因为后续的旋转操作肯定需要祖父结点的参与。
插入情景4.1:叔叔结点存在并且为红结点
依据红黑树性质4可知,红色节点不能相连 ==> 祖父结点肯定为黑结点;因为不可以同时存在两个相连的红结点。那么此时该插入子树的红黑层数的情况是:黑红红。显然最简单的处理方式是把其改为:红黑红
处理:
将P和U节点改为黑色
将PP改为红色
将PP设置为当前节点,进行后续处理
可以看到,我们把PP结点设为红色了,如果PP的父结点是黑色,那么无需再做任何处理;但如果PP的父结点是红色,则违反红黑树性质了。所以需要将PP设置为当前节点,继续做插入操作自平衡处理,直到平衡为止。
插入情景4.2:叔叔结点不存在或为黑结点,并且插入结点的父亲结点是祖父结点的左子结点
注意:单纯从插入前来看,叔叔节点非红即空(NIL节点),否则的话破坏了红黑树性质5,此路径会比其它路径多一个黑色节点。
插入情景4.2.1:新插入节点,为其父节点的左子节点(LL红色情况)
处理:
1.变颜色:将P设置为黑色,将PP设置为红色
2.对PP节点进行右旋
插入情景4.2.2:新插入节点,为其父节点的右子节点(LR红色情况)
处理:
1.对P进行左旋
2.将P设置为当前节点,得到LL红色情况
3.按照LL红色情况处理(1.变颜色 2.右旋PP)
插入情景4.3:叔叔结点不存在或为黑结点,并且插入结点的父亲结点是祖父结点的右子结点
该情景对应情景4.2,只是方向反转,直接看图。
插入情景4.3.1:新插入节点,为其父节点的右子节点(RR红色情况)
处理:
1.变颜色:将P设置为黑色,将PP设置为红色
2.对PP节点进行左旋
插入情景4.3.2:新插入节点,为其父节点的左子节点(RL红色情况)
处理:
1.对P进行右旋
2.将P设置为当前节点,得到RR红色情况
3.按照RR红色情况处理(1.变颜色 2.左旋PP)
4、红黑树的删除
我们发现,情景3总是会转换为情景1或者情景2的,而情景1.1和情景2处理平衡非常简单,本文主要讨论的是情景1.2:删除黑色的叶子节点。因为一旦该节点被拿掉,红黑树中通过该节点的路径黑色节点数量将会减1,而且无法像情景2那样将子节点涂黑来达到平衡。此时只能自底向上进行平衡操作。
我们约定一下节点名称,如上图所示。
h(A->B->叶子)表示从A走到B再走到某一个叶子路径的黑色节点数量(A与B,B与叶子之间可能间隔了多个节点),以下均指的是删除黑色的叶子节点后(情景1.2)引发的一系列平衡操作。比如P->D->N,删除D(黑色)后,N接至父节点:P->N。
因为删除了一个黑色节点(N的父节点D),经过N的路径的黑色数量减1,即h(P->N->叶子) 比 h(P->S->叶子) 少1。
平衡的方式有:
(1)h(P->N->叶子)不变,h(P->S->叶子)减1,此时已经子平衡;然而h(GP->P->叶子)还是会比h(GP -> U ->叶子)少1。此时需要将P当作新的N,向上递归处理;
(2)h(P->N->叶子)加1,h(P->S->叶子)不变,也就是恢复了原来的状态,此时已经平衡,因为h(GP->P->叶子)=h(GP -> U ->叶子)。本文下面平衡的思路主要就是基于以上两种方式,另外要注意的是,红色和红色不能连一起的约束也不能违反。理解这个比较重要。
以下情形都是在情景1.2的基础上:
比较特殊的情况,无需平衡操作。因为经过根节点的黑色数量少一个,意味着所有路径都少一个,已然平衡。
S涂红后,h(P->N->叶子)不变,h(P->S->叶子)-1,实现子平衡;因为P节点是红色的,如果将它涂黑,h(P->N->叶子)和h(P->S->叶子)均会+1,就可以恢复原来的状态了,而不用递归上去。
通常旋转后,新的P节点往往都会涂成原P的颜色:一是为了让GP-P不会颜色冲突;二是保持经过P的路径黑色数量不变。
旋转后交换P和S的颜色(S涂黑,P涂红),N兄弟节点变为黑色,进入情形2-兄弟节点为黑色进行处理。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。