看图轻松理解数据结构与算法系列(B+树)

前言

推出一个新系列，《看图轻松理解数据结构和算法》，主要使用图片来描述常见的数据结构和算法，轻松阅读并理解掌握。本系列包括各种堆、各种队列、各种列表、各种树、各种图、各种排序等等几十篇的样子。

B+树

B+树是B树的一种变体，也属于平衡多路查找树，大体结构与B树相同，包含根节点、内部节点和叶子节点。多用于数据库和操作系统的文件系统中，由于B+树内部节点不保存数据，所以能在内存中存放更多索引，增加缓存命中率。另外因为叶子节点相连遍历操作很方便，而且数据也具有顺序性，便于区间查找。

B+树特点

B+树可以定义一个m值作为预定范围，即m路(阶)B+树。
根节点可能是叶子节点，也可能是包含两个或两个以上子节点的节点。
内部节点如果拥有k个关键字则有k+1个子节点。
非叶子节点不保存数据，只保存关键字用作索引，所有数据都保存在叶子节点中。
非叶子节点有若干子树指针，如果非叶子节点关键字为k1,k2,...kn，其中n=m-1，那么第一个子树关键字判断条件为小于k1，第二个为大于等于k1而小于k2，以此类推，最后一个为大于等于kn，总共可以划分出m个区间，即可以有m个分支。（判断条件其实没有严格的要求，只要能实现对B+树的数据进行定位划分即可，有些实现使用了m个关键字来划分区间，也是可以的）
所有叶子节点通过指针链相连，且叶子节点本身按关键字的大小从小到大顺序排列。
自然插入而不进行删除操作时，叶子节点项的个数范围为[floor(m/2),m-1]，内部节点项的个数范围为[ceil(m/2)-1,m-1]。
另外通常B+树有两个头指针，一个指向根节点一个指向关键字最小的叶子节点。
在进行删除操作时，涉及到索引节点填充因子和叶子节点填充因子，一般可设叶子节点和索引节点的填充因子都不少于50%。

以下是一棵4阶B+树，

插入操作

假设现在构建一棵四阶B+树，开始插入“A”，直接作为根节点，

插入“B”，大于“A”，放右边，

插入“C”，按顺序排到最后，

继续插入“D”，直接添加的结果如下图，此时超过了节点可以存放容量，对于四阶B+树每个节点最多存放3个项，此时需要执行分裂操作，

分裂操作为，先选取待分裂节点中间位置的项，这里选“C”，然后将“C”项放到父节点中，因为这里还没有父节点，那么直接创建一个新的父节点存放“C”，而原来小于“C”的那些项作为左子树，原来大于等于“C”的那些项作为右子树。这里注意下非叶子节点存放的都是关键字，用作索引的，所以父节点存放的“C”项不包括数据，数据仍然存放在右子树。此外，还需要添加一个指针，由左子树指向右子树。

继续插入“M”，“M”大于“C”，往右子节点，

分别与“C”“D”比较，大于它们，放到最右边，

插入“L”，“L”大于“B”，往右子树，

“L”逐一与节点内项的值比较，根据大小放到指定位置，此时触发分裂操作，

选取待分裂节点中间位置的项“L”，然后将“L”项放到父节点中，按大小顺序将“L”放到指定位置，而原来小于“L”的那些项作为左子树，原来大于等于“L”的那些项作为右子树。父节点存放的“L”项不包括数据，数据仍然存放在右子树。此外，还需要在左子树中添加一个指向右子树的指针。

继续插入“K”，从根节点开始查找，逐一比较关键字，“K”大于“C”而小于“L”，往第二个分支，

在子节点中逐一比较，“K”最终落在最右边，

继续插入“J”，从根节点开始查找，逐一比较关键字，“J”大于“C”而小于“L”，往第二个分支，

在子节点中找到“J”的相应位置，此时超过了节点的容量，需要进行分裂操作，

选取待分裂节点中间位置的项“J”，然后将“J”项放到父节点中，按大小顺序将“J”放到指定位置，而原来小于“J”的那些项作为左子树，原来大于等于“J”的那些项作为右子树。父节点存放的“J”项不包括数据，数据仍然存放在右子树。此外，还需要在左子树中添加一个指向右子树的指针。

继续插入“I”，从根节点开始查找，逐一比较关键字，“I”大于“C”而小于“J”“L”，往第二个分支，

逐一比较找到“I”的插入位置，