赞
踩
https://www.wolai.com/curry00/fzTPy3kSsMDEgEcdvo4G5w
https://www.bilibili.com/video/BV1Kr4y1i7ru/?p=69
https://jimhackking.github.io/%E8%BF%90%E7%BB%B4/MySQL%E5%AD%A6%E4%B9%A0%E7%AC%94%E8%AE%B0/#%E7%B4%A2%E5%BC%95
索引是一种用于快速查询和检索数据的数据结构,排序好的数据结构。
优点:加快检索速度;通过创建唯一性索引,可以保证行数据的唯一性;通过索引列对数据进行排序,降低数据排序的成本,降低CPU的消耗
缺点:创建和维护索引需要耗费时间,本身存储也要耗费一定空间
不同引擎对索引的支持情况
哈希表、有序数组、B+树、B树、红黑树,二叉树
哈希表:只适用于等值查询的场景,用这种索引做不了范围查询,必须全表扫描。查询效率高
有序数组:有序数组在等值查询和范围查询场景中的性能就都非常优秀,但是一旦更新数据就得挪动后面的元素,成本太高
二叉搜索树:为了维持 O(log(N)) 的查询复杂度,需要保持这棵树是平衡二叉树。为了做这个保证,更新的时间复杂度也是 O(log(N))。
二叉树是搜索效率最高的,但是实际上大多数的数据库存储却并不使用二叉树。其原因是,索引不止存在内存中,还要写到磁盘上。你可以想象一下一棵 100 万节点的平衡二叉树,树高 20。一次查询可能需要访问 20 个数据块。
B树:在二分查找树的基础上,增加单个节点的数据存储数量,同时增加了树的子节点数,一次计算可以把查找范围缩小更多。
插入节点过程:中间节点向上分裂,某个分支超过最大节点数了,最中间的节点,加入根节点中去 https://www.cs.usfca.edu/~galles/visualization/BTree.html(可视化演示网站)
但是非叶子节点会存放索引数据和业务数据,为了查找对比计算,需要把数据加载到内存以及 CPU 高速缓存中时,都要把索引数据和无关的业务数据全部查出来。如果所对比的节点不是所查的数据,那么这些加载进内存的业务数据就毫无用处,全部抛弃。
B+ 树:为了拆分索引数据与业务数据的平衡多叉树。非叶子节点只保存索引数据,叶子节点保存索引数据与业务数据,叶子结点形成双向链表,所有元素都会出现在叶子节点。这样即保证了叶子节点的简约干净,数据量大大减小,又保证了最终能查到对应的业务数。既提高了单次 I/O 数据的有效性,又减少了 I/O 次数,还实现了业务。
红黑树:红黑树就是介于完全不平衡和完全平衡之间的一种二叉树,可以解决二叉树的这个问题(二叉树缺点:顺序插入时,会形成一个链表,查询性能大大降低。大数据量情况下,层级较深,检索速度慢,),通过每个节点有红黑两种颜色、从节点到任意叶子节点会经过相同数量的黑色节点等一系列规则,实现了树的层数最大也只会有两倍的差距,这样既能提高插入和删除的效率,又能让树相对平衡从而有还不错的查询效率。
从整体上讲,红黑树就是一种中庸之道的二叉树,但是用来当mysql的索引还是有问题,用红黑树存放100万个数据,把树放满,这个树的高度会越变越高和二叉搜索树一样
1、B树和B+树的区别
2、为什么mysql使用B+树?
3、MyISAM和InnoDB引擎中的B+树区别是什么?
1、什么是回表?
如果我用 product_no 二级索引查询商品,如下查询语句:
select * from product where product_no = '0002';
会先检二级索引中的 B+Tree 的索引值(商品编码,product_no),找到对应的叶子节点,然后获取主键值,然后再通过主键索引中的 B+Tree 树查询到对应的叶子节点,然后获取整行数据。这个过程叫「回表」,也就是说要查两个 B+Tree 才能查到数据。
2、创建表时,InnoDB 存储引擎会怎么选择索引?
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。