赞
踩
目录
增加索引,会增加增删改的开销,因为数据一变动索引必须同时改变才可以。同时也会增加空间开销,索引是一个文件,如果数据多了,那么这个文件也会变大。但是数据库的操作中,大部分操作是进行查找操作,有了索引的话就可以更快的找到目标值,没有索引就只能遍历表中的数据。那么索引的一些缺点也可以被优点抵消。
索引虽好,但不乱用。
1.创建索引最好在数据库刚创建的时候就创建好索引,如果有了大量数据后再去添加索引,此时会吃掉大量的磁盘IO,需要一些时间,此时数据库无法正常使用。
2.如果一列中存在大量相同的数据,比如人的性别,大学生的年龄诸如此类的数据,这样就不适合创建索引。这与其底层的数据结构有关,下面讲。
3.如果对一列的数据进行的操作大多是增删改,而不是查,此时也不适合用索引。
4.如果磁盘空间不足时,也不适合使用索引。
1.创建好索引后,查询的时候不需要我们人为手动进行操作,数据库的执行引擎会自动来执行,它会评估出是否需要使用索引,看看那种方案成本低,效率高。
2. 可以通过explain关键字加在每一次select语句的前面,这样可以显示查询过程中索引的具体使用情况。
- -- 1:使用primary key, unique, foreign key 这些约束关系时,会自动创建索引
- -- 因为这三者增加数据的时候先要查看数据是否符合约束关系,其次才能进行其他操作
-
- -- 2:添加其他索引
- -- 此时是我们人为添加上索引
- create index 索引名 on 表名(字段名);
比如,对一个学生表的学生姓名添加索引。
- -- student 是学生表 name 是学生姓名
- create index idx_name on student(name);
show index from 表名;
下面这张表查看到是student学生表的索引,该表只有主键索引。
参数 | 说明 |
Table | 表示创建索引的数据表名,这里是 student 数据表。 |
Non_unique | 表示该索引是否是唯一索引。若不是唯一索引,则该列的值为 1;若是唯一索引,则该列的值为 0。这里只有主键索引,所以是唯一的。 |
Key_name | 表示索引的名称。 |
Seq_in_index | 表示该列在索引中的位置,如果索引是单列的,则该列的值为 1;如果索引是组合索引,则该列的值为每列在索引定义中的顺序。 |
Column_name | 表示定义索引的列字段。这里是对id加了索引。 |
Collation | 表示列以何种顺序存储在索引中。在 MySQL 中,升序显示值“A”(升序),若显示为 NULL,则表示无分类。这里的主键是auto_increment的,所以是升序。 |
Cardinality | 索引中唯一值数目的估计值。基数根据被存储为整数的统计数据计数,所以即使对于小型表,该值也没有必要是精确的。基数越大,当进行联合时,MySQL 使用该索引的机会就越大。 |
Sub_part | 表示列中被编入索引的字符的数量。若列只是部分被编入索引,则该列的值为被编入索引的字符的数目;若整列被编入索引,则该列的值为 NULL。 |
Packed | 指示关键字如何被压缩。若没有被压缩,值为 NULL。 |
Null | 用于显示索引列中是否包含 NULL。若列含有 NULL,该列的值为 YES。若没有,则该列的值为 NO。 |
Index_type | 显示索引使用的类型和方法(BTREE、FULLTEXT、HASH、RTREE)。 |
Comment | 显示评注。 |
create index 索引名 on 表名(字段名);
比如,把一个学生表的学生姓名的索引删除。
drop index idx_name on student(name);
数据库底层数据结构如果有了索引之后,一般是一颗B+树。这里只是简单介绍一下B+树。
要想知道什么是B+树,就要知道这些树,二叉搜索树-->B树(n叉搜索树)-->B+树。
【Java】二叉搜索树 TreeMap&TreeSet_p_fly的博客-CSDN博客这里有对二叉搜索树的介绍。
B树:在二叉搜索树的基础上每个结点可以存更多的值,同时也满足左边比根小,右边比根大的特点。这样一棵树就会变得扁胖起来。如下图
B+树:在B树的基础上有了一点变动,就是每个结点会把父亲结点的最大值存到自己结点中,这样到了叶子结点的时候,所有的叶子节点中存的值就是所有的值。最后的叶子结点是通过类似链表的数据结构连接的。
1.对于MySQL的InnoDB这个数据库引擎,有了索引,就会如上图一样存储。不同的数据库的存储方法也各有差异。
2.如果有主键索引和其他索引的话,主键索引会像上图那样存储。而其他索引到了叶子节点的时候存储对应的主键索引,如果通过其他索引查询时,查到其他索引的叶子节点后,再去主键索引里查。
3.非叶子结点是不存储数据的,只存储索引
1.硬盘的IO次数少了(对于二叉树,它的高度降了下来)
2.更适合进行范围查询
3.查询更均衡。因为数据都是在叶子节点上。(B树则是较浅的结点可以快速查到,较深的反之)
4.占用的空间减少了(非叶子结点没有存数据,这样避免重复浪费空间)
有什么错误评论区指出,希望可以帮到你。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。