赞
踩
当进行数据的insert操作的时候,可以考虑采用以下几种优化方案:
- -- 如果需要同时对一张表插入很多行数据时,应该尽量使用多个值表的insert语句,这种方式将大大的缩减
- -- 客户端与数据库之间的连接、关闭等消耗。使得效率比分开执行的单个insert语句快。
-
- -- 原始方式为:
- insert into tb_test values(1,'Tom');
- insert into tb_test values(2,'Cat');
- insert into tb_test values(3,'Jerry');
-
-
- -- 优化后的方案为 :
-
- insert into tb_test values(1,'Tom'),(2,'Cat'),(3,'Jerry');
- -- 在事务中进行数据插入。
- begin;
- insert into tb_test values(1,'Tom');
- insert into tb_test values(2,'Cat');
- insert into tb_test values(3,'Jerry');
- commit;
- -- 数据有序插入
- insert into tb_test values(4,'Tim');
- insert into tb_test values(1,'Tom');
- insert into tb_test values(3,'Jerry');
- insert into tb_test values(5,'Rose');
- insert into tb_test values(2,'Cat');
-
-
- -- 优化后
- insert into tb_test values(1,'Tom');
- insert into tb_test values(2,'Cat');
- insert into tb_test values(3,'Jerry');
- insert into tb_test values(4,'Tim');
- insert into tb_test values(5,'Rose');
数据准备:
- CREATE TABLE `emp` (
- `id` int(11) NOT NULL AUTO_INCREMENT,
- `name` varchar(100) NOT NULL,
- `age` int(3) NOT NULL,
- `salary` int(11) DEFAULT NULL,
- PRIMARY KEY (`id`)
- );
-
- insert into `emp` (`id`, `name`, `age`, `salary`) values('1','Tom','25','2300');
- insert into `emp` (`id`, `name`, `age`, `salary`) values('2','Jerry','30','3500');
- insert into `emp` (`id`, `name`, `age`, `salary`) values('3','Luci','25','2800');
- insert into `emp` (`id`, `name`, `age`, `salary`) values('4','Jay','36','3500');
- insert into `emp` (`id`, `name`, `age`, `salary`) values('5','Tom2','21','2200');
- insert into `emp` (`id`, `name`, `age`, `salary`) values('6','Jerry2','31','3300');
- insert into `emp` (`id`, `name`, `age`, `salary`) values('7','Luci2','26','2700');
- insert into `emp` (`id`, `name`, `age`, `salary`) values('8','Jay2','33','3500');
- insert into `emp` (`id`, `name`, `age`, `salary`) values('9','Tom3','23','2400');
- insert into `emp` (`id`, `name`, `age`, `salary`) values('10','Jerry3','32','3100');
- insert into `emp` (`id`, `name`, `age`, `salary`) values('11','Luci3','26','2900');
- insert into `emp` (`id`, `name`, `age`, `salary`) values('12','Jay3','37','4500');
-
- create index idx_emp_age_salary on emp(age,salary);
第一种是通过对返回数据进行排序,也就是 filesort 排序,所有不是通过索引直接返回排序结果的
排序都叫 FileSort 排序。
第二种通过有序索引顺序扫描直接返回有序数据,这种情况即为 using index,不需要额外排序,
操作效率高。
- -- 创建组合索引
- create index idx_emp_age_salary on emp(age,salary);
-
- -- 排序,order by
-
- explain select * from emp order by age; -- Using filesort
- explain select * from emp order by age,salary; -- Using filesort
-
-
- explain select id from emp order by age; -- Using index
- explain select id,age from emp order by age; -- Using index
- explain select id,age,salary,name from emp order by age; -- Using filesort
-
- -- order by后边的多个排序字段要求尽量排序方式相同
- explain select id,age from emp order by age asc, salary desc;
- -- Using index; Using filesort
- explain select id,age from emp order by age desc, salary desc;
- -- Backward index scan;Using index
-
- -- order by后边的多个排序字段顺序尽量和组合索引字段顺序一致
- explain select id,age from emp order by salary,age; -- Using index; Using filesort
通过创建合适的索引,能够减少 Filesort 的出现,但是在某些情况下,条件限制不能让Filesort消
失,那就需要加快 Filesort的排序操作。对于Filesort, MySQL 有两种排序算法:
①两次扫描算法 :MySQL4.1 之前,使用该方式排序。首先根据条件取出排序字段和行指针信
息,然后在排序区 sort buffer 中排序,如果sort buffer不够,则在临时表 temporary table 中存储排
序结果。完成排序之后,再根据行指针回表读取记录,该操作可能会导致大量随机I/O操作。
②一次扫描算法:一次性取出满足条件的所有字段,然后在排序区 sort buffer 中排序后直接输出
结果集。排序时内存开销较大,但是排序效率比两次扫描算法要高。
MySQL 通过比较系统变量 max_length_for_sort_data 的大小和Query语句取出的字段总大小, 来
判定是否那种排序算法,如果max_length_for_sort_data 更大,那么使用第二种优化之后的算法;
否则使用第一种。
可以适当提高 sort_buffer_size 和 max_length_for_sort_data 系统变量,来增大排序区的大小,
提高排序的效率。
- show variables like 'max_length_for_sort_data';
- show variables like 'sort_buffer_size';
GROUP BY 实际上也同样会进行排序操作,而且与ORDER BY 相比,GROUP BY 主要只是多了
排序之后的分组操作。如果在分组的时候还使用了其他的一些聚合函数,那么还需要一些聚合函数
的计算。所以,在GROUP BY 的实现过程中,与 ORDER BY 一样也可以利用到索引。
如果查询包含 group by 但是想要避免排序结果的消耗, 可以执行order by null 禁止排序。如下 :
- drop index idx_emp_age_salary on emp;
-
- explain select age,count(*) from emp group by age;
-
- explain select age,count(*) from emp group by age order by null;
-
- create index idx_emp_age_salary on emp(age,salary);
一般分页查询时,通过创建覆盖索引能够比较好地提高性能。一个常见又非常头疼的问题就是 limit
900000,10 ,此时需要MySQL排序前900010 记录,仅仅返回900000 - 900010 的记录,其他记录
丢弃,查询排序的代价非常大 。
有两种优化方案:
①在索引上完成排序分页操作,最后根据主键关联回原表查询所需要的其他列内容。
②该方案适用于主键自增的表,可以把Limit 查询转换成某个位置的查询 。
- -- 优化limit
- select count(*) from tb_user;
-
- select * from tb_user limit 0,10;
-
- explain select * from tb_user limit 900000,10; -- 0.684
-
- explain select * from tb_user a, (select id from tb_user order by id limit 900000,10) b where a.id = b.id; -- 0.486
-
-
-
- explain select * from tb_user where id > 900000 limit 10;
使用子查询可以一次性的完成很多逻辑上需要多个步骤才能完成的SQL操作,同时也可以避免事务
或者表锁死,并且写起来也很容易。但是,有些情况下,子查询是可以被更高效的连接(JOIN)
替代。
- explain select * from user where uid in (select uid from user_role );
- explain select * from user u , user_role ur where u.uid = ur.uid;
system>const>eq_ref>ref>range>index>ALL
连接(Join)查询之所以更有效率一些 ,是因为MySQL不需要在内存中创建临时表来完成这个逻辑上
需要两个步骤的查询工作。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。