赞
踩
当前版本号[20230406]。
版本 | 修改说明 |
---|---|
20230406 | 初版 |
本课程的笔记已经更新完毕,各位可以通过点击《黑马程序员MySQL数据库入门到精通,从mysql安装到mysql高级、mysql优化》学习笔记总目录查看所有知识点,同时也能免费下载学习笔记和思维导图。
我们之前在讲解SQL语句的时候,讲解了DQL语句,也就是数据查询语句,但是之前讲解的查询都是单表查询,而本章节我们要学习的则是多表查询操作,主要从以下几个方面进行讲解。
项目开发中,在进行数据库表结构设计时,会根据业务需求及业务模块之间的关系,分析并设计表结构,由于业务之间相互关联,所以各个表结构之间也存在着各种联系,基本上分为三种:
案例: 部门 与 员工的关系
关系: 一个部门对应多个员工,一个员工对应一个部门
实现: 在 多 的一方建立外键,指向 一 的一方的主键
案例: 学生 与 课程 的关系
关系: 一个学生可以选修多门课程,一门课程也可以供多个学生选择
实现: 建立第三张中间表,中间表至少包含两个外键,分别关联两方主键
对应的SQL脚本:
#建立学生表并添加数据 create table student01( id int auto_increment primary key comment '主键ID', name varchar(10) comment '姓名', no varchar(10) comment '学号' ) comment '学生表'; insert into student01 values (null, '黛绮丝', '2000100101'),(null, '谢逊', '2000100102'),(null, '殷天正', '2000100103'),(null, '韦一笑', '2000100104'); #建立课程表并添加数据 create table course01( id int auto_increment primary key comment '主键ID', name varchar(10) comment '课程名称' ) comment '课程表'; insert into course01 values (null, 'Java'), (null, 'PHP'), (null , 'MySQL') , (null, 'Hadoop'); #添加中间表并添加数据 create table student_course( id int auto_increment primary key comment '主键', studentid int not null comment '学生ID', courseid int not null comment '课程ID', constraint fk_courseid foreign key (courseid) references course01 (id), constraint fk_studentid foreign key (studentid) references student01 (id) )comment '学生课程中间表'; insert into student_course values (null,1,1),(null,1,2),(null,1,3),(null,2,2), (null,2,3),(null,3,4);
最后我们可以以可视化界面的形式展示。
步骤如下:
接着就可以看到表与表之间的关系啦
案例: 用户 与 用户 详情的关系
关系: 一对一关系,多用于单表拆分,将一张表的基础字段放在一张表中,其他详情字段放在另一张表中,以提升操作效率
实现: 在任意一方加入外键,关联另外一方的主键,并且设置外键为唯一的(UNIQUE)
对应的SQL脚本:
#创建用户基本信息表 create table tb_user( id int auto_increment primary key comment '主键ID', name varchar(10) comment '姓名', age int comment '年龄', gender char(1) comment '1: 男 , 2: 女', phone char(11) comment '手机号' ) comment '用户基本信息表'; #创建用户教育信息表 create table tb_user_edu( id int auto_increment primary key comment '主键ID', degree varchar(20) comment '学历', major varchar(50) comment '专业', primaryschool varchar(50) comment '小学', middleschool varchar(50) comment '中学', university varchar(50) comment '大学', userid int unique comment '用户ID', constraint fk_userid foreign key (userid) references tb_user(id) ) comment '用户教育信息表'; #向用户基本信息表添加数据 insert into tb_user(id, name, age, gender, phone) values (null,'黄黄',45,'1','18800001111'), (null,'笔笔',35,'2','18800002222'), (null,'码云',55,'1','18800008888'), (null,'李彦',50,'1','18800009999'); #向用户教育信息表添加数据 insert into tb_user_edu(id, degree, major, primaryschool, middleschool, university, userid) values (null,'本科','舞蹈','静安区第一小学','静安区第一中学','北京舞蹈学院',1), (null,'硕士','表演','朝阳区第一小学','朝阳区第一中学','北京电影学院',2), (null,'本科','英语','杭州市第一小学','杭州市第一中学','杭州师范大学',3), (null,'本科','应用数学','阳泉第一小学','阳泉区第一中学','清华大学',4);
1). 删除之前 emp, dept表的测试数据
2). 执行如下脚本,创建emp表与dept表并插入测试数据
#创建dept表,并插入数据 create table dept( id int auto_increment comment 'ID' primary key, name varchar(50) not null comment '部门名称' )comment '部门表'; INSERT INTO dept (id, name) VALUES (1, '研发部'), (2, '市场部'),(3, '财务部'), (4, '销售部'), (5, '总经办'), (6, '人事部'); #创建emp表,并插入数据 create table emp( id int auto_increment comment 'ID' primary key, name varchar(50) not null comment '姓名', age int comment '年龄', job varchar(20) comment '职位', salary int comment '薪资', entrydate date comment '入职时间', managerid int comment '直属领导ID', dept_id int comment '部门ID' )comment '员工表'; #添加外键 alter table emp add constraint fk_emp_dept_id foreign key (dept_id) references dept(id); #添加员工表数据 INSERT INTO emp (id, name, age, job,salary, entrydate, managerid, dept_id) VALUES (1, '金庸', 66, '总裁',20000, '2000-01-01', null,5), (2, '张无忌', 20, '项目经理',12500, '2005-12-05', 1,1), (3, '杨逍', 33, '开发', 8400,'2000-11-03', 2,1), (4, '韦一笑', 48, '开发',11000, '2002-02-05', 2,1), (5, '常遇春', 43, '开发',10500, '2004-09-07', 3,1), (6, '小昭', 19, '程序员鼓励师',6600, '2004-10-12', 2,1), (7, '灭绝', 60, '财务总监',8500, '2002-09-12', 1,3), (8, '周芷若', 19, '会计',4800, '2006-06-02', 7,3), (9, '丁敏君', 23, '出纳',5250, '2009-05-13', 7,3), (10, '赵敏', 20, '市场部总监',12500, '2004-10-12', 1,2), (11, '鹿杖客', 56, '职员',3750, '2006-10-03', 10,2), (12, '鹤笔翁', 19, '职员',3750, '2007-05-09', 10,2), (13, '方东白', 19, '职员',5500, '2009-02-12', 10,2), (14, '张三丰', 88, '销售总监',14000, '2004-10-12', 1,4), (15, '俞莲舟', 38, '销售',4600, '2004-10-12', 14,4), (16, '宋远桥', 40, '销售',4600, '2004-10-12', 14,4), (17, '陈友谅', 42, null,2000, '2011-10-12', 1,null);
多表查询就是指从多张表中查询数据。
原来查询单表数据,执行的SQL形式为:
select * from emp;
那么我们要执行多表查询,就只需要使用逗号分隔多张表即可,如:
select * from emp , dept ;
具体的执行结果如下:
此时,我们看到查询结果中包含了大量的结果集,总共102条记录,而**这其实就是员工表emp所有的记录 (17) 与 部门表dept所有记录(6) 的所有组合情况,这种现象称之为笛卡尔积。**接下来,就来简单介绍下笛卡尔积。
笛卡尔积: 笛卡尔乘积是指在数学中,两个集合 A 集合 和 B 集合的所有组合情况。
而在多表查询中,我们是需要消除无效的笛卡尔积,只剩下有效的数据,只保留两张表关联部分的数据。
在SQL语句中,如何来去除无效的笛卡尔积呢? 我们可以给多表查询加上连接查询的条件即可。
#当员工表里的部门id 等于 部门表中的id ,就可以来消除无效的笛卡尔积
select * from emp,dept where emp.dept_id = dept.id;
而由于id为17的员工,没有dept_id字段值,所以在多表查询时,根据连接查询的条件并没有查询到。
内连接
相当于查询A、B交集部分数据
外连接
左外连接:查询左表所有数据,以及两张表交集部分数据
右外连接:查询右表所有数据,以及两张表交集部分数据
自连接
当前表与自身的连接查询,自连接必须使用表别名
内连接查询的是两张表交集部分的数据。(也就是绿色部分的数据)
内连接的语法分为两种: 隐式内连接、显式内连接。先来学习一下具体的语法结构。
SELECT 字段列表 FROM 表1 , 表2 WHERE 条件 ... ;
SELECT 字段列表 FROM 表1 [ INNER ] JOIN 表2 ON 连接条件 ... ;
案例:
A. 查询每一个员工的姓名 , 及关联的部门的名称 (隐式内连接实现)
select emp.name,dept.name from emp,dept where emp.dept_id = dept.id ;
#在后续的表中,如果表名过长写得不方便呢,就可以取别名,简化SQL编写
select e.name,d.name from emp e ,dept d where e.dept_id = d.id;
#只需要在from 后面接表的时候,一起把别名打出来即可
B. 查询每一个员工的姓名 , 及关联的部门的名称 (显式内连接实现) — INNER JOIN … ON …
select e.name,d.name from emp e inner join dept d on e.dept_id = d.id;
#从emp表连接到dept表
表的别名:
①. tablea as 别名1 , tableb as 别名2 ;
②. tablea 别名1 , tableb 别名2 ;
注意事项:
一旦为表起了别名,就不能再使用表名来指定对应的字段了,此时只能够使用别名来指定字段。
外连接分为两种,分别是:左外连接 和 右外连接。具体的语法结构为:
SELECT 字段列表 FROM 表1 LEFT [ OUTER ] JOIN 表2 ON 条件 ... ;
左外连接相当于查询表1(左表)的所有数据,当然也包含表1和表2交集部分的数据。
SELECT 字段列表 FROM 表1 RIGHT [ OUTER ] JOIN 表2 ON 条件 ... ;
右外连接相当于查询表2(右表)的所有数据,当然也包含表1和表2交集部分的数据。
案例:
A. 查询emp表的所有数据, 和对应的部门信息
由于需求中提到,要查询emp的所有数据,所以是不能内连接查询的,需要考虑使用外连接查询。
(内连接不能查出所有数据!)
select e.*,d.name from emp e left join dept d on e.dept_id = d.id;
B. 查询dept表的所有数据, 和对应的员工信息(右外连接)
select d.*,e.name from dept d right join emp e on d.id = e.dept_id;
注意事项:
左外连接和右外连接是可以相互替换的,只需要调整在连接查询时SQL中,表结构的先后顺序就可以了。
而我们在日常开发使用时,更偏向于左外连接。
自连接查询,顾名思义,就是自己连接自己,也就是把一张表连接查询多次。我们先来学习一下自连接的查询语法:
SELECT 字段列表 FROM 表A 别名A JOIN 表A 别名B ON 条件 ... ;
而对于自连接查询,可以是内连接查询,也可以是外连接查询。
案例:
A. 查询员工 及其 所属领导的名字
#可以把emp a ,emp b看成两个表,在当a的领导姓名与b的姓名相关联,进行输出
#自连接必须取别名,否则你无法分清哪个因素对于哪个
select a.name,b.name from emp a ,emp b where a.managerid = b.id;
此时,右边是左边的领导
B. 查询所有员工 emp 及其领导的名字 emp , 如果员工没有领导, 也需要查询出来(这就说明我们需要用到左外连接,才能把所有信息,包括非空输出出来)
#要完全显示员工的信息,因此要把员工的那张放在左边
select a.name '员工',b.name '领导' from emp a left join emp b on a.managerid = b.id;
注意事项:
在自连接查询中,必须要为表起别名,要不然我们不清楚所指定的条件、返回的字段,到底是哪一张表的字段。
对于union查询,就是把多次查询的结果合并起来,形成一个新的查询结果集。
SELECT 字段列表 FROM 表A ...
UNION [ ALL ]
SELECT 字段列表 FROM 表B ....;
案例:
A. 将薪资低于 5000 的员工 , 和 年龄大于 50 岁的员工全部查询出来.
当前对于这个需求,我们可以直接使用多条件查询,使用逻辑运算符 or 连接即可。
那这里呢,我们 也可以通过union/union all来联合查询.
select * from emp where salary < 5000
union all
select * from emp where age > 50;
union all查询出来的结果,仅仅进行简单的合并,并未去重。
如果把 all 去掉,就不会有重复的了。
select * from emp where salary < 5000
union
select * from emp where age > 50;
union 联合查询,会对查询出来的结果进行去重处理。
注意:
如果多条查询语句查询出来的结果,字段数量不一致,在进行union/union all联合查询时,将会报 错。如:
返回字段长度不一样的话,是无法合并的。
SQL语句中嵌套SELECT语句,称为嵌套查询,又称子查询。
SELECT * FROM t1 WHERE column1 = ( SELECT column1 FROM t2 );
子查询外部的语句可以是INSERT / UPDATE / DELETE / SELECT 的任何一个。
根据子查询结果不同,分为:
A. 标量子查询(子查询结果为单个值)
B. 列子查询(子查询结果为一列)
C. 行子查询(子查询结果为一行)
D. 表子查询(子查询结果为多行多列)
根据子查询位置,分为:
A. WHERE之后
B. FROM之后
C. SELECT之后
子查询返回的结果是单个值(数字、字符串、日期等),最简单的形式,这种子查询称为标量子查询。
常用的操作符:= <> > >= < <=
案例:
A. 查询 “销售部” 的所有员工信息
完成这个需求时,我们可以将需求分解为两步:
#①. 查询 "销售部" 部门ID
select id from dept where name = '销售部';
#②. 根据 "销售部" 部门ID, 查询员工信息
select * from emp where dept_id = 4;
#合并
select * from emp where dept_id = (select id from dept where name = '销售部');
B. 查询在 “方东白” 入职之后的员工信息
完成这个需求时,我们可以将需求分解为两步:
①. 查询 方东白 的入职日期
②. 查询指定入职日期之后入职的员工信息
#①. 查询 方东白 的入职日期
select entrydate from emp where name = '方东白';
#②. 查询指定入职日期之后入职的员工信息
select * from emp where entrydate > '2009-02-12';
#合并
select * from emp where entrydate > (select entrydate from emp where name = '方东白');
子查询返回的结果是一列(可以是多行),这种子查询称为列子查询。
常用的操作符:IN 、NOT IN 、 ANY 、SOME 、 ALL
案例:
A. 查询 “销售部” 和 “市场部” 的所有员工信息
分解为以下两步:
①. 查询 “销售部” 和 “市场部” 的部门ID
select id from dept where name = '销售部' or name = '市场部';
②. 根据部门ID, 查询员工信息
select * from emp where dept_id in (2,4);
接着合并在一起
#in指的是在指定的集合范围之内,多选一
select * from emp where dept_id in (select id from dept where name = '销售部' or name = '市场部');
信息如图所示:
B. 查询比 财务部 所有人工资都高的员工信息
分解为以下两步:
①. 查询所有 财务部 人员工资
select id,salary from emp where dept_id =(select id from dept where name = '财务部');
②. 比 财务部 所有人工资都高的员工信息
#都:代表我们这里要使用 all
select * from emp where salary > all ( select salary from emp where dept_id =(select id from dept where name = '财务部') );
信息如图所示:
C. 查询比研发部其中任意一人工资高的员工信息
分解为以下两步:
①. 查询研发部所有人工资
#第一步:先看研发部的id是多少
select id from dept where name = '研发部';
#第二步:再合并,看研发部下的每个人的工资是多少
select salary from emp where dept_id = (select id from dept where name = '研发部');
②. 比研发部其中任意一人工资高的员工信息
#任意一人:代表我们这里要使用 any, some
select * from emp where salary > any(select salary from emp where dept_id = (select id from dept where name = '研发部'));
信息如图所示:
子查询返回的结果是**一行(可以是多列)**,这种子查询称为行子查询。 常用的操作符:= 、<> 、IN 、NOT IN
案例:
A. 查询与 “张无忌” 的薪资及直属领导相同的员工信息 ;
拆解为两步进行:
①. 查询 “张无忌” 的薪资及直属领导
select salary,managerid from emp where name = '张无忌';
②. 查询与 “张无忌” 的薪资及直属领导相同的员工信息 ;
select * from emp where (salary,managerid) = (select salary,managerid from emp where name = '张无忌');
信息如图所示:
子查询返回的结果是多行多列,这种子查询称为表子查询。 常用的操作符:IN
案例:
A. 查询与 “鹿杖客” , “宋远桥” 的职位和薪资相同的员工信息
分解为两步执行:
①. 查询 “鹿杖客” , “宋远桥” 的职位和薪资
select job,salary from emp where name = '鹿杖客' or name = '宋远桥';
②. 查询与 “鹿杖客” , “宋远桥” 的职位和薪资相同的员工信息
# (job,salary) in 表示的是只要 (job,salary) 符合后面的条件,就会进行输出
select * from emp where (job,salary) in (select job,salary from emp where name = '鹿杖客' or name = '宋远桥');
信息如图所示:
B. 查询入职日期是 “2006-01-01” 之后的员工信息 , 及其部门信息
分解为两步执行:
①. 入职日期是 “2006-01-01” 之后的员工信息
select * from emp where entrydate > '2006-01-01';
②. 查询这部分员工, 对应的部门信息;
#(select * from emp where entrydate > '2006-01-01') e 在这里是把上一步的结果作为一张临时表,起别名为e进行查询
#因为员工表有的人没有部门,所以要左外连接查询,使其查询的结果能完整
select e.*,d.* from (select * from emp where entrydate > '2006-01-01') e left join dept d on e.dept_id = d.id;
在这个案例中,我们主要运用上面所讲解的多表查询的语法,完成以下的12个需求即可,而这里主要涉及到的表就三张:emp员工表、dept部门表、salgrade薪资等级表。
salgrade(薪资等级表)数据环境准备:
create table salgrade(
grade int,
losal int, #最低工资
hisal int #最高工资
) comment '薪资等级表';
insert into salgrade values (1,0,3000);
insert into salgrade values (2,3001,5000);
insert into salgrade values (3,5001,8000);
insert into salgrade values (4,8001,10000);
insert into salgrade values (5,10001,15000);
insert into salgrade values (6,15001,20000);
insert into salgrade values (7,20001,25000);
insert into salgrade values (8,25001,30000);
表: emp , dept
连接条件: emp.dept_id = dept.id
select emp.name,age,job,dept.name from emp,dept where emp.dept_id = dept.id;
结果如下图所示:
表: emp , dept
连接条件: emp.dept_id = dept.id
select emp.name,age,job,d.name from emp inner join dept d on emp.dept_id = d.id where age < 30;
结果如下图所示:
表: emp , dept
连接条件: emp.dept_id = dept.id
#distinct 去掉重复数据
select distinct dept.id,dept.name from emp,dept where emp.dept_id = dept.id;
结果如下图所示:
表: emp , dept
连接条件: emp.dept_id = dept.id
#如果在外连接需要在加条件,就在on后面的条件接上where,然后输入新的条件
#如果把where改成and,会显示不全
#因为使用where,可以跳出左外连接的限制;而使用and,依然在左外连接之内,会显示左表所有
select e.*,d.name from emp e left join dept d on d.id = e.dept_id where e.age > 40;
结果如下图所示:
表: emp , salgrade
连接条件 : emp.salary >= salgrade.losal and emp.salary <= salgrade.hisal(员工工资大于等于最低工资,小于等于最高工资)
select emp.*,grade from emp,salgrade where emp.salary >= salgrade.losal and emp.salary <= salgrade.hisal;
结果如下图所示:
【重点】在这里多个条件连接在一起是用and进行连接
表: emp , salgrade , dept
连接条件 : emp.salary between salgrade.losal and salgrade.hisal , emp.dept_id = dept.id
查询条件 : dept.name = ‘研发部’
select emp.*,grade from emp,salgrade,dept where (emp.salary between salgrade.losal and salgrade.hisal) and emp.dept_id = dept.id and dept.name = '研发部';
结果如下图所示:
表: emp , dept
连接条件 : emp.dept_id = dept.id
select avg(e.salary) from emp e,dept d where e.dept_id = d.id and d.name = '研发部';
结果如下图所示:
①. 查询 “灭绝” 的薪资
select salary from emp e where e.name = '灭绝' ;
②. 查询比她工资高的员工数据
select * from emp e where salary >(select salary from emp e where e.name = '灭绝');
结果如下图所示:
①. 查询员工的平均薪资
select avg(salary) from emp e ;
②. 查询比平均薪资高的员工信息
select * from emp e where salary >(select avg(salary) from emp e);
结果如下图所示:
①. 查询指定部门平均薪资
select avg(salary) from emp e ,dept d where e.dept_id = d.id and d.name='研发部';
②. 查询低于本部门平均工资的员工信息
select * from emp where salary < (select avg(salary) from emp e ,dept d where e.dept_id = d.id and d.name='研发部');
结果如下图所示:
select id,name,(select count(*) from emp e where e.dept_id = d.id) from dept d;
结果如下图所示:
表: student01 , course01 , student_course
连接条件: student01.id = student_course.studentid , course01.id = student_course.courseid
select s.name , s.no , c.name from student01 s , student_course sc , course01 c where s.id = sc.studentid and sc.courseid = c.id ;
结果如下图所示:
注: 以上需求的实现方式可能会很多, SQL写法也有很多,只要能满足我们的需求,查询出符合条件的记录即可。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。