赞
踩
三范式是关系型数据库中的一种规范,包括第一范式、第二范式和第三范式:
假设我们有一个学生选课表,包含以下字段:学号、姓名、课程名称、教师姓名。这个表可能如下:
学号 | 姓名 | 课程名称 | 教师姓名 |
---|---|---|---|
001 | 张三 | 数学 | 李老师 |
001 | 张三 | 英语 | 王老师 |
002 | 李四 | 数学 | 李老师 |
002 | 李四 | 英语 | 王老师 |
第一范式(1NF):每一列都是不可分割的最小单元。在这个例子中,所有的列(学号、姓名、课程名称、教师姓名)都是最小的数据单元,不能再分割,所以满足第一范式。
第二范式(2NF):在满足第一范式的基础上,非主属性必须完全依赖于主属性。在这个例子中,如果我们将(学号,课程名称)作为主键,那么其他的列(姓名,教师姓名)都完全依赖于这个主键,所以满足第二范式。
第三范式(3NF):在满足第二范式的基础上,非主键字段不能依赖于其他非主键字段。在这个例子中,姓名依赖于学号,教师姓名依赖于课程名称,不存在非主键字段相互依赖的情况,所以满足第三范式。
第一范式就是没有不可再分的列
第二范式就是满足第一范式的前提下,非主键完全依赖主键
第三范式就是满足第三范式的前提下,非主键之间不互相依赖
遵循数据库三范式是主要用于减少数据的冗余和方便后续的维护和更新
实际开发中,并不会严格遵循三范式,因为实际工作中,不但要考虑设计三范式之外,还要考虑查询性能
例如,某些场景如果要严格遵循三范式,那么可能需要将多个字段存储到多张表中进行查询,而多张表的联查效率是非常低的,这样情况下为了满足性能的需求,我们通常会涉及冗余字段存放到更少的表中,以减少联表查这就是使用空间换时间的做法询的性能开销,
关系型数据库适宜于关系模型的数据库,使用表格结构来组织和存储数据,数据是以行和列的形式存储的,并且可以通过定义主键和外键来建立表之间的关系
关系型数据的特点主要有以下几种:
关系型数据库的代表:MySQL、Oracle等
非关系型数据库(NoSQL),是一种不同于传统关系型数据库系统,他们不依赖于表格和关系模型,而是采用各种不同的数据模型(如键值对、文档、图等)来存储和管理数据,并且放宽了对数据一致性的要求
非关系型数据库的特点主要有以下几种:
非关系型数据库的代表:Redis、MongoDB、Neo4j等
数据模型不同:
数据结构不同:
查询语言不同:
事务支持不同:
扩展性与性能不同
存储引擎就是如何存储数据、如何为存储数据建立索引和如何更新、查询数据等技术的实现方法。因为在关系型数据库中数据的存储是以表的形式存储的,所以存储引擎也可以称为表类型(即存储和操作此表类型)
MySQL常用的存储引擎有以下几种:
InnoDB:MySQL(5.5+)的默认存储引擎,支持事务处理、行级锁定和物理外键约束
MyISAM:MySQL早期默认存储引擎,不支持事务和行级锁定
MEMORY:将表的数据存储在内存中,提供极快的访问速度
InnoDB和MyISAM是MySQL的两种常用的存储引擎,它们的主要的区别就是:
"锁粒度"是指数据库管理系统在进行数据操作时,对数据加锁的范围。不同的数据库管理系统或者不同的存储引擎,支持的锁粒度可能会有所不同。
InnoDB和MyISAM是MySQL数据库的两种常见的存储引擎,它们支持的锁粒度不同:
也就是说物理外键会存在一些问题:
性能问题:插入之前会先去主键中查询,性能较慢
可能会带来数据库更新风暴问题:数据库更新风暴是指在一个较短的时间内,大量的并发数据库更新操作集中发生,导致数据库服务器在处理这些请求的时候面临巨大压力,可能引起性能瓶颈、延迟增大设置系统崩溃现象。这种情况通常发生在高并发的情况下
物理删除和逻辑删除的定义如下:
在日常开发中,使用哪种删除方式会取决于具体的需求和业务场景:
内连接和外连接是SQL中用于连接多个表的操作:
内连接:最常用的连接类型之一,他根据两个或者多个表之间共同列值来连接这些表。在内连接中,只有再连接的表之间匹配值的时候,才会有返回结果。例如:
SELECT 列名 FROM 表1 INNER JOIN 表2 ON 表1.列 = 表2.列;
外连接:是另一种连接类型,他可以返回两个或者多个表之间所有的匹配和不匹配的数据。外连接有三种类型:左外连接(LEFT OUTER JOIN)、右外连接(RIGHT OUTER JOIN)和全外连接(FULL OUTER JOIN)。例如:
SELECT 列名 FROM 表1 LEFT OUTER JOIN 表2 ON 表1.列 = 表2.列;
它们的区别是:内连接返回的是两个表都存在的数据,如图:
左(右)外连接是左(右)表的所有数据和右(左)表匹配的数据,如图:
全外查询到的数据,如图:
自连接是一种特殊的表连接,它是指相互连接的表在物理上同为一张表,但是逻辑上是多张表。自连接通常用于表中的数据有层次结构的情况
假设我们有一个员工表,如下所示:
员工ID | 姓名 | 经理ID |
---|---|---|
1 | 张三 | 3 |
2 | 李四 | 3 |
3 | 王五 | NULL |
4 | 赵六 | 1 |
在这个表中,每个员工都有一个经理,经理也是员工表中的一员。我们可以通过自连接查询出每个员工的经理的姓名。
- SELECT e1.姓名 AS 员工姓名, e2.姓名 AS 经理姓名
- FROM 员工表 AS e1
- JOIN 员工表 AS e2 ON e1.经理ID = e2.员工ID;
这个查询的结果将是:
员工姓名 | 经理姓名 |
---|---|
张三 | 王五 |
李四 | 王五 |
赵六 | 张三 |
创建索引的时候是否会锁表取决于MySQL的版本,在MySQL5.7之前,创建索引会锁表,所以在早期MySQL中一定要在线上慎用,因为创建索引时会导致其他会话阻塞(select除外)。这是因为在创建索引的过程中,需要保证表的数据不被修改,以确保所i引得正确性和一致性
然而在MySQL5.7之后,MySQL引入了Online DDL计数。这项技术允许在创建索引的时候,不阻塞其他会话(所有的DML(数据操作语言INSERT、UPDATE、DELETE、SELECT)操作一起并发执行)。这是因为Online DDL技术允许在数据库运行期间执行对表结构或者其他数据库对象的更改操作,而不需要中断其他正在进行的事务和查询
聚簇索引和非聚簇索引是两种常见的索引类型,他们在数据存储和检索方式上有一些重要的区别:
总结一下,聚簇索引和非聚簇索引的区别主要是以下几种:
聚簇索引(Clustered Index)一般指的是主键索引(如果存在主键索引的话),聚簇索引也被称之为聚集索引。
聚簇索引在 InnoDB 中是使用 B+ 树实现的,比如我们创建一张 student 表,它的构建 SQL 如下:
以上 student 表中有一个聚簇索引(也就是主键索引)id,和一个非聚簇索引 class_id。
聚簇索引 id 对应的 B+ 树如下图所示:
在聚簇索引的叶子节点直接存储用户信息的内存地址,我们使用内存地址可以直接找到相应的行数据。
非聚簇索引在 InnoDB 引擎中,也叫二级索引,以上面 student 表为例,在 student 中非聚簇索引 class_id 对应 B+ 树如下图所示:
从上图我们可以看出,在非聚簇索引的叶子节点上存储的并不是真正的行数据,而是主键 ID,所以当我们使用非聚簇索引进行查询时,首先会得到一个主键 ID,然后再使用主键 ID 去聚簇索引上找到真正的行数据,我们把这个过程称之为回表查询。
在 MySQL 的 InnoDB 引擎中,每个索引都会对应一颗 B+ 树,而聚簇索引和非聚簇索引最大的区别在于叶子节点存储的数据不同,聚簇索引叶子节点存储的是行数据,因此通过聚簇索引可以直接找到真正的行数据;而非聚簇索引叶子节点存储的是主键信息,所以使用非聚簇索引还需要回表查询,因此我们可以得出聚簇索引和非聚簇索引的区别主要有以下几个:
聚簇索引大多数情况下是等于主键索引的(如果主键存在的情况),但是如果表中没有主键索引的情况下,聚簇索引就等于其他的索引类型了。
聚簇索引的生成规则
如果有主键索引的时候,那么聚簇索引就等于主键索引,如果没有主键索引,那么聚簇索引的诞生流程依次如下:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。