当前位置:   article > 正文

【系统架构设计师】三、数据库系统(事务并发|封锁协议|数据库安全|商业智能|SQL语句)

【系统架构设计师】三、数据库系统(事务并发|封锁协议|数据库安全|商业智能|SQL语句)

目录

一、事务并发

1.1 事务概述

1.2 并发控制

1.3 封锁

1.3.1 X 封锁和 S 封锁

1.3.2 三级封锁协议

二、数据库安全

2.1 备份(转储)与恢复

2.2 备份分类

2.3 数据库故障

三、商业智能

3.1 数据仓库

3.2 数据仓库的结构-OLAP

3.3 数据挖掘

3.4 分布式数据库

四、SQL语句

4.1 创建表(CREATE table)

4.2 修改表(ALTER table)

4.3 删除表(DROP table)

4.4 查询(select)

4.5 分组查询(group by)****

4.6 模糊查询(like)

4.7 去除重复记录查询(distinct)

4.8 排序查询(order by)

4.9 表-插入数据(insert into)

4.10 表-删除数据(delete/truncate)

4.11 表-修改数据(updata)

4.12 聚合函数

计算和(sum)

计算最大值(max)

计算最小值(min)

计算平均值(avg)

计算个数(count)

五、真题练习


一、事务并发

1.1 事务概述

        DBMS 运行的基本工作单位是事务,事务是用户定义的一个数据库操作序列,这些操作序列要么全做,要么全都不做,是一个不可分割的工作单位。事务具有的四个特性(ACID):

  • (操作)原子性(Atomicity):事务是数据库的逻辑工作单位,事务的所有操作在数据库中要么 全做,要么全都不做。

  • (数据)一致性(Consistency):事务的执行使数据库从一个一致性状态变成另一个一致性状态。

  • (执行)隔离性(Isolation):一个事务的执行不能被其他事务干扰。

  • (改变)持久性(Durability):指一个事务一旦提交,它对数据库的改变必须是永久的,即便系统出现故障时也是如此。

1.2 并发控制

        事务是并发控制的前提条件,并发控制就是控制不同的事务并发执行,提高系统效率,但是并发控制中存在下面三个问题:

  • 丢失更新:事务1对数据A进行了修改并写回,事务2也对A进行了修改并写回此时事务2写回的数据会覆盖事务1写回的数据,就丢失了事务1对A的更新。即对数据A的更新会被覆盖。

  • 不可重复读:事务2读A,而后事务1对数据A进行了修改并写回,此时若事务2再读A,发现数据不对。即一个事务重复读A两次,会发现数据A有误。

  • 读脏数据:事务1对数据A进行了修改后,事务2读数据A,而后事务1回滚,数据A恢复了原来的值,那么事务2对数据A做的事是无效的,读到了脏数据。

1.3 封锁

1.3.1 X 封锁和 S 封锁

        并发控制的主要技术是封锁,主要有两种类型的封锁,分别是 X 封锁 和 S 封锁。

  • 排他型封锁(X 封锁):如果事务 T 对数据 A(可以是数据项、记录、数据集以至整个数据库)实现了 X 封锁,那么只允许事务 T 读取和修改数据 A,其他事务要等事务 T 解除 X 封锁以后,才能对数据 A 实现任何类型的封锁。可见 X 封锁只允许一个事务独锁某个数据,具有排他性。

  • 共享型封锁(S 封锁):如果事务 T 对数据 A 实现了 S 封锁,那么允许事务 T 读取数据A,但不能修改数据 A,在所有 S 封锁解除之前决不允许任何事务对数据 A 实现 X 封锁。

1.3.2 三级封锁协议

  • 一级封锁协议:事务在修改数据R之前必须先对其加X锁,直到事务结束才释放。可解决丢失更新问题

  • 二级封锁协议:一级封锁协议的基础上加上事务T在读数据R之前必须先对其加S锁读完后即可释放S锁可解决丢失更新、读脏数据问题

  • 三级封锁协议:一级封锁协议加上事务T在读取数据R之前先对其加S锁,直到事务结束才释放可解决丢失更新、读脏数据、数据重复读问题

二、数据库安全

2.1 备份(转储)与恢复

  • 备份是指通过数据转储和监理日志文件的方法监理冗余数据,DBA定期地将整个数据库复制到磁带或另一个磁盘上保存起来的过程。这些备用的数据文本称为后备副本。

  • 恢复是指把数据库从错误状态恢复到某一个已知的正确状态的功能。当数据库遭到破坏后,就可以利用后备副本把数据库恢复,这时数据库只能恢复到备份时的状态,从那以后的所有更新事务必须重新运行才能恢复到故障时的状态。

2.2 备份分类

  • 静态转储:即冷备份,指在转储期间不允许对数据库进行任何存取、修改操作。
    • 优点是非常快速的备份方法、容易归档(直接物理复制操作)

    • 缺点是只能提供到某一时间点上的恢复,不能做其他工作,不能按表或按用户恢复。

  • 动态转储:即热备份,在转储期间允许对数据库进行存取、修改操作,因此转储和用户事务可并发执行。
    • 优点是可在表空间或数据库文件级备份,数据库扔可使用,可达到秒级恢复;

    • 缺点是不能出错,否则后果严重,若热备份不成功,所得结果几乎全部无效。

  • 完全备份(海量备份):备份所有数据。

  • 差量备份:仅备份上一次完全备份之后变化的数据。

  • 增量备份:备份上一次备份之后变化的数据。

2.3 数据库故障

        数据库的 4 类故障:事务故障、系统故障、介质故障、计算机病毒。

        事务故障的恢复有两个操作:撤销事务(UNDO)和 重做事务(REDO)。

        介质故障的恢复由数据库管理员装入数据库的副本和日记文件副本,再由系统执行撤销和重做操作。

        日志文件:在事务处理过程中,DBMS把事务开始、事务结束以及对数据库的插入、删除和修改的每一次操作写入日志文件。一旦发生故障,DBMS的恢复子系统利用日志文件撤销事务对数据库的改变,回退到事务的初始状态。

三、商业智能

        商业智能(Business Intelligence,BI)是企业对商业数据的搜集、管理和分析的系统过程,目的是使企业的各级决策者获得知识或洞察力,帮助他们作出对企业更有利的决策。一般认为数据仓库、联机分析处理(OLAP)和数据挖掘是商业智能的三大组成部分。

3.1 数据仓库

        数据仓库是一个面向主题的、集成的、非易失的、且随时间变化的数据集合,用于支持管理决策。数据仓库的关键特征是:面向主题、集成的、非易失的、时变的。

  • 面向主题:按照一定的主题域进行组织的。

  • 集成的:数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息

  • 相对稳定的:数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。

  • 反映历史变化:数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。

传统数据库与数据仓库的比较
传统数据库与数据仓库的比较

3.2 数据仓库的结构-OLAP

数据仓库的结构通常包含四个层次,如上图所示:

  • 1.数据源:是数据仓库系统的基础,是整个系统的数据源泉。

  • 2.数据的存储与管理:是整个数据仓库系统的核心。

  • 3.0LAP(联机分析处理)服务器:对分析需要的数据进行有效集成,按多维模型组织,以便进行多角度、多层次的分析,并发现趋势

  • 4.前端工具:主要包括各种报表工具、查询工具、数据分析工具、数据挖掘工具以及各种基于数据仓库或数据集市的应用开发工具。

OLTP 即联机事务处理,就是关系数据库的基础;OLAP即联机分析处理,是数据仓库的核心部分。

OLTP 与 OLAP 的区别
OLTP 与 OLAP 的区别

3.3 数据挖掘

        数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。数据挖掘所得到的信息应具有先知、有效和实用三个特征。先前未知的信息是指该信息是预先未曾预料到的,即数据挖掘是要发现那些不能靠直觉发现的信息或知识,甚至是违背直觉的信息或知识,挖掘出的信息越是出乎意料,就可能越有价值。

3.4 分布式数据库

        局部数据库位于不同的物理位置,使用一个全局DBMS将所有局部数据库联网管理,这就是分布式数据库

  • 分片模式
    • 水平分片:将表中水平的记录分别存放在不同的地方。

    • 垂直分片:将表中垂直的列值分别存放在不同的地方。

  • 分布透明性
    • 分片透明性:用户或应用程序不需要知道逻辑上访问的表具体是如何分块存储的

    • 位置透明性:应用程序不关心数据存储物理位置的改变

    • 逻辑透明性:用户或应用程序无需知道局部使用的是哪种数据模型

    • 复制透明性:用户或应用程序不关心复制的数据从何而来

四、SQL语句

4.1 创建表(CREATE table)

  1. //学生表创建
  2. CREATE table student(
  3. Sno CHAR(9PRIMARY KEY,
  4. Sname CHAR(20UNIQUE,
  5. Ssex char(2),
  6. Sage SMALLINT,
  7. Sdept char(20)
  8. );
  • PRIMARY KEY,指定主键;

  • FOREIGN KEY,指定外键。

4.2 修改表(ALTER table)

  1. //修改表名
  2. alter table 表名 rename to 新的表名;

4.3 删除表(DROP table)

  1. //删除表
  2. drop table 表名;
  3. //删除表时判断表是否存在,若存在则删除
  4. drop table if exists 表名;

4.4 查询(select)

  1. //查询表中所有数据
  2. select * from 表名;
  3. //查询users表中年龄在18~25岁之间的记录
  4. //方式1 &&
  5. select *from users where age>=18 && age<=25;
  6. //方式2 and
  7. select * from users where age>=18 and age<=25;
  8. //方式3 between..and..
  9. select *from users where age between 18 and 25;

4.5 分组查询(group by)****

  1. -- 查询users表中的记录,按照性别分组
  2. select gender from users group by gender;

4.6 模糊查询(like)

  • _ 单个任意字符

  • % 0个/多个任意字符

  1. //查询users表中姓名第二个字为帅的记录
  2. select * from users where name like '_帅%';
  3. //查询users表中姓名含有帅字的记录
  4. select * from users where name like '%帅%';

4.7 去除重复记录查询(distinct)

  1. //查询users表中所在城市不相同的记录
  2. -- select distinct 字段 from 表名;
  3. //去掉 name 重复的部分
  4. select distinct name from users;

4.8 排序查询(order by)

排序order by,默认为升序,降序要加关键字DESC。

  1. //查询users表中记录,并以年龄升序排序
  2. select * from users order by age asc;
  3. select * from users where age > 18 order by id;
  4. //查询users表中记录,并以年龄降序排序
  5. select * from users order by age desc;

4.9 表-插入数据(insert into)

有多少个字段,就要写多少个值,且是一一对应的。

insert into 表名 values(值1,值2,值3...值n);

4.10 表-删除数据(delete/truncate)

  1. //删除表中所有数据
  2. delete from 表名;   
  3. //删除表中指定的数据
  4. delete from 表名 where 字段 = 值;  
  5. //删除表中所有数据(先删除整张表,然后创建一张一样的空表,此方法更高效)
  6. truncate table 表名;

drop table 表名; 是连表一起删除

4.11 表-修改数据(updata)

  1. //无限制条件的修改,会修改整张表
  2. update 表名 set 字段 = 值;
  3. //有限制条件的修改,只修改特定记录
  4. update 表名 set 字段 = 值 where 条件(字段 = 值);

4.12 聚合函数

计算和(sum)

  1.   //将求和后输出的字段以sumvalue展示 
  2.   //默认以sum(字段)展示 
  3.   select sum(字段) as sumvalue from 表名;
  4.   select sum(id) as ID,count(id) ID_count from users;

计算最大值(max)

  1.   select max(字段as maxvalue from 表名;
  2.   select max(ageas maxvalue from 表名;

计算最小值(min)

  1.   select min(字段as minvalue from 表名;
  2.   select min(ageas minvalue from 表名;

计算平均值(avg)

  select avg(字段as avgvalue from 表名;

计算个数(count)

  select count(字段as totalcount from 表名;

五、真题练习

  • 5.1

  1. A.封锁        B.死锁
  2. C.循环        D.并发处理
  • 5.2 商业智能将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策,包括数据预处理、建立数据模型、数据分析及数据展现 4个阶段;其主要应用的3个关键技术是()。

    • A.数据仓库/OLAP/数据挖掘

    • B.ETL/OLAP/数据展现

    • C.数据仓库/OLTP/OLAP

    • D.数据集市/数据挖掘/数据质量标准

  • 5.3 数据仓库不包括

    • A.数据源

    • B.OLAP 服务器

    • C.OLTP 服务器

    • D.报表工具

  • 5.4 某公司网上销售管理系统的数据库部分关系模式如下所示。其中,客户号唯一标识一位客户,产品号唯一标识一件产品,订单号唯一标识一份订单。一份订单必须目仅对应一位客户,一份订单可由一到多条订单明细组成,一位客户可以有多份订单。

    • 客户(客户号,姓名,性别,地址,邮编)

    • 产品(产品号,名称,库存,单价)

    • 订单(订单号,时间,金额,客户号)

    • 订单明细(订单号,产品号,数量)

    • 订单关系模式的主键为(1);

    • 订单明细关系模式的主键为(2);

    • 其中订单的外键为(3)。

  1. 1.
  2. A.订单号             B.客户号
  3. C.(订单号,客户号)     D.(订单号,时间)
  4. 2.
  5. A.订单号             B.客户号
  6. C.(订单号,客户号)     D.(订单号,时间)
  7. 3.
  8. A.客户号,订单明细的外键为订单号
  9. B.客户号,订单明细的外键为订单号和产品号
  10. C.订单号,订单明细的外键为产品号
  11. D.订单号,订单明细的外键为订单号和产品号

答案

  • 5.1 B

  • 5.2 A

  • 5.3 C

  • 5.4 A、C、B

本文内容由网友自发贡献,转载请注明出处:https://www.wpsshop.cn/w/爱喝兽奶帝天荒/article/detail/749243
推荐阅读
相关标签
  

闽ICP备14008679号