赞
踩
(ps:本人的学习记录,用于上下班途中背诵记忆的,若有侵权联系我删除)
数据库管理系统的类型通常有多个分类标准。如按数据模型分类、按用户数分类、按数据库分布站点分类等。
过程 | 产出物 | 说明 |
---|---|---|
需求分析 | 数据流图 数据字典 需求说明书 | 分析数据存储的要求,包含数据处理要求和数据要求整理 |
概念结构设计 | 用户数据模型:ER模型(实体-属性图) | 与DBMS(物理实现)无关 |
逻辑结构设计 | 关系模式 | 把E-R模型转换为关系模式,即转换成实际表和表中的列熟悉,考虑数据库设计约束 |
物理设计 | 考虑DBMS特性等,生成物理数据库 |
即实体-联系模型,包含数据模型的实体、属性、实体间的联系三个部分
把两个集合的所有记录合并在一起,并且相同的记录只显示一次
把两个集合的内容相同的记录显示出来
S1-S2:结果是S1表中有S2表中没有的那些记录
将两个集合的每一条记录一一拼接在一起,产生的结果包括S1和S2中所有属性列,且S1中每条记录一次和S2中所有记录组合成一条记录。
笛卡尔积的属性数是两个集合的属性数之和,记录数是两个集合的记录数之积
是按条件选择某关系模式中的某列
是按条件选择某关系模式中的某条记录
选择两个集合中关联的部分,相同的属性列只显示一次,显示两个关系模式中属性相同且值相同的记录,若没有标明连接关系,则默认表示两个集合中相等的列
连接可以转换为笛卡尔积和投影、选择的组合,例如:
S
1
⊳
⊲
S
2
=
π
S
1.
S
n
o
,
S
1.
S
n
a
m
e
,
S
1.
S
d
e
p
t
,
S
2.
A
g
e
[
σ
S
1.
S
n
o
=
S
2.
S
n
o
(
S
1
×
S
2
)
]
S1\rhd\lhd S2=\pi_{S1.Sno,S1.Sname,S1.Sdept,S2.Age}[\sigma_{S1.Sno=S2.Sno}(S1\times S2)]
S1⊳⊲S2=πS1.Sno,S1.Sname,S1.Sdept,S2.Age[σS1.Sno=S2.Sno(S1×S2)]
关系代数运行的效率问题,有一个通用原则,即存在联接操作与选择操作的,尽可能早完成选择操作,这样能降低参与联接操作的数量,极大提升运算效率。
A、B的组合键确定C,即A可以决定C;即主键是两个函数的组合键,主键的某一部分可以确定某一部分
若A决定B,B决定C,则A可以决定C,前提是B不能决定A即A和B不等价,否则A与B等价
传递律
例:若A→B,B→C,则A→C
自反律
例:若Y⊆X⊆U,则X→Y
注:Y⊆X表示Y是X的子集或等于X
合并规则
例:若A→B,A→C,则A→BC
分解规则
例:若A→B,C⊆B,则A→C
非规范化的关系模式,可能存在的问题包括:数据冗余、更新异常、插入异常、删除异常
由于规范化会使表不断的拆分,从而导致数据表过多。这样虽然减少了数据冗余,提高了增、删、改的速度,但会增加查询的工作量。系统需要进行多次连接,才能进行查询操作,使得系统效率大大下降
事务:由一系列操作组成,这些操作要么全做,要么全不做,拥有四种特性:
为了实现原子性和持久性的最为简单的策略是“影子拷贝”。
X锁是排它锁(写锁)。若事务T对数据对象A加上X锁,则只允许T读取和修改A,其他事务都不能再对A加任何类型的锁,知道T释放A上的X锁
S锁是共享所(读锁)。若事务T对数据对象A加上S锁,则只允许T读取A,但不能修改A,其他事务智能再对A加S锁(也即能读不能修改),直到T释放A上的S锁
一级封锁协议:事务T在修改数据R前必须先对其加X锁,直到事务结束才可以释放,可防止丢失更新
二级封锁协议:一级封锁协议的基础上,加上事务T在读取数据R之前先对其加S锁,读完后即可释放S锁,可防止丢失更新,还可防止读“脏”数据
三级封锁协议:一级封锁协议加上事务T在读取数据R之前先对其加S锁,直到事务结束才释放,可防止丢失更新、防止读“脏”数据与防止数据重复读
两段锁协议:可串行化的,可能会发生死锁
措施 | 说明 |
---|---|
用户标识和鉴定 | 最外层的安全保护措施,可以使用用户账户、口令和随机数检验等方式 |
存取控制 | 对用户进行授权,包括操作类型(如查找、插入、删除、修改等动作)和数据对象(主要是数据范围)的权限 |
密码存储和传输 | 对远程终端信息用密码传输 |
视图的保护 | 对视图进行授权 |
审计 | 使用一个专用文件或数据库,自动将用户对数据库的所有操作记录下来 |
故障关系 | 故障原因 | 解决方法 |
---|---|---|
事务本身的可预期故障 | 本身逻辑 | 在程序中预先设置Rollback语句 |
事务本身的不可预期故障 | 算术溢出、违反存储保护 | 由DBMS的恢复子系统通过日志,撤销事务对数据库的修改,回退到事务初始状态 |
系统故障 | 系统停止运转 | 通常使用检查点法 |
介质故障 | 外存被破坏 | 一般使用日志重做业务 |
局部数据库位于不同的物理位置,使用全局DBMS将所有局部数据库联网管理,这就是分布式数据库。
从CPU、内存、I/O(硬盘、阵列)、网络等方面分析优化
涉及参数设置,如进程优先级、CPU使用权、内存使用配置等
从数据库连接池方面进行优化
分布式数据库优化,需要从集中式数据库优化的几个角度进行优化
数据仓库是一种特殊的数据库,也是按数据库形式存储数据的,但是目的不同。
数据挖掘(Data Mining)技术是人们长期对数据库技术进行研究和开发的结果。起初各种商业数据是存储在计算机的数据库中的,然后发展到可对数据库进行查询和访问,进而发展到对数据库的即时遍历。
BI系统主要包括数据预处理、建立数据仓库、数据分析和数据展现四个阶段
联邦数据库系统(FDBS)是一个彼此协作却有相互独立的成员数据库(CDBS)的集合,它将成员数据库系统按不同程度进行集成。
联邦数据库管理系统(FDBMS):对联邦数据库系统整体提供控制和协同操作的软件。
关系数据库模式 | NoSQL模式 | |
---|---|---|
并发支持 | 支持并发、效率低 | 并发性能高 |
存储与查询 | 关系表方式存储、SQL查询 | 海量数据存储、查询效率高 |
扩展方式 | 向上扩展 | 向外扩展 |
索引方式 | B树、哈希等 | 键值索引 |
应用领域 | 面向通用领域 | 特定应用领域 |
传统数据 | 大数据 | |
---|---|---|
数据量 | GB或TB级 | PB级或以上 |
结构化程度 | 结构化或半结构化数据 | 所有类型的数据 |
数据化分析需求 | 现有数据的分析与检测 | 深度分析(关联分析、回归分析) |
硬件平台 | 高端服务器 | 集群平台 |
传统数据 | 大数据 | |
---|---|---|
数据量 | GB或TB级 | PB级或以上 |
结构化程度 | 结构化或半结构化数据 | 所有类型的数据 |
数据化分析需求 | 现有数据的分析与检测 | 深度分析(关联分析、回归分析) |
硬件平台 | 高端服务器 | 集群平台 |
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。