赞
踩
目录
数据、数据库、数据库管理系统、数据库系统是与数据库技术密切相关的4个基本概念
数据是数据库中存储的基本对象,描述事物的符号记录称为数据,数据的表现形式还不能完全表达其内容,需要经过解释,数据和关于数据的解释是不可分的,数据的解释是指对数据含义的说明,数据的含义称为数据的语义,数据与其语义是不可分的。
存放数据的仓库。严格来说,数据库是长期储存在计算机内、有组织的、可共享的大量数据的集合。数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。
数据库数据具有永久存储、有组织和可共享三个特点。
数据库管理系统是位于用户和操作系统之间的一层数据管理软件,数据库管理系统和操作系统一样是计算机的基础软件,主要功能包括:
1.数据定义功能
2.数据组织、存储和管理
3.数据操纵功能
4.数据库的事务管理和运行管理
5.数据库的建立和维护功能
6.其他功能
数据库系统是由数据库、数据库管理系统(及其应用开发工具)、应用程序和数据库管理员组成的存储、管理、处理和维护数据的系统
数据管理是指对数据进行分类、组织、编码、存储、检索和位数,它是数据处理的中心问题,而数据的处理是指对各种数据进行收集、存储、加工和传播的一系列活动的总和。在应用需求的推动下,在计算机硬件、软件发展的基础上,数据管理技术经历了人工管理、文件系统、数据库系统三个阶段。
特点:
1.数据不保存
2.应用程序管理数据
3.数据不共享
4.数据不具有独立性
特点:
1.数据可以长期保存
2.由文件系统管理数据
3.数据共享性差,冗余度大
4.数据的独立性差
用数据库系统来管理数据比文件系统具有更明显的优点,从文件系统到数据库系统标志着数据管理技术的飞跃
人工管理阶段 | 文件系统阶段 | 数据库系统阶段 | ||
背景 | 应用背景 | 科学计算 | 科学计算、数据管理 | 大规模数据管理 |
硬件背景 | 无直接存储设备 | 磁盘、磁鼓 | 大容量磁盘、磁盘阵列 | |
软件背景 | 没有操作系统 | 有文件系统 | 有数据库管理系统 | |
处理方式 | 批处理 | 联机实时处理、批处理 | 联机实时处理、分布处理、批处理 | |
特点 | 数据的管理者 | 用户(程序员) | 文件系统 | 数据库管理系统 |
数据面向的对象 | 某一应用程序 | 某一应用 | 现实世界(一个部门、企业、跨国组织等) | |
数据的共享程度 | 无共享、冗余度极大 | 共享性差,冗余度大 | 共享性高,冗余度小 | |
数据的独立性 | 不独立、完全依赖于程序 | 独立性差 | 具有高度的物理独立性和一定的逻辑独立性 | |
数据的结构化 | 无结构 | 记录内有结构,整体无结构 | 整体结构化,用数据模型描述 | |
数据控制能力 | 应用程序自己控制 | 应用程序自己控制 | 由数据库管理系统提供数据安全性、完整性、并发控制和恢复能力 |
1.数据结构化
数据库系统实现整体数据的结构化,这是数据库的主要特征之一,也是数据库系统与文件系统的本质区别。所谓“整体”结构化是指数据库中的数据不再仅仅针对某一个应用,而是面向整个组织和企业;不仅数据内部是结构化的,而且整体式结构化的,数据之间是有联系的。
2.数据的共享性高、冗余度低且易扩充
数据共享可以大大减少数据冗余,节约存储空间。数据共享还能够避免数据之间的不相容性与不一致性。由于数据面向整个系统,是有结构的数据,不仅可以被多个应用共享使用,而且容易增加新的应用,这就使得数据库系统弹性大、易扩充。
3.数据独立性高
数据独立性是借助数据库管理数据的一个显著优点,它已经成为数据库领域中一个常用的术语和重要概念,包括数据的物理独立性和逻辑独立性。
物理独立性是指用户的应用程序与数据库中数据的物理存储是相互独立的。
逻辑独立性是指用户的应用程序与数据库的逻辑结构是相互独立的。
数据独立性是由数据库管理系统提供的二级映像功能来保证的。
4.数据由数据库管理系统统一管理和控制
1.数据的安全性保护
数据的安全性保护是指保护数据防止不合法使用造成数据泄密和破坏
2.数据的完成性检查
数据的完整性指数据的正确性、有效性和相容性
3.并发控制
4.数据库恢复
综上所述,数据库是长期储存在计算机内,有组织的、可共享的大量数据的集合。它可以供各种用户共享,具有最小冗余度和较高的数据独立性。数据库系统在数据库建立、运用和维护时对数据进行统一控制,以保证数据的完整性和安全性,并在多用户同时使用数据库时进行并发控制,在发生故障后对数据库进行恢复。
数据库系统的出现使信息系统从以加工数据的程序为中心转向围绕共享的数据库为中心的新阶段,这样既便于数据的集中管理,又能简化应用程序的研制和维护,提高了数据的利用率和相容性,提高了决策的可靠性。
数据模型也是一种模型,它是对现实世界的数据特征的抽象。数据模型是数据库系统的核心和基础。
数据模型应该满足三方面要求:一是能够比较真实地模拟现实世界,而是容易为人所理解,三是便于在计算机上实现。分为概念模型,逻辑模型和物理模型。
其中第一类是概念模型,第二类是逻辑模型和物理模型。
第一类逻辑模型,也成为信息模型,它是按用户的观点来对数据和信息建模,主要用于数据库设计。
第二类中的逻辑模型主要包括层次模型、网状模型、关系模型、面向对象数据模型、对象关系数据模型、半结构化数据模型等。它是按计算机系统的观点对数据建模,主要用于数据库管理系统的实现。
第二类中的物理模型是对数据最底层的抽象,它描述数据在系统内部的表示方式和存取方法,或在磁盘或磁带上的存储方式和存取方法,是面向计算机系统的。物理模型的具体实现是数据库管理系统的任务,数据库设计人员要了解和选择物理模型,最终用户则不必考虑物理级的细节。
数据模型是数据库系统的核心和基础。
建立步骤为:首先将现实世界抽象为信息世界,然后将信息世界转换为机器世界
从现实世界到概念模型的转换是由数据库设计人员完成的;从概念模型到逻辑模型的转换可以由数据库设计人员完成,也可以用数据库设计工具协助设计人员完成;从逻辑模型到物理模型的转换主要是由数据库管理系统完成的。
1.实体
客观存在并可相互区别的事物称为实体。
2.属性
实体所具有的某一特性称为属性。
3.码
唯一标识实体的属性集称为码。
4.实体型
用实体名及其属性名集合来抽象和刻画同类实体,称为实体型。
5.实体集
同一类型实体的集合称为实体集。
6.联系
实体之间的联系通常指不同实体集之间的联系。实体之间的联系有一对一、一对多和多对多等多种类型。
一般地讲,数据模型是严格定义的一组概念的集合,这些概念精确地描述了系统的静态特性、动态特性和完整性约束条件。因此数据模型通常由数据结构、数据操作和数据的完整性约束条件三部分组成。
数据结构描述数据库的组成对象以及对象之间的联系。数据结构是所描述的对象类型的集合,是对系统静态特征的描述。
数据操作是指对数据库中各种对象(型)的实例(值)允许执行的操作的集合,包括操作及有关的操作规则。数据库主要有查询和更新(包括插入、删除、修改)两大类操作,数据操作是对系统动态特征的描述。
数据的完整性约束条件是一组完整性规则。完整性规则则是给定的数据模型中数据及其联系所具有的制约和依存规则,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效和相容。
数据模型应该反映和规定其必须遵守的基本的和通用的完整性约束条件。
数据模型还应该提供定义完整性约束条件的机制,以反映具体应用所牵涉的数据必须遵守的特定的语义约束条件。
层次模型
网状模型
关系模型
面向对象数据模型
对象关系数据模型
半结构化数据模型
其中,层次模型和网状模型统称为格式化模型。
层次模型用树形结构来表示各类实体以及实体间的联系。
1.层次模型的数据结构
在数据库中定义满足下面两个条件的基本层次联系的集合为层次模型:
(1)有且只有一个节点没有双亲结点,这个节点称为根节点。
(2)根以外的其他节点有且只有一个双亲节点。
每个记录类型可包含若干个字段,这里记录类型描述的是实体,字段描述实体的属性。各个记录类型及其字段都必须命名。各个记录类型,同一记录类型中各个字段不能同名。每个记录类型可以定义一个排序字段,也成为码字段,如果定义该排序字段的值是唯一的,则它能唯一地标识一个记录值。
一个层次模型在理论上可以包含任意有限个记录类型和字段,但实际的系统都会因为存储容量或实现复杂度而限制层次模型中包含的记录类型个数和字段的个数。
在层次模型中,同一双亲的子女节点称为兄弟节点,没有子女节点的节点称为叶节点。
层次模型像一颗倒立的树,节点的双亲是唯一的。
层次模型的一个基本特点是,任何一个给定的记录值只能按其层次路径查看,没有一个子女记录值能够脱离双亲记录值而独立存在。
2.层次模型的数据操纵与完整性约束
层次模型的操纵主要有查询、插入、删除和更新。进行插入、删除、更新操作时要满足层次模型的完整性约束条件,进行插入操作时,如果没有相应的双亲结点值就不能插入它的子女节点值,进行删除操作时,如果删除双亲节点值,则相应的子女节点值也将被同时删除。
3.层次模型的优缺点
优点:
1.层次模型的数据结构比较简单清晰。
2.层次数据库的查询效率高,其性能由于关系数据库,不低于网状数据库。
3.层次数据模型提供了良好的完整性支持。
缺点:
1.现实世界有很多联系是非层次性的
2.如果一个节点具有多个双亲结点,用层次模型表示这类关系就很笨拙,只能通过引入冗余数据或创建非自然的数据结构来解决,对插入和删除的限制比较多,因此应用程序的编写比较复杂。
3.查询子女节点必须通过双亲节点。
4.由于结构严密,层次命令趋于程序化。
网状模型的典型代表是DETG系统,亦称CODASYL系统。
1.网状模型的数据结构
在数据库中,把满足以下两个条件的基本层次联系集合称为网状模型:
(1)允许一个以上的节点无双亲。
(2)一个节点可以有多于一个的双亲。
网状模型是一种比层次模型更具普遍性的结构。它去掉了层次模型的两个限制,允许多个节点没有双亲节点,允许节点有多个双亲节点;此外它还允许两个节点之间有多种联系(称之为复合联系)。因此,网状模型可以更直接地去描述现实世界,而层次模型实际上是网状模型的一个特例。
层次模型中子女节点与双亲节点的联系是唯一的,而在网状模型中这种联系可以不唯一。
2.网状模型的数据操纵与完整性约束
网状模型一般来说没有层次模型那样严格的完整性约束条件,但具体的网状数据库系统对数据操纵都加了一些限制,提供了一定的完整性约束。
3.网状模型的优缺点
优点:
1.能够更为直接地描述现实世界。
2.具有良好的性能,存取效率高。
缺点:
1.结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不利于用户最终掌握。
2.网状模型的DDL,DML复杂并且要嵌入某一种高级语言中,用户不易掌握,不容易使用。
3.由于记录之间的联系是通过存取路径实现的,应用程序在访问数据时必须选择适当的存取路径,因此用户必须了解系统结构的细节,加重了编写应用程序的负担。
1.关系模型的数据结构
关系模型与以往模型不同的是,它是建立在严格的数学概念的基础上的。从用户观点看,关系模型由一组关系组成,每个关系的数据结构只是一张规范的二维表。
关系:一个关系对应通常说的一张表。
元组:表中的一行即为一个元组。
属性:表中的一列即为一个属性,给每一个属性起一个名称即属性名。
码:也成为码键,表中的某个属性组,它可以唯一确定一个元组。
域:域是一组具有相同数据类型的值的集合。
分量:元组中的一个属性值。
关系模式:对关系的描述,一般表示为:
关系名(属性1,属性2,...,属性n)
2.关系模型的数组操纵与完整性约束
关系模型的数据操纵主要包括查询、插入、删除和更新数据,这些操作必须满足关系的完整性约束条件。关系的完整性约束条件包括三大类:实体完整性、参照完整性和用户定义的完整性。
3.关系模型的优缺点
优点:
1.关系模型与格式化模型不同,它是建立在严格的数学概念的基础上的。
2.关系模型的概念单一。无论是实体还是实体之间的关系都用关系来表示。对数据的检索和更新结果也是关系。所以其数据结构简单、清晰,用户易懂易用。
3.关系模型的存取路径对用户透明,从而具有更高的数据独立性、更好的安全保密性,也简化了程序员的工作和数据库开发建立的工作。
缺点:
由于存取路径对用户是隐蔽的,查询效率往往不如格式化数据模型,为了提高性能,数据库管理系统必须对用户的查询请求进行优化,因此增加了开发数据库管理系统的难度。
从数据库应用开发人员角度看,数据库系统通常采用三级模式结构,这是数据库系统内部的系统结构。从数据最终用户角度看,数据库系统的结构分为单用户结构、主从式结构、分布式结构、客户-服务器结构、浏览器-应用服务器/数据服务器多层结构等。这是数据库系统外部的体系结构。
在数据模型中有“型”和“值”的概念。型是指对某一类数据的结构和属性的说明,值是型的一个具体赋值。
模式是数据库中全体数据的逻辑结构和特征的描述,它仅仅涉及型的描述,不牵涉具体的值。模式的一个具体值称为模式的一个实例。同一个模式可以有很多实例。
模式是相对稳定的,而实例是相对变动的。模式反映的是数据的结构及其联系,而实例反映的是数据库某一时刻的状态。
数据库系统的三级模式结构是指数据库是由外模式、模式、内模式三级构成。
模式也称逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。它是数据库系统模式结构的中间层,既不涉及数据的物理存储细节和硬件环境,又与具体的应用开发工具及高级程序涉及语言无关。
模式实际上是数据库在逻辑级上的视图。一个数据库只有一个模式。数据库模式以某一种数据模型为基础,同一综合地考虑了所有用户的需求,并将这些需求有机地结合成一个逻辑整体。定义模式时不仅要定义数据的逻辑结构,还要定义数据之间的关系。
数据库管理系统提供模式数据定义语言来严格定义模式。
外模式也称子模式或用户模式,它是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。
一个数据库可以有多个外模式,同一外模式也可以为某一用户的多个应用系统所使用,但是一个应用程序只能使用一个外模式。
外模式是保证数据库安全性的一个有力措施,每个用户只能看见和访问所对应的外模式中的数据,数据库中的其余的数据是不可见的。
数据库管理系统提供外模式数据定义语言来严格定义外模式。
内模式也称存储模式,一个数据库只有一个内模式。它是数据物理结构和存储方式的描述,是数据在数据库内部的组织方式。
数据库系统的三级模式是数据的三个抽象级别,它把数据的具体组织留给数据库管理系统管理,使用户能逻辑地、抽象地处理数据,而不必关心数据在计算机中的具体表示方式与存储方式。
模式描述的是数据的全局逻辑结构,外模式描述的是数据的局部逻辑结构。对应于同一个模式可以有任意多个外模式,对于每一个外模式,数据库系统都有一个外模式/模式映像,它定义了该外模式与模式之间的对应关系,这些映像定义通常包含在各自外模式的描述中。
当模式改变时,由数据库管理员对各个外模式/模式映像作相应改变,可以使外模式保持不变。应用程序是依据数据的外模式编写的,从而应用程序不必修改,保证了数据与程序的逻辑独立性,简称数据的逻辑独立性。
数据库中只有一个模式,也只有一个内模式。内模式定义了数据全局逻辑结构与存储结构之间的对应关系。当数据的存储结构改变时,由数据库管理员对模式/内模式作相应改变,可以使模式保持不变,从而应用程序也不必改变,保证了数据与程序的物理独立性,简称数据的物理独立性。
数据与程序之间的独立性使得数据的定义和描述可以从应用程序分离出去。由于数据的存取由数据库管理系统管理,从而简化了应用程序的编制,大大减少了应用程序的维护和修改。
数据库系统由数据库、数据库管理系统、应用程序和数据库管理员组成,下面分别介绍这几部分内容
1.要有足够大的内存,存放操作系统、数据库管理系统的核心模块、数据缓冲区和应用程序。
2.由足够大的硬盘或磁盘阵列等设备存放数据库,有足够大的磁盘(或光盘)作数据备份。
3.要求系统有较高的通道能力,以提高数据传送率。
1.数据库管理系统。
2.支持数据库管理系统运行的操作系统。
3.具有与数据库接口的高级语言及其编译系统,便于开发应用程序。
4.以数据库管理系统为核心的应用开发工具。
5.为特定应用环境开发的数据库应用系统。
1.决定数据库中的信息内容和结构。
2.决定数据库的存储结构和存储策略。
3.定义数据的安全性要求和完整性约束条件。
4.检控官数据库的使用和运行。
(1)周期性转储数据库:数据文件、日志文件。
(2)系统故障修复。
(3)介质故障修复。
(4)监视审计文件。
5.数据库的改建和重构、重组
(1)性能监控和调优。
(2)定期对数据库进行重组织,以提高数据库的性能。
(3)需求增加和改变时,数据库需重构造。
系统分析员
1.负责应用系统的需求分析和规范说明。
2.要和用户及数据库管理员相结合,确定系统的硬件软件配置。
3.参与数据库系统的概要设计。
数据库设计人员
1.参加用户需求调查和系统分析。
2.确定数据库中的数据。
3.设计数据库各级模式。
1.设计和编写应用系统的程序模块。
2.进行调试和安装。
这里用户指最终用户,最终用户通过应用系统的用户接口使用数据库。
1.偶然用户
这类用户不经常访问数据库,但每次访问数据库时往往需要不同的数据库信息,这类用户一般是企业或机构的高中级管理人员。
2.简单用户
主要工作是查询和更新数据库。银行的职员,航空公司的机票预定工作人员、宾馆总台服务员等。
3.复杂用户
工程师、科学家、经济学家、科学技术工作者。直接使用数据库语言访问数据库,甚至能够基于数据库管理系统的应用程序接口编制自己的应用程序。
1.数据库系统与文件系统的主要区别是文件系统不能解决数据冗余和数据独立问题,而数据库系统可以解决。(5.0分)
2.同一个关系模型的任意两个元组值不能全同。(5.0分)
3.在DBS中,最接近于物理存储设备一级的结构,称为内模式。(5.0分)
4.关系模型中,一个候选码可以由一个或者多个其值能够唯一标识该关系模式中任何元组的属性组成。(5.0分)
5.数据库管理系统能实现对数据库中数据的查询、插入、修改和删除等操作的数据库语言称为数据操纵语言DML。(5.0分)
6.数据库系统的特点是数据共享、数据独立、减少数据冗余、避免数据不一致和加强了数据保护。(5.0分)
7.数据库系统的核心是数据库管理系统。(5.0分)
8.关系数据库中可命名的最小数据单位是属性名。(5.0分)
9.完整性约束是指实体完整性、参照完整性和用户自定义完整性。(10.0分)
10.数据结构、数据操作和数据的完整性约束条件这三方面内容完整地描述了一个数据模型。(10.0分)
11.数据库系统中主要的逻辑数据模型有层次模型、网状模型、关系模型、面向对象数据模型、对象关系数据模型、半结构化数据模型。(15.0分)
12.数据库系统的三级模式结构是指数据库系统是由外模式、模式、内模式三级构成。(15.0分)
13.数据库系统一般由数据库、数据库管理系统、应用程序、数据库管理员组成。(10.0分)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。