数据库设计5步骤_数据库系统设计五步骤

作者：小舞很执着 | 2024-08-05 01:06:18

踩

数据库系统设计五步骤

数据库设计5步骤
　　
　　　　
　　　　 1.确定entities及relationships
　　
　　a)设计宏观行为。你用此数据库来做什么？比如，希望管理雇员的信息。
　　
　　b)确定entities。对于一系列的行为，确定所管理信息所涉及到的主题范围。这将变成table。比如，雇用员工，指定具体部门，确定技能等级。
　　
　　c)确定relationships。看着行为，确定tables之间有何种关系。比如，在部门与雇员之间存在一种关系。给这种关系命名。
　　
　　d)细化行为。你从宏观行为开始，现在仔细检查这些行为，看有哪些行为能转为微观行为。比如，管理雇员的信息可细化为：
　　● 增加新员工
　　● 修改存在员工信息
　　● 删除调走的员工
　　
　　e)确定业务规则。看着你的业务规则，确定你要采取哪种。比如，可能有这样一种规则，一个部门有且只能有一个部门领导。这些规则将被设计到数据库的结构中。
　　
　　范例：
　　
　　ACME是一个小公司，在5个地方都设有办事处。当前，有75名员工。公司准备快速扩大规模，划分了9个部门，每个部门都有其领导。
　　为有助于寻求新的员工，人事部门规划了68种技能，为将来人事管理作好准备。员工被招进时，每一种技能的专业等级都被确定。
　　
　　定义宏观行为
　　一些ACME公司的宏观行为包括：
　　● 招聘员工
　　● 解雇员工
　　● 管理员工个人信息
　　● 管理公司所需的技能信息
　　● 管理哪位员工有哪些技能
　　● 管理部门信息
　　● 管理办事处信息
　　
　　确定entities及relationships
　　我们可以确定要存放信息的主题领域(表)及其关系，并创建一个基于宏观行为及描述的图表。
　　我们用方框来代表table，用菱形代表relationship。我们可以确定哪些relationship是一对多，一对一，及多对多。
　　这是一个E-R草图，以后会细化。
　　
　　

　　
　　细化宏观行为
　　以下微观行为基于上面宏观行为而形成：
　　● 增加或删除一个员工
　　● 增加或删除一个办事处
　　● 列出一个部门中的所有员工
　　● 增加一项技能
　　● 增加一个员工的一项技能
　　● 确定一个员工的技能
　　● 确定一个员工每项技能的等级
　　● 确定所有拥有相同等级的某项技能的员工
　　● 修改员工的技能等级
　　
　　这些微观行为可用来确定需要哪些table或relationship。
　　
　　确定业务规则
　　业务规则常用于确定一对多，一对一，及多对多关系。
　　相关的业务规则可能有：
　　● 现在有5个办事处；最多允许扩展到10个。
　　● 员工可以改变部门或办事处
　　● 每个部门有一个部门领导
　　● 每个办事处至多有3个电话号码
　　● 每个电话号码有一个或多个扩展
　　● 员工被招进时，每一种技能的专业等级都被确定。
　　● 每位员工拥有3到20个技能
　　● 某位员工可能被安排在一个办事处，也可能不安排办事处。
　　
　　2.确定所需数据
　　
　　要确定所需数据：
　　1. 确定支持数据
　　2. 列出所要跟踪的所有数据。描述table(主题)的数据回答这些问题：谁，什么，哪里，何时，以及为什么
　　3. 为每个table建立数据
　　4. 列出每个table目前看起来合适的可用数据
　　5. 为每个relationship设置数据
　　6. 如果有，为每个relationship列出适用的数据
　　
　　确定支持数据
　　
　　你所确定的支持数据将会成为table中的字段名。比如，下列数据将适用于表Employee，表Skill，表Expert In。
　　

　　
　　
　　如果将这些数据画成图表，就像：
　　
　　

　　
　　需要注意：
　　● 在确定支持数据时，请一定要参考你之前所确定的宏观行为，以清楚如何利用这些数据。
　　● 比如，如果你知道你需要所有员工的按姓氏排序的列表，确保你将支持数据分解为名字与姓氏，这比简单地提供一个名字会更好。
　　● 你所选择的名称最好保持一致性。这将更易于维护数据库，也更易于阅读所输出的报表。
　　● 比如，如果你在某些地方用了一个缩写名称Emp_status，你就不应该在另外一个地方使用全名(Empolyee_ID)。相反，这些名称应当是Emp_status及Emp_id。
　　● 数据是否与正确的table相对应无关紧要，你可以根据自己的喜好来定。在下节中，你会通过测试对此作出判断。
　　
　　3.标准化数据
　　
　　标准化是你用以消除数据冗余及确保数据与正确的table或relationship相关联的一系列测试。共有5个测试。本节中，我们将讨论经常使用的3个。
　　关于标准化测试的更多信息，请参考有关数据库设计的书籍。
　　
　　标准化格式
　　标准化格式是标准化数据的常用测试方式。你的数据通过第一遍测试后，就被认为是达到第一标准化格式；通过第二遍测试，达到第二标准化格式；通过第三遍测试，达到第三标准化格式。
　　
　　如何标准格式：
　　1．列出数据
　　2．为每个表确定至少一个键。每个表必须有一个主键。
　　3．确定relationships的键。relationships的键是连接两个表的键。
　　4．检查支持数据列表中的计算数据。计算数据通常不保存在数据库中。
　　5．将数据放在第一遍的标准化格式中：
　　6．从tables及relationships除去重复的数据。
　　7．以你所除去数据创建一个或更多的tables及relationships。
　　8．将数据放在第二遍的标准化格式中：
　　9．用多于一个以上的键确定tables及relationships。
　　10．除去只依赖于键一部分的数据。
　　11．以你所除去数据创建一个或更多的tables及relationships。
　　12．将数据放在第三遍的标准化格式中：
　　13．除去那些依赖于tables或relationships中其他数据，并且不是键的数据。
　　14．以你所除去数据创建一个或更多的tables及relationships。
　　
　　数据与键
　　在你开始标准化（测试数据）前，简单地列出数据，并为每张表确定一个唯一的主键。这个键可以由一个字段或几个字段（连锁键）组成。
　　
　　主键是一张表中唯一区分各行的一组字段。Employee表的主键是Employee ID字段。Works In relationship中的主键包括Office Code及Employee ID字段。给数据库中每一relationship给出一个键，从其所连接的每一个table中抽取其键产生。
　　
　　

　　将数据放在第一遍的标准化格式中
　　● 除去重复的组
　　● 要测试第一遍标准化格式，除去重复的组，并将它们放进他们各自的一张表中。
　　● 在下面的例子中，Phone Number可以重复。（一个工作人员可以有多于一个的电话号码。）将重复的组除去，创建一个名为Telephone的新表。在Telephone与Office创建一个名为Associated With的relationship。
　　
　　将数据放在第二遍的标准化格式中
　　● 除去那些不依赖于整个键的数据。
　　● 只看那些有一个以上键的tables及relationships。要测试第二遍标准化格式，除去那些不依赖于整个键的任何数据（组成键的所有字段）。
　　● 在此例中，原Employee表有一个由两个字段组成的键。一些数据不依赖于整个键；例如，department name只依赖于其中一个键（Department ID）。因此，Department ID，其他Employee数据并不依赖于它，应移至一个名为Department的新表中，并为Employee及Department建立一个名为Assigned To的relationship。
　　
　　

　　将数据放在第三遍的标准化格式中
　　● 除去那些不直接依赖于键的数据。
　　● 要测试第三遍标准化格式，除去那些不是直接依赖于键，而是依赖于其他数据的数据。
　　● 在此例中，原Employee表有依赖于其键（Employee ID）的数据。然而，office location及office phone依赖于其他字段，即Office Code。它们不直接依赖于Employee ID键。将这组数据，包括Office Code，移至一个名为Office的新表中，并为Employee及Office建立一个名为Works In的relationship。
　　
　　

　　
　　
　　
　　4.考量关系
　　
　　当你完成标准化进程后，你的设计已经差不多完成了。你所需要做的，就是考量关系。
　　
　　考量带有数据的关系
　　你的一些relationship可能集含有数据。这经常发生在多对多的关系中。
　　
　　

　　
　　遇到这种情况，将relationship转化为一个table。relationship的键依旧成为table中的键。
　　
　　考量没有数据的关系
　　要实现没有数据的关系，你需要定义外部键。外部键是含有另外一个表中主键的一个或多个字段。外部键使你能同时连接多表数据。
　　
　　有一些基本原则能帮助你决定将这些键放在哪里：
　　
　　一对多在一对多关系中，“一”中的主键放在“多”中。此例中，外部键放在Employee表中。
　　

　　
　　
　　一对一在一对一关系中，外部键可以放进任一表中。如果必须要放在某一边，而不能放在另一边，应该放在必须的一边。此例中，外部键（Head ID）在Department表中，因为这是必需的。
　　
　　

　　
　　多对多在多对多关系中，用两个外部键来创建一个新表。已存的旧表通过这个新表来发生联系。
　　

　　
　　
　　5.检验设计
　　
　　在你完成设计之前，你需要确保它满足你的需要。检查你在一开始时所定义的行为，确认你可以获取行为所需要的所有数据：
　　● 你能找到一个路径来等到你所需要的所有信息吗？
　　● 设计是否满足了你的需要？
　　● 所有需要的数据都可用吗？
　　如果你对以上的问题都回答是，你已经差不多完成设计了。
　　
　　最终设计
　　最终设计看起来就像这样：
　　

　　
　　
　　
　　设计数据库的表属性
　　数据库设计需要确定有什么表，每张表有什么字段。此节讨论如何指定各字段的属性。
　　
　　对于每一字段，你必须决定字段名，数据类型及大小，是否允许NULL值，以及你是否希望数据库限制字段中所允许的值。
　　
　　选择字段名
　　字段名可以是字母、数字或符号的任意组合。然而，如果字段名包括了字母、数字或下划线、或并不以字母打头，或者它是个关键字（详见关键字表），那么当使用字段名称时，必须用双引号括起来。
　　
　　为字段选择数据类型
　　SQL Anywhere支持的数据类型包括：
　　整数（int, integer, smallint）
　　小数（decimal, numeric）
　　浮点数（float, double）
　　字符型（char, varchar, long varchar）
　　二进制数据类型（binary, long binary）
　　日期/时间类型（date, time, timestamp）
　　用户自定义类型
　　
　　关于数据类型的内容，请参见“SQL Anywhere数据类型”一节。字段的数据类型影响字段的最大尺寸。例如，如果你指定SMALLINT，此字段可以容纳32,767的整数。INTEGER可以容纳2,147,483,647的整数。对CHAR来讲，字段的最大值必须指定。
　　
　　长二进制的数据类型可用来在数据库中保存例如图像(如位图)或者文字编辑文档。这些类型的信息通常被称为二进制大型对象，或者BLOBS。
　　
　　关于每一数据类型的完整描述，见“SQL Anywhere数据类型”。
　　
　　NULL与NOT NULL
　　
　　如果一个字段值是必填的，你就将此字段定义为NOT NULL。否则，字段值可以为NULL值，即可以有空值。SQL中的默认值是允许空值；你应该显示地将字段定义为NOT NULL，除非你有好理由将其设为允许空值。
　　
　　关于NULL值的完整描述，请见“NULL value”。有关其对比用法，见“Search conditions”。
　　
　　选择约束
　　
　　尽管字段的数据类型限制了能存在字段中的数据（例如，只能存数字或日期），你或许希望更进一步来约束其允许值。
　　
　　你可以通过指定一个“CHECK”约束来限制任意字段的值。你可以使用能在WHERE子句中出现的任何有效条件来约束被允许的值，尽管大多数CHECK约束使用BETWEEN或IN条件。
　　
　　更多信息
　　
　　有关有效条件的更多信息，见“Search conditions”。有关如何为表及字段指定约束，见“Ensuring Data Integrity”。
　　
　　例子
　　例子数据库中有一个名为department的表，字段是dept_id, dept_name, dept_head_id。其定义如下：
　　

　　
　　注意每一字段都被指定为“not null”。这种情况下，表中每一记录的所有字段的数据都必填。
　　
　　选择主键及外部键
　　主键是唯一识别表中每一项记录的字段。如何你的表已经正确标准化，主键应当成为数据库设计的一部分。
　　外部键是包含另一表中主键值的一个或一组字段。外部键关系在数据库中建立了一对一及一对多关系。如果你的设计已经正确标准化，外部键应当成为数据库设计的一部分。
转自： http://blog.tianya.cn/blogger/post_list.asp?BlogID=1789305&CategoryID=1118574

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/小舞很执着/article/detail/930237