赞
踩
在大数据中,我们需要处理的数据来自不同的渠道,其中有一个很重要的渠道就是关系型数据库中存储的数据。在企业中,会把业务数据存储在关系型数据库中,一般以 MySQL 居多。另外,我们在后续的学习中需要学习 Hive、SparkSQL、Flink SQL 等内容,而这些内容共同的基础就是 SQL 语法。所以,我们需要借助 MySQL 学习 SQL 语法的使用,熟练的掌握基础的增删改查的操作与多表的查询操作,为后续的课程学习打好扎实的基础。
另外,在大数据的数据处理流程中,有时候我们需要将处理之后的数据导出给其他的业务场景使用,而导出业务数据最常用的,也是导出到 MySQL 数据库中,因此这部分的课程需要重点去学习!
数据库(DataBase,DB):指长期保存在计算机的存储设备上,按照一定规则组织起来,可以被各种用户或应用共享的数据集合。
数据库管理系统(DataBase Management System,DBMS):指一种操作和管理数据库的大型软件,用于建立、使用和维护数据库,对数据库进行统一管理和控制,以保证数据库的安全性和完整性。用户通过数据库管理系统访问数据库中的数据。
层次数据库阶段(1960s)
层次数据库是数据库管理系统的早期形式。这种数据库系统采用了层次结构来组织数据,数据被分层存储,每个层级包含一组相关的数据。这种数据库模型的缺点是数据之间的关系比较复杂,查询和更新数据比较困难。
网状数据库阶段(1960s-1970s)
网状数据库模型是对层次模型的改进。它采用了一种更加灵活的数据结构,可以将一个数据节点连接到多个其他节点。这种数据库模型的缺点是数据结构比较复杂,维护难度大。
关系数据库阶段(1970s-至今)
关系数据库是目前应用最广泛的一种数据库类型。这种数据库模型采用了关系模型来组织和管理数据,数据以表格的形式呈现,表格之间通过关系进行连接。关系数据库可以更好地处理数据之间的关系,同时也更容易进行查询和更新操作。
对象数据库阶段(1980s-至今)
对象数据库是一种将面向对象技术应用于数据库管理系统的方法。它将对象思想引入到数据库中,将数据和操作封装在一起,提高了数据的抽象程度和复用性。
NoSQL 数据库阶段(2000s-至今)
NoSQL 数据库是一种非关系型数据库,它不采用关系模型来存储数据,而是采用其他数据模型,如文档、键值对、图等。NoSQL 数据库具有高可扩展性、高性能、高可用性等优点,适用于大规模数据存储和处理场景。
数据存储结构不同:
SQL 数据库采用表格结构,数据以行和列的形式存储。
NoSQL 数据库采用键值对、文档、图形等不同的数据结构,数据之间的关系不是固定的,更加灵活。
数据查询方式不同:
SQL 数据库使用结构化查询语言(SQL)进行查询,具有较高的查询灵活性和复杂性。
NoSQL 数据库则使用自己的查询语言(如 MongoDB 的查询语言),查询方式相对简单,但不支持复杂查询。
数据规模不同:
SQL 数据库适用于小型到大型数据存储和管理,但对于大规模数据和高并发访问,性能和扩展性有限。
NoSQL 数据库适用于大规模数据和高并发访问,具有高可扩展性和高性能的特点。
应用场景不同:
SQL 数据库适用于需要处理事务的应用场景,如金融、电商等。
NoSQL 数据库适用于需要快速处理大量数据的应用场景,如社交网络、大数据分析等。
关系型数据库(sql)
非关系型数据库(nosql)
MySQL 是一种开源的、关系型的数据库管理系统,它是最流行的关系型数据库之一。MySQL 由 Oracle 公司开发,支持多种操作系统和编程语言,包括 Linux、Windows、Java、Python 等。MySQL 的主要特点包括:
DB-Engines Ranking 根据数据库管理系统的受欢迎程度对它们进行排名。该排行榜是按搜索、谷歌趋势、 Stack Overflow 网站、LinkedIn、Twitter 等社交网络中的关注度, 综合比较进行的排名。该排名涵盖全球 388 个数据库系统,排名每月更新一次,我们可以发现 Mysql 的使用占比还是非常高的。
综上所述,MySQL 在大数据领域具有重要作用,它可以作为数据存储和管理、数据清洗和处理、数据分析和挖掘、数据可视化和报表等方面的工具,为大数据系统提供有力的支持。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。