赞
踩
本系列博文还在更新中,收录在专栏:「Azure探秘:构建云计算世界」 专栏中。
本系列文章列表如下:
本文将介绍不同类型的数据以及与之相关的Azure存储解决方案。
首先,我们将简要探讨数据类型,包括结构化数据、半结构化数据和非结构化数据。
接下来,我们将概览Azure存储,介绍其特点和优势。在详细探讨Azure Blob存储时,我们将介绍存储帐户、存储容器和Blob,并重点关注Azure Blob存储层和应用场景。然后,我们将介绍Azure队列存储,用于实现应用程序之间的解耦和异步通信。我们还将介绍Azure表存储,适用于存储大量结构化数据。
最后,我们将介绍Azure文件存储,用于共享文件和支持文件共享的应用程序。
通过本文的阅读,您将对不同类型的数据和与之对应的Azure存储解决方案有更清晰的理解。希望本文能够帮助您在选择和使用存储解决方案时做出明智的决策。
结构化数据是其元素可寻址以进行有效分析的数据。它已被组织到一个格式化的存储库中,该存储库通常是一个数据库。它涉及可以存储在具有行和列的表中的数据库 SQL 中的所有数据。它们具有关系键,可以轻松映射到预先设计的字段。今天,这些数据在开发中处理得最多,也是管理信息的最简单方法。示例:关系数据。
结构化数据即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据。
半结构化数据是不存在于关系数据库中但具有一些使其更易于分析的组织属性的信息。对于某些进程,可以将它们存储在关系数据库中(对于某种半结构化数据可能非常困难),但半结构化的存在是为了缓解空间。
介于完全结构化数据(如关系型数据库、面向对象数据库中的数据)和完全无结构的数据(如声音、图像文件等)之间的数据,HTML文档就属于半结构化数据。
非结构化数据是没有按预定义方式组织或没有预定义数据模型的数据,因此不太适合主流关系型数据库。因此,对于非结构化数据,存在用于存储和管理的替代平台,它在 IT 系统中越来越普遍,并被组织用于各种商业智能和分析应用程序。示例:Word、PDF、文本、媒体日志。
非结构化数据,包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等等
选择 Azure 存储类型最重要的步骤之一是定义你想要存储什么,如何以及需要哪些选项和功能来实现。
微软Azure中有五种可用的存储类型,分为两组。
第一组存储包括队列存储、表存储和 Blob 存储,设计时考虑了文件存储、可扩展性和通信,可以通过 REST API 访问。另一个包括文件存储和磁盘存储,用于扩展微软 Azure 虚拟机环境的功能,并专门用于从虚拟机访问。(不要被文件存储的命名搞混乱。它不表示文件的非结构化存储。)
下面本文会根据分类详细进行讲解
Azure Blob 存储是 Microsoft 提供的适用于云的对象存储解决方案。 Blob 存储最适合存储巨量的非结构化数据。 非结构化数据是不遵循特定数据模型或定义的数据(如文本或二进制数据)。到这里你就理解了为什么本文开头的时候会讲解一下数据类型,因为 Blob 主要就被用于存储非结构化数据。
Blob 存储提供了三种类型的资源:
以下图示显示了这些资源之间的关系。
存储帐户在 Azure 中为数据提供唯一的命名空间。 存储在 Azure 存储中的每个对象都有一个地址,其中包含唯一的帐户名称。 帐户名称与 Blob 存储终结点的组合构成了存储帐户中对象的基址。
例如,如果存储帐户名为 mystorageaccount,则 Blob 存储的默认终结点为:
http://mystorageaccount.blob.core.windows.net
容器对一组 blob 进行组织,类似于文件系统中的目录。 一个存储帐户可以包含无限数量的容器,一个容器可以存储无限数量的 Blob。
容器名称必须是有效的 DNS 名称,因为它是用于对容器或其 Blob 进行寻址的唯一 URI(统一资源标识符)的一部分。 为容器命名时,需要遵循以下规则:
容器的 URI 类似于:
https://myaccount.blob.core.windows.net/mycontainer
Azure 存储支持三种类型的 Blob:
blob 的 URI 类似于:
https://myaccount.blob.core.windows.net/mycontainer/myblob
或
https://myaccount.blob.core.windows.net/mycontainer/myvirtualdirectory/myblob
Azure Blob 存储提供四个访问层,即:热存储层
、冷存储层
、寒层(预览版)
和归档存储层
。它们在价格、提前删除费用和数据恢复速度方面有所不同。
寒层目前为预览版(发文时间点总结,更新时间 06/02/2023 16:04),在以下区域可用:加拿大中部、加拿大东部、法国中部、法国南部和韩国中部。
关于存储层一些特点总结:越热存储费用越高;越冷,访问和事务成本越高,延迟越高。详细参照这里总结的一个表格,如果有错误请私信或者留言给博主:
Azure Blob存储层类型 | 存储成本 | 访问和事务成本较高 | 访问延迟 | 提前删除费 | 建议的最短数据保留期 | 是否适合短期备份和灾难恢复数据集 |
---|---|---|---|---|---|---|
热层 | 高 | 最低 | 小(毫秒) | 无 | 无 | 是 |
冷层 | 较低 | 低 | 小(毫秒) | 有 | 30 天 | 是 |
寒层 | 低 | 较低 | 小(毫秒) | 有 | 90 天 | 是 |
归档存储层 | 最低 | 最高 | 高(小时) | 有 | 180天 | 否 |
这里总结一下 Blob 存储的应用场景,个人理解你可以认为 Blob 存储类似于一个超大型的网盘。
Blob 存储用于:
听到队列一般都与消息有关,Azure 队列存储的主要用途亦是如此。Azure 队列存储用于在应用程序之间进行排队和可靠传递消息的数据存储。
Azure 支持两种类型的队列机制:
Azure 队列存储特点、作用总结(重要):
Azure 队列存储能做什么?
Azure 表存储是一项用于在云中存储半结构化数据(NoSQL 数据)的服务,通过无架构设计提供键/属性存储。 可以使用表存储来存储和查询大型结构化非关系型数据集,并且表会随着需求的增加而扩展。
URL 格式: Azure 表存储帐户使用此格式:http://<storage account>.table.core.windows.net/<table>
结构化数据和大数据分析提供更便宜、更具可扩展性的存储
Azure 文件存储是第二种存储类型,主要目的在支持 Azure VM 环境的需求。该存储本质上是网络共享。您可以将可以从不同虚拟机访问的文件存储在那里。它类似于其直接竞争对手Amazon EFS。
你可以理解为是一个共享盘,共享文件夹且有存储能力。
这部分的考点内容:举个例子,你想要将一个网络驱动器从运行在 Win10 的多台计算机映射到 Azure 存储中,
你需要使用什么样的存储方式? Azure 文件存储。
[ 本文作者 ] bluetata
[ 原文链接 ] https://bluetata.blog.csdn.net/article/details/131012518
[ 最后更新 ] 06/02/2023 18:36
[ 版权声明 ] 如果您在非 CSDN 网站内看到这一行,
说明网络爬虫可能在本人还没有完整发布的时候就抓走了我的文章,
可能导致内容不完整,请去上述的原文链接查看原文。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。