赞
踩
1、相对于传统的存储系统,新一代的分布式存储系统有两个重要特点:低成本与大规模。
2、分布式存储分类:
(1)根据数据类型
1)非结构化数据(包括文本、图片、图像、音频和视频信息等)
2)结构化数据(对应存储在关系数据库中的二维关系表结构,结构化数据的模式和内容是分开的,数据的模式需要预先定义)
3)半结构化数据(HTML文档就是典型的半结构化数据。半结构化数据的模式结构和内容混在一起,没有明显的区分,也不需要预先定义数据的模式结构)
(2)正因为数据类型的多样性,不同的分布式存储系统适合处理不同类型的数据,因此可以将分布式存储系统分为四类:
1)分布式文件系统:互联网应用中往往需要存储大量的图片、音频、视频等非结构化数据,这类数据以对象的形式组织,一般称这样的数据为Blob(二进制大对象)数据,用分布式文件系统存储,典型的有Taobao File System(TFS)。分布式文件系统也常作为分布式表系统以及分布式数据库的底层存储,如谷歌的GFS。
分布式文件系统用来存储三种类型的数据:Blob对象、定长块以及大文件。
2)分布式键值(Key-Value)系统:用于存储关系简单的半结构化数据。(它提供基于主键的CRUD(Create、Read、Update、Delete)功能
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。