赞
踩
- 解析:分布式结构化数据表Bigtable是Google基于GFS和Chubby开发的分布式存储系统。
- 解析:WAS(Windows Azure Stroage)实现单一的全局命名空间(账户名、分区名、对象名)。账户名经DNS翻译可定位到数据中心和主存储集群;分区名可进一步定位到存储节点;对象名定位到对象
- 解析:文件流层只为分区层提供一个内部使用的接口,所有的写只能追加。允许用户的操作有:打开、关闭、删除、重命名、读、追加以及合并(没有修改操作)
- 解析:
- SimpleDB:限制每张表的大小,更适合于小规模负载的工作
- DynamoDB:不限制表的大小、适用于大规模的工作
- 解析:上行链路是指从虚拟交换机到物理网络设备的连接,这个连接使得虚拟网络能够与外部物理网络进行通信。
- 解析:由于规模问题,单个的大表不利于数据的处理,因此Bigtable将一个表分成了很多子表(Tablet),每个子表包含多个行。子表是Bigtable中数据划分和负载均衡的基本单位。
- 解析:GFS使用Chubby选取一个GFS主服务器,Bigtable使用Chubby指定一个主服务器并发现、控制与其相关的子表服务器。
- 解析:所有者是桶或对象的创建者,默认具是WRITE_ACP权限。但是所有者可以通过覆写相应桶或对象的ACP获取想要的权限,从这个意义上来说,所有者默认就是最高权限拥有者。
- 解析:GFS将文件按照固定大小进行分块,默认是64MB,每一块称为一个Chunk(数据块)
- 解析:
组成部分 说明 Windows Azure 微软云计算操作系统,提供在微软数据中心服务器上运行应用程序和存储数据的Windows环境 SQL Azure 云中的关系数据库,为云中基于SQL Server的关系型数据提供服务 Windows Azure AppFabric 为在云中或本地系统中的应用提供基于云的基础架构服务 Windows Azure Marketplace 为购买云计算环境下的数据和应用提供在线服务
- 解析:Paxos算法一种基于消息传递(Messages Passing)的一致性算法,用于解决分布式系统中的一致性问题。
- 解析:Amazon机器映像(Amazon Machine Image,AMI)是包含操作系统、服务器程序、应用程序等软件配置的模板,可以用于启动不同实例,进而像传统的主机一样提供服务。
- 解析:Chunk Server负责具体的存储工作。数据以文件的形式存储在Chunk Server上,ChunkServer的个数可以有多个,它的数目直接决定GFS的规模。
- 解析:2006年8月9日,谷歌首席执行官埃里克·施密特在搜索引擎大会上首次提出云计算的概念,并说谷歌自1998年创办以来,就一直采用这种新型的计算方式。
- 解析:Megastore的基本架构,最底层的数据是存储在Bigtable中的。不同类型的副本存储不同的数据。在Megastore中共有三种副本,分别是完整副本(Full Replica)、见证者副本(Witness Replica)和只读副本(Read-only Replica)。
- 解析:迁移存储设备的最大障碍在于需要占用大量时间和网络带宽,通常的解决办法是以共享的方式共享数据和文件系统,而非真正迁移。
- 解析:重复深度主要关注的是可重复类型,而定义深度同时关注可重复类型(repeated)和可选类型(optional)。
- 解析:WAS存储域的层次结构:前端、分区层和文件流层
- 前端:由一组无状态服务器构成来处理访问请求。一旦接收到一个请求,该层便会查找账户名,认证请求,再把请求路由到分区层的服务器。
- 分区层。该层负责管理和理解上层数据抽象类型(Blob、表、队列和文件),提供一个可扩展的名空间,保证数据对象事务处理顺序和强一致性,在数据流层之上存储数据,缓存数据对象来减少磁盘I/O。
- 文件流层:该层存储数据在硬盘上,负责在多个服务器间分布和复制数据来保持存储域中数据的可用性。
- 解析:为了使这种机制能够有效地运行,每条特权指令的执行都需要产生“自陷”,以便Hypervisor能够捕获该指令,从而使VMM能够模拟执行相应的指令
- 解析:SQL Azure数据同步服务使用“轮辐式(hub-and-spoke)”模型,所有的变化将会首先被复制到SQL Azure数据库“hub”上,然后再传送到其他“spoke”上。
- 解析:监控开销的大小直接决定Dapper的成败,为了尽可能地减小开销,进而将Dapper广泛部署在Google中,设计人员设计了一种非常巧妙的二次抽样方案。
- 解析:客户端与主服务器之间传输的是控制流;客户端与子表服务器之间的传输的是数据流
- 解析:Bigtable中实际的数据都是以子表的形式保存在子表服务器上的,客户一般也只和子表服务器进行通信
- 解析:
- 解析:内存的迁移是虚拟机迁移最困难的部分
- 解析:为了保证其稳定性,Amazon的系统采用完全的分布式、去中心化的架构。其中,作为底层存储架构的Dynamo也同样采用了无中心的模式。
- 解析:由于读操作要使用SSTable,数量过多的SSTable显然会影响读的速度
- 解析:Amazon限制了每个用户创建桶的数量,但没有限制每个桶中对象的数量。
- 解析:半虚拟化技术是一种虚拟化技术,它要求操作系统知道自己是虚拟化的,并对操作系统内核进行修改以适应虚拟化环境。。典型的半虚拟化技术代表是Xen。软件辅助虚拟化和硬件辅助虚拟化是指全虚拟化技术(Full Virtualization)中的两种实现方式。
- 解析:
- current:总是在单个实体组中完成
- 在开始某次current读之前,需要确保已提交的写操作已经全部生效,然后应用程序再从最后一个成功提交的事务时间戳位置读数据- snapshot:总是在单个实体组中完成
- 系统取出已知的最后一个完整提交的事务的时间戳,接着从这个位置读数据。
- 读的时候可能还有部分事务提交了但还未生效- inconsistent:
- 忽略日志的状态直接读取最新的值
- 适用于要求低延迟并能忍受数据过期或不完整的读操作
- 解析:
- 域内复制:WAS在文件流层实现同步复制,保证存储域内的所有数据在其内部是可靠的。
- 域内复制的作用:域内复制专门为硬件失效而设计,保证WAS提供快速见状的存储响应
- 域间复制:WAS系统在分区层实现跨存储域的异步复制。
- 域间复制的作用:域间复制提供跨地域冗余来防止地域灾难,和位置服务结合起来,提供跨数据中心的数据处理。
- 解析:
- 首次抽样:在数据收集阶段,Dapper首先对所有的请求进行初步抽样。这个抽样率通常设置得较低,例如1%或更少,只有一小部分请求会被记录和跟踪。
- 二次抽样:在首次抽样的基础上,Dapper进一步对已经抽样的数据进行再次抽样。抽样的目的是进一步减少数据量,同时保持数据的代表性。
- 二次抽样的作用:降低开销、提高可部署性、确保分析结果的准确性和可靠性、
- 解析:
- 本地查询:查询协调者判断实体组上数据是否已经最新
- 发现位置:确定最新日志位置,选择一个已生效的副本。采用本地读取(Local Read)或者多数派读取值
- 追赶:一旦某个副本被选中,就使其追赶到已知的最大日志位置处。
- 验证:如果本地副本被选中且数据不是最新,发送验证消息到协调者断定对能够反馈所有提交的写操作。无须等待回应,如果请求失败,下一个读操作会重试。
- 查询数据:在所选的副本中利用日志位置的时间戳读取数据。
- 解析:
- S3用户首先发出服务请求,系统自动生成一个服务请求字符串。HMAC函数根据用户的服务请求字符串和Secret Access Key生成数字签名A,并将签名A和服务请求字符串传给S3服务器。
- 服务器接收到信息后,分离出用户的AccessKey ID,通过查询S3数据库得到用户的Secret Access Key。利用和上面相同的过程生成数字签名B,然后和数字签名A做比对,相同则通过验证,反之拒绝。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。