赞
踩
目录
讨论四种类型的云计算部署模型,并在每种情况下描述Security和Trust的问题
描述两种类型的可伸缩性度量,以及在此场景中可能出现的问题:一家银行决定在其现有的银行应用程序中添加一个新的客户关系管理(CRM)功能,还在两个国家开设了新的分行,这些新分行将使用相同的应用程序。
AWS VPC的公网子网CIDR为20.0.2.0/20,计算IP数量地址,写出子网可以拥有的最大EC2实例。
描述Amazon CloudWatch和AWS CloudTrail
描述模型视图控制器(MVC)和前端控制器设计模式,为这两种设计模式在实际应用中的应用分别举出一个例子
编写一个GPU CUDA C程序,内核名为“add”,添加两个整数变量a和显示程序将与主机(CPU)和设备(GPU)通信的所有步骤,包括内存管理活动(可以随意使用更多变量)。(该题出现2次)
关于GPU和CUDA:描述使用CUDA平台编写GPU的三种方法;描述GPU CUDA计算或编程中异构计算的两个特性。
根据上述公司收支的描述,计算资本支出(CAPEX)和运营费用;假设公司可以通过在AWS市场上向客户出租资产来收回所有的资本支出,估算一下如果公司将其基础设施迁移到云端可以节省多少成本。
关于云经济的:用图表分别描述计算传统IT成本和云计算成本的两种算法/数学模型;如果一个传统IT系统的总成本为50万英镑,那么它的前期资本成本为30万英镑,用云计算代替传统IT模式的成本是多少?
下列Map/Reduce伪代码的结果是什么?解释它并举例说明映射器/还原器之间的信息交换(出现两次)
根据下列场景,如何使用 MapReduce 计算模型组织计算?请提供算法伪代码。您可以编写适用于给定输入的 Map/Reduce 程序,计算每个供应商提供的商品的平均销售价格,或者使用伪代码编写规范。
关于Map/Reduce的性能:定义并行计算中的加速概念;使用Amdahl定律,计算用10个处理器运行此作业时可实现的最大加速,注意8%的计算作业必须顺序执行。
描述Flynn对计算机体系结构的四种分类。(W1D1)用阿姆达尔定律计算提高使用10个处理器并行运行20%应用程序的系统的性能速度
在该场景中,Hadoop使用10个mapper和2个reducer来完成计算,每个Mapper发出多少中间键:值对?有多少唯一的键被馈送到每个Reducer?
涉及到Map/Reduce的Combiner:什么是Combiner,用处?它和减速器有什么不同?使用组合器是可选的还是强制的;简要说明组合器必须遵守的两条规则。
解释在MapReduce作业的shuffle和sort阶段,由谁运行Combiner函数以及在哪个时间点执行Combiner函数。
关于Map-Reduce的数据过滤:Map-Reduce作业中数据过滤的目的是什么?给出一个数据过滤的例子;为什么数据过滤是“Mapper唯一的工作”?
涉及Hadoop计算作业执行:用箭头(→)连接Hadoop计算任务对应负责的守护进程
在分布式系统的背景下,什么是“五九可用性”?请解释这与“单点故障”的概念之间的关系,以及这可能对分布式系统产生的负面影响(该题出现2次)
HDFS (Hadoop Distributed File System)如何检测数据块损坏
如果Map任务中的一个失败,Map/Reduce作业是否会完成?应用程序主机和节点管理器如何检测Map任务的失败并对其作出反应?
什么是内容交付网络(CDN)中的DNS缓存?DNS缓存的两个好处。
关于内容分发网络(CDN):为什么网站要使用CDN?为什么CDN在世界各地放置服务器?
与云数据库有关:为什么在云数据库中使用数据分区和复制很重要;在数据访问上下文中解释强一致性和最终一致性之间的区别,用例子来解释
关于分布式图处理:描述谷歌Pregel背后的主要概念。它是如何并行化图计算的?它如何最小化节点之间发送消息的需求?
用上述资料,分别以“固定工作量”和“扩展工作量”计算该电子商务集群的两个系统效率;如果该电子商务公司使用的集群平均平均恢复时间(MTTR)为96小时,总平均故障时间(MTTF)为900天,计算集群的高可用性(HA)
不写答案了,和前题差不多
一家客户主要在伦敦的公司正在将其内部部署(私有云)服务迁移到亚马逊网络服务(AWS),他们已经聘请了一位解决方案架构师来设计他们将用于部署的AWS架构。该架构包括:Amazon VPC (Amazon Virtual Private Cloud), CIDR为10.0.0.0/16;位于伦敦地区(eu-west-2)的eu-west-2a可用区(AZ)的公网子网CIDR为10.0.1.0/20;位于伦敦地区(AZ)的eu-west-2b可用区(AZ)的私有子网CIDR为10.0.2.0/20。Web应用程序将驻留在公共子网中,DynamoDB数据库将驻留在私有子网中
第一大题和第二大题的描述名词雷同所以放一起,但第三、四大题也有很多来源于前两周
数据机密性还可以这么写
上述代码补充讲解
两个特性找不到原文,下面三选一吧
根据传统IT成本模型和云计算成本模型解释CAPEX和OPEX,并给出两个CAPEX下的成本例子和两个OPEX下的成本例子。在你的答案中使用数学成本模型作为例证。
大型超市连锁店的收银柜台,对于每个售出的商品,它生成一个记录,格式如下 [方括号中为类型]
ProductId [String],Supplier [String],Price [Double]
在这里,ProductId [String] 是产品的唯一标识符,Supplier [String] 是产品的供应商名称,而 Price [Double] 是产品的销售价格。假设超市连锁店在数个月的时间里积累了数千兆字节的数据。这些数据可以作为输入提供给 MapReduce 作业,格式为一组键/值对(String ProductId,ProductRecord record)。键是字符串,表示超市连锁店产品的唯一标识符,而值是 ProductRecord 对象,包含产品的全部详细信息(以及用于访问每个字段的方法)。例如,ProductRecord.getPrice() 和 ProductRecord.getSupplier() 分别返回输入行的 Price 和 Supplier 字段。
注意:可以假设存在一个名为 computeAvg(List<Pair> values) 的方法,它返回列表中商品的平均销售价格。应该在 reduce 方法中使用这个方法。
超市连锁店的首席执行官想要一个供应商列表,列出每个供应商提供的商品的平均销售价格。
- Map(String key, ProductRecord value):
- // key 是产品ID,value 是产品记录对象
- supplier = value.getSupplier() // 获取供应商
- price = value.getPrice() // 获取销售价格
- emitIntermediate(supplier, price) // 输出中间键/值对
-
- Reduce(String key, List<Double> values):
- // key 是供应商名称,values 是该供应商的所有销售价格列表
- avgPrice = computeAvg(values) // 调用computeAvg方法计算平均销售价格
- emit(key, avgPrice) // 输出最终键/值对,键为供应商,值为平均销售价格
解析:
第一题的300万个键值对是由(600万张图片)*(一张照片中出现的汽车的平均数量是0.5)得来
第二题的500个keys是由(3000个独特的汽车型号)/(6个Reducers)得来
“五九可用性”是指系统的可用性达到99.999%。这意味着系统每年最多只能停机5.26分钟,忍受少数错误,不能有单点误差。这是对分布式系统高可用性的极端要求,通常在需要持续运行且不容忍长时间停机的关键应用中使用。
关于读写分离:所有的写操作都发生在主数据库上,确保数据的一致性。读操作可以分发到任意一个从数据库上,实现了负载均衡,提高了并发能力。优点:提高了系统的并发读能力,降低了读操作对主数据库的压力。增加了系统的可伸缩性,可以通过添加从数据库来扩展读能力。缺点:数据同步延迟:从数据库复制数据的过程是异步的,可能导致读到的数据并不是最新的。一致性问题:在某些情况下,主数据库和从数据库之间可能存在数据不一致的情况,需要采取一些措施来处理这种情况。
高可用性集群是指由多个节点组成的数据库集群,旨在提高系统的可用性和容错能力。如果一个节点出现故障,其他节点可以接管其工作,从而保持系统的正常运行。适用于读写操作都较为频繁的场景。
数据分片是为了应对大规模数据存储和处理的需求,将数据分散存储在多个节点上,每个节点负责一部分数据。数据分片的实现方式例子:垂直分片: 将不同表或列的数据存储在不同的节点上,可以根据数据的关系进行垂直拆分。水平分片: 将同一表中的不同行数据存储在不同的节点上,可以根据某个字段值的范围或哈希值进行水平拆分。
或用chatgpt
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。