赞
踩
冷备份: Hadoop1.X :NameNode(主) SecondaryNameNode(从)
在Hadoop1.X中,SecondaryNameNode会按照时间阈值(比如24小时)或者edits日志大小阈值(比如1G),周期性的将fsimage和edits合并成新的fsimage并替换,然后将最新的fsimage推送给NameNode,减少 NameNode 启动时间;
非实时merge,一旦NameNode挂了,可能会导致元数据丢失;
热备份: Hadoop2.X:Active NameNode(主) Standby NameNode(从)
在Hadoop2.X中采用主从架构,这个动作是由Standby NameNode来完成;一旦Active NameNode挂掉,Standby NameNode会实时同步前者的fsimage,并将merge后的新fsimage文件替换前者中旧的fsimage文件;
实时merge,一旦前者挂了,后者能够马上顶上,不会出现元数据丢失;
热备的切换,需要zookeeper的协助,具体步骤参考:https://blog.csdn.net/jiweiwong/article/details/51774879?depth_1-utm_source=distribute.pc_relevant.none-task&utm_source=distribute.pc_relevant.none-task
fsimage文件:是HDFS文件系统存于硬盘中的元数据检查点(即全量),里面记录了自最后一次检查点之前HDFS文件系统中所有目录和文件的序列化信息;
edits log文件:保存了自最后一次检查点之后所有针对HDFS文件系统的操作(即增量),比如:增加文件、重命名文件、删除目录等等。
在NameNode启动时候,会先将fsimage中的文件系统元数据信息加载到内存,然后根据eidts中的记录将内存中的元数据同步至最新状态;所以,这两个文件一旦损坏或丢失,将导致整个HDFS文件系统不可用。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。