赞
踩
HDFS(hdfs-site.xml)相关调整
dfs.datanode.synconclose = true
dfs.datanode.synconclose set to false in hdfs-site.xml: data loss is possible on hard system reset or power loss
mount ext4 with dirsync! Or use XFS
dfs.datanode.sync.behind.writes = true (default false)
设置为true,在数据写入完成之后,datanode会要求操作系统将数据直接同步到磁盘
dfs.namenode.avoid.read.stale.datanode = true (default false)
dfs.namenode.avoid.write.stale.datanode = true (default false)
dfs.namenode.stale.datanode.interval = 30000 (default 30000)
避免读写declared dead的datanode,datanode会发送心跳给namenode,如果超过了dfs.namenode.stale.datanode.interval的时间还未接收到datanode的心跳,则认为该datanode为stale状态,也就会将datanode declare成dead。默认情况下,namenode仍然会对stale状态的datanode读
dfs.datanode.failed.volumes.tolerated =
keep DN running with some failed disks,tolerate losing this many disks,根据磁盘实际配置数量调整
dfs.client.read.shortcircuit = true
启用短路径读取(short-circuit):
当client请求数据时,datanode会读取数据然后通过TCP协议发送给client,short-circuit绕过了datanode直接读取数据。short-circuit的前提是client和数据在同一个节点上,所以集群hbase regionserver和hdfs datanode的数量上一般都是1:1,并且datanode和regionserver共处一个节点。
除此之后,指标Locality(数据本地性)需要额外关注,因为更高的数据本地性,可以使短路径发挥更好的性能
dfs.datanode.max.transfer.threads = 8192 (default 4096)
Specifies the maximum number of threads to use for transferring data inand out of the DN.<
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。