搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
小丑西瓜9
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
【机器学习】QLoRA:基于PEFT亲手微调你的第一个AI大模型
2
odps 中的一些方言语句_odps contain
3
获取小红书订单列表数据(订单详情)_小红书数据csdn
4
实现在外网SSH远程访问内网树莓派的详细教程_ssh连接远程内网机器
5
caliper的实操与报错合集,超详细的教程_caliper遇到 error [caliper] [bind] failed to execute
6
vue项目中在openlayers地图上展示echarts图表_echarts在openlayers上显示
7
40个大数据学习资源,个个是干货,最后7个太给力
8
dedecms织梦支付宝接口提示ILLEGAL_EXTERFACE错误
9
Modeler玩转数据挖掘——保险公司商品关联与推荐分析_模型算法中最大前项数一般是多少
10
rrweb学习案例(网页录制,回放)-demo_vue录屏 rrweb
当前位置:
article
> 正文
HBase-Region太多的问题简单总结
作者:小丑西瓜9 | 2024-06-15 23:45:33
赞
踩
sqoop hbase报错: hbase regiontoobusyex
后果
我们知道一个RegionServer上有n个region,每个region会根据不同的col family数拥有不同的store,每个store有一块自己的memstore内存区和多个HFile文件,所以在region很多的情况下,平均RegionServer分担的Region就会多了,那么一台RegionServer上资源是优先的,并且多个region都有自己的memstore,所以就会争抢资源,一直与memstore比较小了,所以在memstore很小的时候,就会频繁的刷HFile,那么memstore刷出来的HFile也就相应的变小了,所以为了保证HFile的数量合理,就会发生大规模的合并,那么合并就会拖慢性能,甚至导致Full GC的发生.这就会造成RegionServer与ZK可能发生失联,那么就会造成一系列的错误
主要的问题可能会有
合并风暴,因为HFile文件多
客户端超时,因为合并可能会涉及集群中网络的IO风暴
批量加载超时,因为RegionServer太忙了无法反应,可能会报出RegionTooBusyException异常
原因
Region最大值设置的太小
新HBase版本用了旧版本配置了,比如之前的HBase拆分上限是1G.现在是10G
预分区不合理
等等等...
解决参考
Region 过多的问题的最终目的是使Region总数降低,也就是说进行合并Region
在0.98之前只支持离线的合并,这个过程需要暂时数据写入,并且需要先关闭集群然后执行合并操作,然后再启动集群.这样柑橘已经没有了学习价值了就不做笔记了
0.98之前还有一个CopyTable工具可以使用,将一个表拷贝到另一个新的预分裂的表,但是这需要有个问题,就是如果你之前put或者修改数据的时候是自己定义的时间戳,那么Copy到新表的时候,如果新表与旧表中有重复列,并且自定义的时间戳比当前重复列的时间戳小,那么就会造成数据的永久丢失,并且Copy一个大表的话会相当耗费时间
0.98之后加入了在线合并,合并的时候将不需要关闭集群了,将表禁用disable即可,在线合并可以通过hbase shell 或者 javaapi来操作,合并完成后,可以从HBase的web页面看到结果
防范
列族不易太多,400个拥有两个列族的region,不如800个拥有一个列族的region
保证最大的文件大小设置为至少10G,有些region小于10G没问题,但是要确保在必要的情况下,region能达到10GB,推荐使用可视化工具监控region大小,留意增长速度快的region,在非高峰情况下将他们拆分
有时候在负载比较小的情况下,可能会创建很多小region,为了确保region能增长到正常大小,要确保
hbase.hregion.max.filesize siz
的属性设置为至少10GB,也可以将最大文件大小设置更大,比如100GB,当使用较大的region大小的时候,我们就可以手动拆分,确保split时间合适,这是对集群的影响最小的操作
行键和表设计
这我总感觉有很多需要注意的地方,我会在之后学习并总结成学习笔记的
自己的总结
看到这总的来说,除了行键和表设计自己没有学,本文主要学习到了Region的大小不能设置太小,列族不能太多,也可以在设置split规则的情况下把大小设置的大一点以便自己在集群非高峰的情况下进行拆分,而预设split而并非禁用split是因为防止忘记region需要需要拆分了,而导致region增长的非常大以至于速度变慢,其实结合之前学习还要相当注意Full GC的回收策略的使用等一些需要注意的事项
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/小丑西瓜9/article/detail/724273
推荐阅读
article
aws
报错Unable to
load
region
from
software.amazon.a...
主要是第三步,把这个文件夹放在C:\Users\xxx\即可。_unable to
load
region
from
a...
赞
踩
article
大数据大厂
面试题
_
csdn
hbase
hive
hdfs
yarn
spark
相关
面试题
...
inputFile通过split被切割为多个split文件,通过Record按行读取内容给map(自己写的处理逻辑的方法...
赞
踩
article
yarn
-ats_ats-
hbase
...
进入到zookeeper查看是否有/atsv2-
hbase
-secure/meta-region-server文件su ...
赞
踩
article
Azure
基础:什么是
Azure
区域
、
可用性
区域
和
区域
对(14)_
azure
region
...
资源是在“
区域
”中创建的,这些
区域
是指包含
Azure
数据中心的全球不同地理位置。
Azure
由遍布全球的数据中心组成...
赞
踩
article
Ubuntu
实现
Hive
与
HBase
的
安装
与
配置
(单机)_
ubuntu
hbase
...
大数据作业四,整合了
Hive
和
HBase
的
Ubuntu
单机
配置
的操作步骤以及常见错误_
ubuntu
hbase
ubunt...
赞
踩
article
Ubuntu16.04
安装
配置
HBase
详细步骤(单机版)_[da
sh
uju@
hadoop102
...
前题条件(1)Ubuntu16.04 机子一台,最好可以联网(2)已
安装
Hadoop,推荐
安装
2.7.7版本,因为它比较...
赞
踩
article
Ubuntu16.04
配置
hadoop
+
Hbase
+基础命令使用_
ubuntu
虚拟机
hbase
创表前...
hadoop
配置
还在黄金段位(jdk未安装)的上了钻石再来!!一、下载
hadoop
网址:https://archive....
赞
踩
article
Hbase 伪
分布式
安装
部署_
ubuntu
hbase
伪
分布式
安装
...
【代码】Hbase 伪
分布式
安装
部署。_
ubuntu
hbase
伪
分布式
安装
ubuntu
hbase
伪
分布式
安装
...
赞
踩
article
大
数据
基础
hadoop
/
hive
/
hbase
_
hadoop
hive
hbase
...
HDFS,它是一个文件系统,用于存储文件,通过目录树来定位文件;其次,它是分布式的,由很多服务器联合起来实现其功能,集群...
赞
踩
article
centos7
下搭建
hadoop
、
hbase
、
hive
、
spark
分布式系统架构_
centos7
部署
...
分布式
hadoop
部署
首先,在http://
hadoop
.apache.org/releases.html找到最新稳定版...
赞
踩
article
大
数据
:
Hadoop
基础常识
hive
,
hbase
,
MapReduce
,Spark_
hbase
hdf...
今天关于面试的分享就到这里,还是那句话,有些东西你不仅要懂,而且要能够很好地表达出来,能够让面试官认可你的理解,例如Ha...
赞
踩
article
大数据
Hadoop
核心架构
HDFS
+
MapReduce
+
Hbase
+
Hive
内部机理详解_
hdfs
...
HDFS
的体系架构 整个
Hadoop
的体系结构主要是通过
HDFS
来实现对分布式存储的底层支持,并通过MR来实现对分布式...
赞
踩
article
Thinking in BigData(八)大
数据
Hadoop
核心架构
HDFS
+
MapReduce
+...
纯干货:
Hadoop
核心架构
HDFS
+
MapReduce
+
Hbase
+
Hive
内部机理详解。 通过这一阶段的调研总结,...
赞
踩
article
2024年
大
数据
最全
大
数据
:
Hadoop
基础常识
hive
,
hbase
,
MapReduce
,
Spark
...
简单说,Hive提供了一种独特的SQL查询语句,使得熟悉SQL的开发者通过编写SQL语句即可访问
Hadoop
存储的海量数...
赞
踩
article
Redis
数据库
的
安装和使用(三)-
哈希
表相关指令_
redis
region
...
Redis
数据库
中hash部分什么是
哈希
表首先,先了解一下
哈希
表,相对于对于列表(list)
的
了解,
哈希
表就比较陌生了,...
赞
踩
article
HBase
shell
详细操作指南...
进入hbase Shell[root@test31 ~]# hbase
shell
HBase
Shell; enter ...
赞
踩
article
hbase
分区
列
压缩
_
压缩
队
列
的
移动平均
hbase
...
Hbase 是一个分布式
的
、面向
列
的
开源数据库,其实现是建立在google
的
bigTable 理论之上,并基于hado...
赞
踩
article
HBase
Region分区、数据压缩及与
Sqoop
集成操作_
sqoop
hbase
报错: hbas...
目录一、
HBase
表region预分区的几种方式二、
HBase
表数据的压缩配置三、
HBase
与
Sqoop
集成一、HBas...
赞
踩
article
sqoop
导入
mysql
到
hbase
报错
java
.lang.NoSuchMethodError: ...
sqoop
导入
mysql
到
hbase
报错
java
.lang.NoSuchMethodError: org.
apache
...
赞
踩
相关标签
aws
云计算
大数据
ambari
yarn
azure
azure区域
Azure可用区域
Azure区域对
Azure特殊可用区域
ubuntu
hive
hbase
HBase
Zookeeper
Hadoop
安装配置
教程
hadoop
big data
分布式
数据库
linux
spark