当前位置:   article > 正文

hbase入门到精通_hbase setcompressiontype

hbase setcompressiontype

1、提高Hbase API写入操作效率:

  • Write Buffer Size
    Hbase Client会在数据累积到设置的阈值后才提交RegionServer。这样做的好处在于可以减少RPC连接次数
  • Compression 压缩
    HColumnDescriptor hcd = new HColumnDescriptor(familyName);
    hcd.setCompressionType(Algorithm.SNAPPY); 数据量大,边压边写也会提升性能的,毕竟IO是大数据最严重的瓶颈,哪怕使用了SSD也一样。压缩方式推荐使用SNAPPY。从压缩率和压缩速度来看,性价比最高。
  • 预分区和rowkey散列:防止热点写

2、hbase为什么快?

  • 1)数据横切为多个region,类似于分区,无需全表扫描
  • 2)列式存储,一个列族的数据在同一个文件里(store),只要数据不跨列族访问,就能避免磁盘io
  • 3)合理利用内存缓冲热数据:在memstore中合理规划热数据,让查询只需去内存查

4、一个hbase表列族不超过5个,但是一个列族中的列是没有限制的,而且可以动态增加,也就是说可以随时插入一列新的数据。并且如果某个列的某个值为空,是不占用空间的。不像mysql,需要给空值赋予null或者空的字符串,造成资源浪费
5、列的存储有多个版本号,比如一个人的地址,就可以有多处,就可以以多版本的形式存进去
6、HMaster没有单点问题,HBase中可以启动多个HMaster,通过Zookeeper的Master Electio

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Monodyee/article/detail/656657
推荐阅读
相关标签
  

闽ICP备14008679号