赞
踩
如果使用RDBMS存储数据,当数据量越来越大,RDBMS变得难以管理和操作,此时出现了读写分离策略,即通过一个Master专门负责写操作,多个Slave负责读操作,因此服务器成本将会倍增。随着压力增加,Master也撑不下去了,因此就出现了分库,即把关联不大的数据分开部署。但这样一来,一些join查询就不能用了,必须借助中间层。而对于单个数据表来讲,随着表中的数据量增加,查询速度就会很慢,因此又得对表进行拆分。比如按ID取模分成多个表以减少单个表的记录数。但是,如果采用HBase就简单了,只需要加机器即可,HBase会自动水平切分扩展,跟Hadoop的无缝集成保障了其数据可靠性(HDFS)和海量数据分析的高性能(MapReduce)。
Hbase适合存储PB级别的海量数据,在PB级别的数据以及采用廉价PC存储的情况下,能在几十到百毫秒内返回数据。这与Hbase的极易扩展性息息相关。正式因为Hbase良好的扩展性,才为海量数据的存储提供了便利。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。