当前位置:   article > 正文

Redis 集群哈希槽分区算法详解_使用哈希算法进行缓存分片

使用哈希算法进行缓存分片

目录

集群

哈希求余算法

基本思路

服务器扩容

一致性哈希算法

基本思路

哈希槽分区算法

服务器扩容


集群

广义的集群

  • 只要是多个机器 且构成了分布式系统,均可称为是一个集群
  • 主从结构、哨兵模式,也可认为是 广义的集群

狭义的集群

  • Redis 提供的集群模式,在集群模式下,主要解决存储空间不足问题,即拓展存储空间

  • 虽然哨兵模式提高了系统的可用性,但其本质还是通过 Redis 主从节点来存储数据
  • 即通过 主节点/从节点 来存储整个数据的全集

问题:

  • 一台机器的内存存储的空间始终是有限的!

解决方案:

  • 引入多台机器,每台机器存储一部分数据

实例理解

  • 例如有 1TB 的数据需要存储
  • 拿两台机器来存,每台机器仅需存 512GB
  • 拿四台机器来存,每台机器仅需存 256GB
  • 随着机器数目的增加,每台机器所存储的数据量也便跟着减少
  • 只要机器的规模足够多,便可以存储任意大小的数据

注意:

  • 对于拿四台机器而言,不是说光搞四台机器就够了,而是每台存储数据的机器还需搭配若干个从节点


  • 下述文章将介绍三种主流的数据分片算法

一、Redis集群方案的简单介绍

Redis集群的方案一般分为三种:

  • 哈希取余分区
  • 一致性哈希算法分区
  • 哈希槽分区(本文介绍的就是这种)
1、哈希取余分区:

优点:

简单粗暴,只要提前预估好数据量,然后规划好节点,例如:3台、30台、300台节点,就能保证未来一段时间内的数据支撑。

缺点:

事先规划好节点,进行扩容或者缩容就比较麻烦了额,不管扩缩,每次数据变动导致节点有变动,映射关系需要重新进行计算,在服务器个数固定不变时没有问题,如果需要弹性扩容或故障停机的情况下,原来的取模公式就会发生变化:Hash(key)/3会变成Hash(key) /?。此时地址经过取余运算的结果将发生很大变化,根据公式获取的服务器也会变得不可控。如果某个redis机器宕机了,由于台数数量变化,会导致hash取余全部数据重新洗牌。

2、一致性哈希算法分区:

优点:

容错性:假设Node C宕机,可以看到此时对象A、B、D不会受到影响,只有C对象被重定位到Node D。一般在一致性Hash算法中,如果一台服务器不可用,则受影响的数据仅仅是此服务器到其环空间中前一台服务器(即沿着逆时针方向行走遇到的第一台服务器)之间数据,其它不会受到影响。简单说,就是C挂了,受到影响的只是B、C之间的数据,并且这些数据会转移到D进行存储。

扩展性:数据量增加了,需要增加一台节点NodeX,X的位置在A和B之间,那受到影响的也就是A到X之间的数据,重新把A到X的数据录入到X上即可,不会导致hash取余全部数据重新洗牌。

优点总结:加入和删除节点只影响哈希环中顺时针方向的相邻的节点,对其他节点无影响。

缺点:

Hash环的数据倾斜问题,一致性Hash算法在服务节点太少时,容易因为节点分布不均匀而造成数据倾斜(被缓存的对象大部分集中在某一台服务器上)问题。数据的分布和节点的位置有关,因为这些节点不是均匀的分布在哈希环上的,所以数据在进行存储时达不到均匀分布的效果,造成了分区中数据倾斜不一致性的问题。

3、哈希槽分区

由于一致性哈希分区存在数据倾斜不一致性的问题,故引入了槽的概念。Redis 集群中内置了 16384 个哈希槽,Redis 会根据节点数量大致均等的将哈希槽映射到不同的节点。当需要在 Redis 集群中放置一个 key-value时,Redis 先对 key 使用 crc16 算法算出一个结果,然后把结果对 16384 求余数,这样每个 key 都会对应一个编号在 0-16383 之间的哈希槽,也就是映射到某个节点上。

优点:极大地方便了集群做线性扩展,以及实现平滑的扩容或缩容。

哈希求余算法

  • 哈希求余算法 借鉴了哈希表的基本思想

基本思路
  1. 借助 hash 函数,针对要插入的数据的 key 来计算出一个 hash 值
  2. 再将该 hash 值余上 分片的个数,从而便得到一个下标
  3. 最终根据该下标来决定该 数据 应存入到哪个分片中

实例理解

  • 假设有 四个分片,分别为 0号分片、1号分片、2号分片、3号分片
  • 再次假设 hash(key)%N = 1 ,此时这个 key 对应的数据便应存入 1号分片中
  • 后续查询 key 时,直接采用同样的算法
  • 因为 key 是一样的,hash 函数是一样的,得到的 下标值 就是一样的

注意点一:

  • 此处我们是针对要插入数据的 key 来计算 hash 值,而不是 value!
  • Redis 本身存储的就是键值对结构的数据

注意点二:

  • 关于 hash 函数,我们可以选择使用 MD
  • MD5 本身就是一个计算 hash 的算法
  • MD5 可针对一个字符串里面的内容进行一系列的数学变换,最终变换成整数

  • MD5 是一个非常广泛使用的 hash 算法

MD5 的特点:

  1. MD5 算出的结果为定长,即无论输入的原字符串多长,最终算出的结果均为固定长度
  2. MD5 算出的结果是分散的,即两个原字符串大部分都相同,仅一个小地方不同,算出来的 MD5 值也会差别很大
  3. MD5 计算结果是不可逆的,即给你原字符串,可以很容易算出 MD5 值,但是给你 MD5 值,很难还原出原始的字符串的(理论上是不可行的)

注意:

  • 网上所存在的 MD5 破解,其实就是将一些常见字符串的 MD5 值提前算好,并将其保存下来
  • 按照打表的方式,根据 MD5 值映射到 原字符串
  • 此时你所提供的 MD5 值能不能查到原字符串,就纯凭运气了

服务器扩容
  • 一旦服务器集群需要扩容,此时就需要更高的成本了

实例理解

  • 分片主要目的就是为了能提高存储容量
  • 分片越多,能存的数据就越多,其成本也越高
  • 一般都是先少搞几个分片,比如 3个分片
  • 但是随着业务逐步增长,数据变多,此时 3个分片的存储容量便略显不足,需要扩容
  • 引入新的分片,此时 hash(key)% N 中的 N 随之改变
  • 当 hash 函数和 key 都不变的情况下,仅 N 发生改变,整体的分片结果也会跟着改变!
  • 如果发现某个数据在扩容之后,不应该待在当前的分片中了,就需要对其重新进行分配,即搬运数据

  • 观察上图,一共 20 个数据,只有 3个数据不需要搬运,搬运了 17 个数据
  • 如果是 20亿个数据呢?就有 17亿个数据需要搬运,这就十分麻烦了!

注意:

  • 上述方式的扩容,开销极大
  • 往往不能直接在生产环境上操作,只能通过 替换的方式来实现扩容
  • 即重新搞原来那么多分片,并将原数据都拷贝过来,再引入新机器进行扩容操作,直到扩容完成,最后用新机器代替旧机器
  • 这样一来依赖的机器将变得更多,成本也变得更高,操作步骤也更加复杂

一致性哈希算法

  • 在上述哈希求余算法中,当前 key 属于哪个分区是交替进行存储的,即不连续

实例理解

  • 结合上述的实例
  • 102 属于 0 号分区103 属于 1号分区、104 属于 2号分区、105 属于 0号分区
  • 如此交替存储,导致搬运的成本很大

  • 在一致性哈希算法的设定下,将交替存储,该进成了连续存储
基本思路

1、将 0~2^32-1 这个数据空间,映射到一个圆环上,数据按照顺时针方向增长

2、假设当前存在三个分片,将分片放到圆环对应位置上

3、假设有一个 key,通过 hash 算法计算出 value 值 ,此时便将该 value 值映射到圆环上,接着顺时针去找,找到第一个分片就是该 key 应存入的分片

4、如需扩容,则原有分片在环上的位置不变,只需在环上新安排一个分片位置即可

  • 此时仅需将 0号分片上的数据部分搬运给 3号分片即可,其他分片不动

注意点一:

  • 因为 1号分片 和 2号分片 均不变
  • 虽然该搬运方式的成本也是有的,但是还是比刚才哈希求余的方式低了不少

注意点二:

  • 虽然搬运的成本低了,但是这几个分片的数据量,可能会因此不均匀,即数据倾斜

问题:

  • 如果扩容时,搞多个分片呢?

  • 如上图所示,这样不就可以避免数据倾斜问题吗?

回答:

  • 这确实是个好的思路
  • 且总的搬运数据量仍比哈希求余的方式更少
  • 但最大的问题是 领导会给你批这么多机器吗? 该方式的成本还是比较高的!

哈希槽分区算法

  •  Redis 真正采用的分区算法
  • 这种算法的本质就是将 一致性哈希 和 哈希求余 这两种方式给结合了起来

公式:

  • hash_slot = crc16(key) % 16384
  • hash_slot:表示哈希槽,有了哈希槽便可进一步将这些哈希槽分配到不同的分片上
  • crc16:一种计算 hash 值的算法
  • 16384:至于此处为啥取 16384 的余数,后文有详细说明

实例理解

  • 假设当前有 3个分片,以下是哈希槽一种可能的分配方式
  • 0 号分片:[0, 5461],共 5462 个槽位
  • 1 号分片:[5462, 10923],共 5642 个槽位
  • 2 号分片:[10924, 16383],共 5460 个槽位

注意点一:

  • 虽然哈希槽不是严格意义上的均分,但是这三个分片上的数据也算是比较均匀的了

注意点二:

  • 此处实例只是一种可能的分配方式
  • 实际上 分片是非常灵活的
  • 每个分片持有的槽位号,可以是连续的,也可以是不连续的

注意点三:

  • 每个分片均会使用 位图 这样的数据结构 表示自己当前有多少槽位号
  • 16384 个 bit 位,用每一位 0/1 来区分当前 自己这个分片 是否持有该槽位号

简单理解


服务器扩容
  • 当需要进行扩容时,比如新增一个 3号分片,此时便可以针对原有槽位进行重新分配
  • 可以将之前每个分片所持有的槽位,各拿出一点给新分片
  • 0 号分片: [0, 4095], 共 4096 个槽位
  • 1 号分片: [5462, 9557], 共 4096 个槽位
  • 2 号分片: [10924, 15019], 共 4096 个槽位
  • 3 号分片: [4096, 5461] + [9558, 10923] + [15020, 16383], 共 4096 个槽位

注意点一:

  • 针对新增的 3号分片,其槽位号不一定非得是连续的区间

注意点二:

  • 在 Reids 中,当前某个分片包含哪些槽位都是可以手动配置的

问题一:

  • Redis 集群是最多有 16384 个分片吗?

回答:

  • 此时每个分片上就只有一个槽位
  • key 是先要映射到槽位,再映射到分片的
  • 如果每个分片包含的槽位比较多,且槽位个数相当,就可认为各分片包含 key 数量相当
  • 如果每个分片包含的槽位比较少,这时槽位个数就不一定能直观的反应到 key 的数目
  • 因为有的槽位可能是有多个 key,有的槽位可能没有 key
  • 此时便难以保证数据在各个分片上的均衡性

注意:

  • Reids 的作者建议集群分片不应该超过 1000 !

具体理解:

  • 如果真分成了 1.6w 个分片,那么整个数据服务器的集群规模就太可怕了
  • 由万台主机构成的集群,整个集群的可用性是非常堪忧的!
  • 因为机器越多,出故障的概率就越高!

问题二:

  • 为什么是 16384 个槽位?

回答:

  • 首先,节点之间通过心跳包进行通信,心跳包便包含了该节点持有那些槽位
  • 表示 16384 个 槽位,需要的位图大小为 2KB
  • 如果给定的 槽位数 更多了,如 65536 个,此时便需要消耗更多的空间,即需要的位图大小为 8KB
  • 虽然这对于内存来说不算什么,但是在频繁的网络心跳包中,还是一个不小的开销
  • 另一方面,16384 个槽位也基本够用了,且占用的网络带宽也不是很大

注意:

  • 网络带宽相较于内存来说更稀有、更贵重
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/正经夜光杯/article/detail/783940
推荐阅读
相关标签
  

闽ICP备14008679号