赞
踩
Redis 集群没有并使用传统的一致性哈希来分配数据,而是采用另外一种叫做哈希槽 (hash slot)
的方式来分配的。redis cluster 默认分配了 16384 个slot,当我们set一个key 时,会用CRC16
算法来取模得到所属的slot
,然后将这个key 分到哈希槽区间的节点上,具体算法就是:CRC16(key) % 16384
。
对于客户端请求的key,根据公式HASH_SLOT=CRC16(key) mod 16384
,计算出映射到哪个分片上,然后Redis会去相应的节点进行操作!
ps
:CRC16
算法产生的hash值有16bit,该算法可以产生2^16-=65536个值。换句话说,值是分布在0~65535之间。那作者在做mod
运算的时候,为什么不mod
65536,而选择mod
16384?
这个问题,作者是给出了回答的!
地址如下:https://github.com/antirez/redis/issues/2576
The reason is:
So 16k was in the right range to ensure enough slots per master with a max of 1000 maters, but a small enough number to propagate the slot configuration as a raw bitmap easily. Note that in small clusters the bitmap would be hard to compress because when N is small the bitmap would have slots/N bits set that is a large percentage of bits set.
我们回忆一下Redis Cluster
的工作原理!
这里要先将节点握手讲清楚。我们让两个redis节点之间进行通信的时候,需要在客户端执行下面一个命令
127.0.0.1:7000>cluster meet 127.0.0.1:7001
如下图所示
意思很简单,让7000节点和7001节点知道彼此存在!
在握手成功后,两个节点之间会定期发送ping/pong消息,交换数据信息,如下图所示。
在这里,我们需要关注三个重点。
到底在交换什么数据信息?
交换的数据信息,由消息体和消息头组成。
消息体无外乎是一些节点标识啊,IP啊,端口号啊,发送时间啊......
我们来看消息头,结构如下
注意看红框的内容,type表示消息类型。
另外,消息头里面有个myslots的char数组,长度为16383/8,这其实是一个bitmap,每一个位代表一个槽,如果该位为1,表示这个槽是属于这个节点的。
到底数据信息究竟多大?
在消息头中,最占空间的是myslots[CLUSTER_SLOTS/8]
。这块的大小是:16384÷8÷1024=2kb
那在消息体中,会携带一定数量的其他节点信息用于交换。
那这个其他节点的信息,到底是几个节点的信息呢?
约为集群总节点数量的1/10,至少携带3个节点的信息。
这里的重点是:节点数量越多,消息体内容越大。
消息体大小是10个节点的状态信息约1kb。
那定期的频率是什么样的?
redis集群内节点,每秒都在发ping消息。规律如下
因此,每秒单节点发出ping消息数量为数量=1+10*num(node.pong_received>cluster_node_timeout/2)
那大致带宽损耗如下所示,图片来自《Redis运维与实现》
1、如果槽位为65536,发送心跳信息的消息头达8k,发送的心跳包过于庞大。
myslots[CLUSTER_SLOTS/8]
。65536÷8÷1024=8kb
2、redis的集群主节点数量基本不可能超过1000个。
3、槽位越小,节点少的情况下,压缩比高
ps
:文件压缩率指的是,文件压缩前后的大小比。综上所述,作者决定取16384个槽,不多不少,刚刚好!
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。