当前位置:   article > 正文

Redis - 分布式缓存_redis分布式缓存

redis分布式缓存

一、单节点存在问题

  • 数据丢失问题:Redis是内存存储,服务重启可能会丢失数据
  • 并发能力问题:单节点Redis并发能力虽然不错,但也无法满足618、双11这样的高并发场景
  • 故障恢复问题:如果Redis宕机,则服务不可用,需要一种自动的故障恢复手段
  • 存储能力问题:Redis基于内存,单节点能存储的数据量难以满足海量数据需求
1.1 问题解决方案
  • 数据丢失问题:
    • 实现Redis数据持久化
  • 并发能力问题:
    • 搭建主从集群,实现读写分离
  • 故障恢复问题:
    • 利用Redis哨兵,实现健康监测和自动恢复
  • 存储能力问题:
    • 搭建分片集群,利用插槽机制实现动态扩容

二、Redis持久化


2.1 RDB持久化

RDB全称是Redis Database Backup file(Redis数据备份文件),也被叫做Redis数据快照。简单来说就是把内存中所有数据都记录到磁盘中。当Redis实例故障重启后,从磁盘读取快照文件,恢复数据。

快照文件称为RDB文件,默认是保存在当前运行目录

请添加图片描述

Redis停机时会执行一次RDB

  • RDB

Redis内部有触发RDB的机制,可以在redis.conf文件中找到,格式如下:

#  900 秒(15 分钟)内有1个更改,则保存快照
save 900 1
#  300 秒(5 分钟)内有10个更改,则保存快照
save 300 10
#  60 秒(1 分钟)内有10000个更改,则保存快照
save 60 10000
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

RDB的其他配置也可以在redic.conf文件中设置:

# 指定存储至本地数据库时是否压缩数据,默认为 yes,Redis 采用 LZF 压缩,如果为了节省 CPU 时间,可以关闭该选项,但会导致数据库文件变的巨大
rdbcompression yes

# 指定本地数据库文件名,默认值为 dump.rdb
dbfilename dump.rdb

# 指定本地数据库存放目录
dir ./
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • RDB的fork原理

bgsave开始时会fork主进程得到子进程,子进程共享主进程的内存数据。完成fork后读取内存数据并写入RDB文件。

fork采用的是copy-on-write技术:

  • 当主进程执行读操作时,访问共享内存;
  • 当主进程执行写操作时,则会拷贝一份数据,执行写操作。

请添加图片描述

2.1.1 RDB相关问题

1. RDB方式bgsave的基本流程:

  • fork主进程得到一个子进程,共享内存空间
  • 子进程读取内存数据并写入新的RDB文件
  • 用新RDB文件替换旧的RDB文件

2. RDB会在什么时候执行?save 60 1000代表什么含义?

  • 默认是服务停止时
  • 代表60秒内至少执行1000次修改则触发RDB

3. RDB的缺点

  • RDB执行间隔时间长,两次RDB之间写入数据有丢失的风险
  • fork子进程、压缩、写出RDB文件都比较耗时
2.2 AOF持久化

AOF全称是Append Only File(追加文件)。Redis处理的每一个写命令都会记录在AOF文件,可以看作是命令日志文件。

AOF默认是关闭的,需要修改redis.conf配置文件来开启AOF:

# 指定是否在每次更新操作后进行日志记录,也就是是否开启aof日志备份,默认为no
appendonly yes

# 指定更新日志文件名,也就是aof日志的文件名
appendfilename "appendonly.aof"
  • 1
  • 2
  • 3
  • 4
  • 5

AOF的命令记录的频率也可以通过redis.conf文件来配:

# 表示每执行一次写命令,立刻记录到AOF文件
appendfsync always

# 写命令执行完成先放入AOF缓冲区,然后标识每隔1秒将缓冲区数据写到AOF文件,是默认方案
appendfsync everysec
# 写命令执行先放入AOF缓冲区,由操作系统决定何时将缓冲区内容写回磁盘
appendfsync no
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

AOF策略对比:

配置项刷盘时间优点缺点
Always同步刷盘可靠性高,几乎不丢数据性能影响大
everysec每秒刷盘性能适中最多丢失1秒数据
no操作系统控制性能最好可靠性较差,可能丢失大量数据

因为是记录命令,AOF文件会比RDB文件大得多。而且AOF会记录对同一个key的多次写操作,但只有最后一次写操作才有意义。通过执行bgrewriteaof命令,可以让AOF文件执行重写功能,用最少的命令达到相同效果。

请添加图片描述

Redis也会在触发阈值时自动去重写AOF文件。阈值也可以在redis.conf中配置:

# AOF文件对比上次文件,增长超过多少百分比则触发重写
auto-aof-rewrite-percentage 100
# AOF文件体积最小多大以上才触发重写
auto-aof-rewrite-min-size 64mb
  • 1
  • 2
  • 3
  • 4
2.3 RDB与AOF对比

RDB和AOF各有自己的优缺点,如果对数据安全性要求较高,在实际开发中往往会结合两者来使用。

-RDBAOF
持久化方式定时对整个内存做快照记录每一次执行的命令
数据完整性不完整,两次备份之间会丢失相对完整,却决于刷盘策略
文件大小会有压缩,文件体积小记录命令,文件体积很大
宕机恢复速度很快
数据恢复优先级低,因为数据完整性不如AOF高,因为数据完整性更高
系统资源占用高,大量CPU和内存消耗低,主要是磁盘IO资源,但AOF重写时会占用大量CPU和内存资源
使用场景可以容忍数分钟的数据丢失,追求更快的启动速度对数据安全性要求较高场景

三、Redis主从架构

单节点Redis的并发能力是有上限的,要进一步提高Redis的并发能力,就需要搭建主从集群,实现读写分离。

请添加图片描述

3.1 主从数据同步原理(全量同步)
  • 主从第一次同步是全量同步:

请添加图片描述

3.1.1 master如何判断slave是不是第一次来同步数据
  • Replication Id:简称replid,是数据集的标记,id一致则说明是同一数据集。每一个master都有唯一的replid,slave则会继承master节点的replid
  • offset:偏移量,随着记录在repl_baklog中的数据增多而逐渐增大。slave完成同步时也会记录当前同步的offset。如果slave的offset小于master的offset,说明slave数据落后于master,需要更新。

因此slave做数据同步,必须向master声明自己的replication id和offset,master才可以判断需要同步哪些数据

请添加图片描述

3.1.2 简述全量同步的流程
  • slave节点请求增量同步
  • master节点判断replid,发现不一致,拒绝增量同步
  • master将完整内存数据生成RDB,发送RDB到slave
  • slave清空本地数据,加载master的RDB
  • master将RDB期间的命令记录在repl_baklog,并持续将log中的命令发送给slave
  • slave执行接收到的命令,保持与master之间的同步
3.2 增量同步

主从第一次同步是全量同步,但如果slave重启后同步,则执行增量同步,slave基于offset偏移量对比master log中的偏移量,对现有偏移量后不一致的进行增量同步

请添加图片描述

注意:
repl_backlog大小有上线,写满后会覆盖最早的数据。如果slave断开时间过久,导致尚未备份的数据被覆盖,则无法基于log做增量同步,只能再次全量同步。

3.2.1 优化Redis主从集群
  • 在master中配置repl-diskless-sync yes 启用无磁盘复制,避免全量同步时的磁盘IO。这种情况适用于全量同步居多,网络带宽够大,取消磁盘读写,采用网络传输同步。
  • Redis单节点上的内存占用不要太大,减少RDB导致的过多磁盘IO。
  • 适当提高repl_baklog的大小,发现slave宕机时尽快实现故障恢复,尽可能避免全量同步
  • 限制一个master上的节点数量,如果实在是太多slave,则可以采用主-从-从链式结构,减少master压力
    请添加图片描述
3.3 总结
3.3.1 全量同步和增量同步的区别
  • 全量同步:master将完整内存数据生成RDB,发送RDB到slave。后续命令则记录在repl_baklog,逐个发送给slave。
  • 增量同步:slave提交自己的offset到master,master获取repl_baklog中从offset之后的命令给slave
3.3.2 什么时候执行全量同步
  • slave节点第一次链接master节点时
  • slave节点断开时间太久,repl_baklog中的offset已经被覆盖时
3.3.3 什么时候执行增量同步
  • slave节点断开又恢复,并且在repl_baklog中能找到offset时

四、Redis哨兵机制

4.1 哨兵的作用和原理

Redis提供了哨兵(sentinel)机制来实现主从集群的自动故障恢复。哨兵的结构和作用如下:

  • 监控:Sentinel会不断检查您的masyer和slave是否按预期工作
  • 自动故障恢复:如果master故障,Sentinel会将一个slave提升为master。当故障实例恢复后也以新的master为主
  • 通知:Sentinel充当Redis客户端的服务发现来源,当集群发生故障转移时,会将最新信息推送给Redis的客户端
    请添加图片描述

Sentinel基于心跳机制监测服务状态,每隔1秒向集群的每个实例发送ping命令:

  • 主观下线:如果某Sentinel节点发现某实例未在规定时间响应,则认为该实例主观下线。
  • 客观下线:若超过指定数量(quorum)的sentinel都认为该实例主观下线,则判断该实例客观下线。quorum值最好超过Sentinel实例数量的一半。
    请添加图片描述

选举新的master

一旦发现master故障,sentinel需要在slave中选择一个作为新的master,选择依据是这样的:

  • 首先会判断slave节点与master节点断开时间长短,如果超过指定值(dowm-after-milliseconds * 10)则会排除该slave节点
  • 然后判断slave节点的slave-priority值,越小优先级越高,如果是0则永不参与选举
  • 如果slave-prority一样,则判断slave节点的offset值,越大说明数据越新,优先级越高
  • 最后是判断slave节点的运行id大小,越小优先级越高

如何实现故障转移

当选中其中一个slave为新的master后(例如slave1),故障的转移的步骤如下:

  • sentinel给备选的slave1节点发送slaveof no one命令,让该节点成为master
  • sentinel给所有其他slave发送slaveof 192.168.150.101 7002命令,让这些slave成为新master的从节点,开始从新的master上同步数据。
  • 最后,sentinel将故障节点标记为slave,当故障节点恢复后会自动成为新的master的slave节点
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/518267
推荐阅读
相关标签
  

闽ICP备14008679号