「黑马 Redis」一、分布式缓存

引入

单点 Redis 问题：

数据丢失问题
- 实现 Redis 数据持久化
并发能力问题
- 搭建主从集群，实现读写分离
存储能力问题
- 学习 es，搭建分片集群，利用插槽机制实现动态扩容
故障恢复问题
- Redis 哨兵，实现健康监测以及自动恢复

Redis 数据持久化 - 数据丢失问题

RDB 持久化

RDB：Redis Database Backup file，也称 Redis 数据快照，将内存中所有数据记录到磁盘，一旦 Redis 故障重启，就从磁盘中读取快照文件，恢复数据

快照文件称为 RDB 文件，默认保存在当前运行目录

可以利用命令手动执行命令备份，但如果是手动停机的话也会进行备份

命令 save 由主线程执行，会阻塞所有命令

命令 bgsave 后台异步备份，由子进程执行，不会影响主进程

同样 Redis 内部也有触发 RDB 的机制，在 redis.conf，save x y 意为 x 秒内，如果至少有 y 个 key 被修改，则执行 bgsave

对于 RDB 的自动备份，当 bgsave 开始时会 fork 主进程得到子进程，子进程利用页表共享主进程的内存数据（也就是 Redis 数据），完成 fork 后读取内存数据写入 RDB 文件

bgsave 的 fork 时是阻塞的，并且是利用复制过来的页表读取内存数据，如果在读取时，主进程又写入数据则会采用 copy-on-write 技术 > TODO：只复制要写的数据？怎么映射

AOF 持久化

为了弥补 RDB 的缺陷：

RDB 执行间隔过长，则有可能两次 RDB 之间写入的数据有丢失风险
fork 子进程、rdbcompress 压缩、写出 RDB 文件耗时、耗 cpu

AOF：Append Only File，追加文件，将每一个写命令记录在 AOF 文件中，约等于命令日志文件

格式：${下一行字符个数}\n{命令字符串}

示例 set num 12

$3
set
$3
num
$2
12

AOF 配置

注：如果启用 appendfsync 可能会因为宕机导致缓存区内的数据丢失

AOF 记录的是命令，往往会有很多无用命令，另外假如对一个 key 进行多次操作，只有最后一次有效，可见 AOF 文件一定会比 RDB 文件大很多，为了优化这一点，可以采用命令 bgwriteaof，对 AOF 文件执行重写，削减无效命令，并且还会压缩命令，更加优化空间占用

AOF 与 RDB 对比

RDB 可以作为机房备份，AOF 因为数据更完整，所以优先 AOF 恢复

Redis 主从集群 - 并发能力问题

搭建主从架构

读多写少，所以读写分离，主节点负责写并同步给从节点，从节点负责读

开启默认的 RDB 配置，关闭 AOF，如果是一台机器部署集群，修改 port，然后各自启动

replica 的叫法从 redis5.0 后启用，之前只有 slave

开启主从关系：

永久：修改配置文件，添加 slaveof/replicaof <masterip> <masterport>
临时：在 redis-cli 中使用命令 slaveof/replicaof <masterip> <masterport>，重启后失效

这时主从关系就已经建立，可以用 INFO REPLICATION 查看相关主从信息，主可以写、读，但是从只能读

数据同步原理

全量同步

主从第一次同步（建立连接）是全量同步

如何判断是否第一次：

Replication Id；简称 replid，是数据集的标记，id 一致则说明是一个数据集，每个 master 都有一个唯一的 replid，slave 会继承 master 的 replid
offset：偏移量，随着记录在 repl_baklog 数据增加而增大，slave 完成同步会记录当前同步的 offset，并与 master 的 offset 对比，判断数据是否落后

所以 slave 在数据同步时，需要向 master 声明自己的 replication id 以及 offset，让 master 知道要同步那些数据

增量同步

第一次是全量同步，但如果 slave 重启则进行增量同步

repl_baklog 类似于环形覆盖记录，offset 对应了位置，红色部分即为未同步部分

当红色部分满溢到覆盖红色部分，意味着增量同步失效，只能再次全量同步

优化同步

加快全量同步、避免全量同步、减少主节点压力

全量同步：master 将完整内存数据生成 RDB，发送 RDB 到 slave 后续命令则记录在 repl_baklog，逐个发送给 slave 增量同步：slave 提交自己的 replid、offset 到 master，master 返回 repl_baklog 中 offset 之后的命令

执行全量同步：slave 节点第一次连接 master 节点时；slave 节点断开时间太久，repl_baklog 中的 offset 已经被覆盖时执行增量同步：slave 节点断开又恢复，并且在 repl_baklog 中能找到相应的 offset 时