Redis的持久化机制,RDB和AOF
Redis是基于内存操作,很快,既然Redis在内存工作,但是数据如何保存呢?
在Redis重启的时候,如何把数据恢复,保持一致性?这就涉及Redis的持久化机制了。
# 1、Redis的持久化机制
Redis的持久化机制有两种:
- RDB
- AOF
可以单独使用其中一种或将二者结合使用。
# 2、RDB
RDB持久化是将当前进程中的数据生成快照保存到硬盘(因此也称作快照持久化),保存的文件后缀是.rdb
它是redis默认采用支持持久化的方式。
# 2.1 自动触发
常见配置:
# Redis默认设置, 表示 900秒内产生1条写入命令就触发一次快照,自动触发 bgsave
save 900 1
save 300 10
save 60 10000
# 如果持久化出错,主进程是否停止写入
stop-writes-on-bgsave-error yes
# 是否压缩,如果开启,则消耗更多的CPU,否则消耗更多硬盘
rdbcompression yes
# 使用CRC64算法来进行数据校验,但是这样做会增加大约10%的性能消耗
rdbchecksum yes
# 快照文件名称
dbfilename dump.rdb
# 快照文件保存路径
dir ./
①、save m n:表示m秒内数据集存在n次修改时,自动触发bgsave。
其他参数解释见上。
# 2.2 手动触发
手动触发有两种方法:
1)save
同步操作,会阻塞当前Redis服务器,执行save命令期间,Redis不能处理其他命令,直到RDB过程完成为止。
2)bgsave 异步操作,Redis fork 出一个新子进程,原来的 Redis 进程(父进程)继续处理客户端请求,而子进程则负责将数据保存到磁盘,然后退出。
localhost:0>save
"OK"
localhost:0>bgsave
"Background saving started"
localhost:0>lastsave
"1603777804"
很明显bgsave
更适合执行RDB 操作,所以Redis的内部操作,包括自动触发,也是 bgsave
。
RDB bgsave 具体过程如下:
1、Redis服务器接收bgsave
,主线程需要调用系统的 fork()
函数,构建出一个子进程去操作;
2、子线程创建好RDB文件并退出时,向父进程发送一个通知,告知RDB文件创建完毕;
3、父进程接收子进程创建好的RDB文件,bgsave
命令执行结束。
# RDB优缺点:
优点:
- 采用子线程创建RDB文件,不会对redis服务器性能造成大的影响;
- 快照生成的RDB文件是一种压缩的二进制文件,可以方便的在网络中传输和保存。通过RDB文件,可以方便的将redis数据恢复到某一历史时刻,可以提高数据安全性,避免宕机等意外对数据的影响。
缺点:
- 在redis文件在时间点A生成,之后产生了新数据,还未到达另一次生成RDB文件的条件,redis服务器崩溃了,那么在时间点A之后的数据会丢失掉,数据一致性不是完美的好,如果可以接受这部分丢失的数据,可以用生成RDB的方式;
- 快照持久化方法通过调用
fork()
方法创建子线程。当redis内存的数据量比较大时,创建子线程和生成RDB文件会占用大量的系统资源和处理时间,对 redis处理正常的客户端请求造成较大影响。
# 3、AOF
AOF是记录Redis的命令,redis对将所有的写命令保存到一个aof文件中,根据这些写命令,实现数据的持久化和数据恢复,它增量备份。
常见配置:
# 是否开启aof,默认是不开启
appendonly no
# 文件名称
appendfilename "appendonly.aof"
# 同步方式,有三种,默认是 everysec
appendfsync everysec
# aof重写期间是否同步
no-appendfsync-on-rewrite no
# 重写触发配置
# (当前AOF文件大小超过上一次重写的AOF文件大小的百分之多少才会重写)
auto-aof-rewrite-percentage 100
# AOF文件重写需要的尺寸,AOF多大时开启重写
auto-aof-rewrite-min-size 64mb
# 文件重写策略
aof-rewrite-incremental-fsync yes
①appendfsync everysec
的三种模式:
- always:把每个写命令都立即同步到aof文件,很慢,但是很安全
- everysec:每 1 秒同步一次,Redis官方推荐。
- no:redis不刷盘交给OS来处理,非常快,但是也最不安全
②aof-rewrite-incremental-fsync
:
每次批量写入磁盘的数据量由aof-rewrite-incremental-fsync
参数控制,默认为32M,避免单次刷盘数据过多造成硬盘阻塞
# 3.1 AOF的工作流程:
三个步骤:命令追加、文件写入、文件同步。
所有的写入命令追加到
aof_buf
缓冲区中。AOF会根据对应的策略向磁盘做同步操作。刷盘策略由
appendfsync
参数决定。定期对AOF文件进行重写。重写策略由
auto-aof-rewrite-percentage
、auto-aof-rewrite-min-size
两个参数决定。
# 3.2 为什么需要重写?
redis不断的将写命令保存到AOF文件中,导致AOF文件越来越大,当AOF文件体积过大时,数据恢复的时间也是非常长的,所以就需要重写了。
可以重写的情况:
- 进程内超时的数据不用再写入到AOF文件中。
- 存在删除命令。
- 多条写命令可以合并为一个。
比如一个value 自增1w次,那AOF就需要记录1w次的操作,如果重写后,就可以直接记录该key的最终set值了。
# 3.3 AOF重写过程
重写分为:
自动触发
由
auto-aof-rewrite-percentage
、auto-aof-rewrite-min-size
两个参数决定 且没有进行BGSAVE、BGREWRITEAOF操作 。贴一下Redis的原话:
# Automatic rewrite of the append only file.
# Redis is able to automatically rewrite the log file implicitly calling
# BGREWRITEAOF when the AOF log size grows by the specified percentage.
#
# This is how it works: Redis remembers the size of the AOF file after the
# latest rewrite (if no rewrite has happened since the restart, the size of
# the AOF at startup is used).
#
# This base size is compared to the current size. If the current size is
# bigger than the specified percentage, the rewrite is triggered. Also
# you need to specify a minimal size for the AOF file to be rewritten, this
# is useful to avoid rewriting the AOF file even if the percentage increase
# is reached but it is still pretty small.
#
# Specify a percentage of zero in order to disable the automatic AOF
# rewrite feature.
auto-aof-rewrite-percentage 100
auto-aof-rewrite-min-size 64mb
简单解释一下,首先当你AOF文件超过了 auto-aof-rewrite-min-size
才会重写。
Redis会记录上一次重写的大小,和当前AOF的大小,当 (当前AOF大小/上次重写AOF大小)> auto-aof-rewrite-percentage
则自动重写。
例如当前文件大小129mb,上一次AOF重写原文件大小是64mb,超过100%,就重写。
自动重写也是调用 bgrewriteaof
命令。
手动触发
调用
bgrewriteaof
命令。短短一句命令其实背后做了很多操作。
localhost:0>bgrewriteaof
"Background append only file rewriting started"
AOF重写大致过程:
父进程执行
fork()
,创建一个子进程。父进程处理客户端请求,父进程把所有修改命令会写入到
aof_rewrite_buf
中,并根据appendfsync
策略持久化到AOF文件中。子进程把新AOF文件写入完成后,子进程发送信号给父进程,父进程更新统计信息。
父进程将
aof_rewrite_buf
(AOF重写缓冲区)的数据写入到新的AOF文件中。
过期的键不会被记录到
AOF
文件中
AOF的持久化也可能会造成阻塞。
fsync 每秒同步一次,假如系统磁盘比较忙,可能就会造成Redis主线程阻塞。
# AOF优缺点:
优点:
提供了多种同步命令的方式,默认1秒同步一次写命令,最多丢失1秒内的数据;、
如果AOF文件有错误,比如在写AOF文件时redis崩溃了,redis提供了多种恢复AOF文件的方式,例如使用redis-check-aof工具修正AOF文件(一般都是最后一条写命令有问题,可以手动取出最后一条写命令);
AOF文件可读性较强,也可手动操作写命令。
缺点:
- AOF文件比RDB文件较大;
- redis负载较高时,RDB文件比AOF文件具有更好的性能;
- RDB使用快照的方式持久化整个redis数据,而aof只是追加写命令,因此从理论上来说,RDB比AOF方式更加健壮,另外,官方文档也指出,在某些情况下,AOF的确也存在一些bug,(举个例子,阻塞命令 BRPOPLPUSH 就曾经引起过这样的 bug 。)这些bug的场景RDB是不存在的。
# 4、数据恢复
当Redis重新启动时,可以读取快照文件恢复数据。
将备份文件 (dump.rdb
) 或者 (.aof文件
)移动到 redis 安装目录并启动服务即可,redis就会自动加载文件数据至内存了。
RDB恢复又分两种情况:
1)主库master:
- 载入RDB时,过期键会被忽略。
2)从库salve:
载入 RDB 时,文件中的所有键都会被载入,当同步进行时,会和Master 保持一致。不过,因为主从服务器在进行数据同步的时候,从服务器的数据库就会被清空,所以一般来说,过期键在载入RDB文件的从服务器也不会造成影响
AOF则不会,过期但并未被删除释放的状态会被正常记录到 AOF
文件中,当过期键发生释放删除时,DEL
也会被同步到 AOF
文件中去。
如果同时开启了RDB和AOF,Redis会优先加载AOF文件,找不到AOF文件才会加载RDB文件。
redis4.0开始 添加了RDB-AOF混合方式,可以通过设置aof-use-rdb-preamble yes
开启。.aof
文件就由.rdb
和.aof
文件组成了。这样加载速度快,同时结合AOF,增量的数据以AOF方式保存了,数据更少的丢失。
# 5、如何选用?
如果你非常关心你的数据,但仍然可以承受数分钟以内的数据丢失, 那么你可以只使用 RDB 持久化。
因为定时生成 RDB 快照(snapshot)非常便于进行数据库备份, 并且 RDB 恢复数据集的速度也要比 AOF 恢复的速度要快, 除此之外, 使用 RDB 还可以避免之前提到的 AOF 程序的 bug 。
如果要担心数据安全和一致性,应该同时使用两种持久化功能。
参考:
- https://www.cnblogs.com/ivictor/p/9749465.html
- https://blog.csdn.net/qq_28018283/article/details/80764518
- https://redis.io/topics/persistenc
- https://www.jianshu.com/p/cbe1238f592a (opens new window)