redis持久化分析

Redis 提供两种持久化机制：

1. RDB（Redis Database）

以 二进制快照 方式保存数据到磁盘。
触发方式：
- 默认会在一定间隔或达到一定条件（如 N 秒内 M 次修改）时进行 自动快照。
- 可以执行 SAVE(手动)（阻塞当前进程）或 BGSAVE(手动/自动)（创建子进程异步执行）。
优点：
- 适合大规模数据恢复（启动时直接加载）。
- 采用二进制存储，占用空间小，恢复速度快。
缺点：
- 可能会丢失最近的数据（因为是定期持久化）。
- 需要 fork 进程，可能消耗 CPU 和内存。

2. AOF（Append Only File）

记录 所有写操作日志，以追加的方式存入文件。
触发方式：
- appendfsync 配置：
  - always（每次写入都同步，最安全但最慢）。
  - everysec（每秒同步一次，折中）。
  - no（依赖 OS，最快但可能丢失数据）。
优点：
- 数据持久性更强，几乎不会丢失数据。
缺点：
- AOF 文件比 RDB 大，恢复速度相对慢。
- 需要定期 AOF rewrite 以控制文件大小。

两者组合

Redis 允许 同时开启 RDB 和 AOF，结合两者优点：
- 先用 RDB 快速加载数据。
- 再用 AOF 追加最新数据，减少数据丢失。

适用场景

机制	适用场景
RDB	适用于数据丢失影响较小，但需要快速恢复的场景，比如缓存
AOF	适用于数据持久化要求高，但对恢复时间要求不严格的业务
RDB + AOF	需要快速恢复和高持久性的业务，如重要数据库

如果你的 Redis 需要较强的持久性，一般建议 开启 AOF，并配置 everysec，同时保留 RDB 作为额外的备份手段。

redis默认持久化方式

Redis 默认使用的是 RDB（Redis Database）持久化方式。

在默认情况下，Redis 会根据以下配置生成 RDB 快照文件：
save 900 1   # 900秒（15分钟）内，如果至少有1个键被修改，则保存快照
save 300 10  # 300秒（5分钟）内，如果至少有10个键被修改，则保存快照
save 60 10000 # 60秒内，如果至少有10000个键被修改，则保存快照

这个配置意味着 Redis 会在满足一定条件时定期生成快照并保存到磁盘，通常是 dump.rdb 文件。这个文件存放在 Redis 数据目录下，并且是默认的持久化方式。
如果需要启用 AOF（Append-Only File）持久化，可以通过修改 redis.conf 配置文件中的 appendonly 配置项：
appendonly yes
默认情况下，AOF 是关闭的，因此 Redis 启动时只会根据 RDB 快照来加载数据。如果启用了 AOF，Redis 会将每个写操作追加到 AOF 文件中，提供更高的持久性。

如果手动注释掉默认的RDB配置，那么，Redis 将 不再自动进行 RDB 持久化。即数据不会定期保存到磁盘中。如果也不启用 AOF，那么 Redis 只会存储数据在内存中，这意味着数据在 Redis 重启后会丢失。

RDB方式的影响

执行 SAVE 或 BGSAVE(包括自动执行) 后，都会生成新的备份文件（dump.rdb），并且覆盖之前的文件。如果需要保留多个备份，建议手动管理文件名。
例如，可以在执行命令之前，手动将当前的 dump.rdb 重命名为一个带有时间戳或其他标识符的文件：
mv dump.rdb dump-$(date +%Y%m%d%H%M%S).rdb

Redis 不会同时保存多个 RDB 文件，只有最新的快照会保存在 dump.rdb 文件中。所以每次执行 SAVE、BGSAVE 或自动触发的持久化时，dump.rdb 都会被新快照替换。

AOF方式影响

默认情况下，Redis 会 只生成一个 AOF 文件，即 appendonly.aof。所有的写命令都会追加到这个文件中。
如果 Redis 重启或持久化操作（例如 AOF 重写）发生，原有的 AOF 文件可能会被重命名为备份文件（如 appendonly.aof.old），并且 Redis 会创建一个新的 AOF 文件。
可以在配置文件中指定多个 AOF 文件，但默认情况下 Redis 只会使用一个 appendonly.aof 文件。

Redis 在使用 AOF 时，也有非阻塞模式（例如，appendfsync always 和 appendfsync everysec）。具体来说：
主进程继续服务客户端请求：Redis 会将每个写操作命令追加到 AOF 文件中。即使 AOF 持久化正在进行，主进程也可以继续处理客户端请求，不会被阻塞。
写操作的影响：在 AOF 持久化过程中，新的写操作会被追加到 AOF 文件中，并且会与现有的 AOF 持久化机制一起进行处理。例如，如果你设置了 appendfsync everysec，Redis 会每秒同步一次 AOF 文件，新的写操作会被定期追加到文件中。

AOF 的配置选项

AOF 的操作和行为可以通过 Redis 配置文件（redis.conf）进行调整，常见的配置选项包括：
appendonly：启用或禁用 AOF，默认为 no。
appendfsync：控制 AOF 的写入同步策略，选项有：
always：每次写入操作都同步到磁盘（最安全，但性能差）。
everysec：每秒同步一次（推荐，平衡了性能和安全性）。
no：不同步（最快，但可能丢失数据）。
auto-aof-rewrite-percentage：触发 AOF 重写的大小增长百分比。
auto-aof-rewrite-min-size：触发 AOF 重写的最小文件大小。

AOF 的恢复过程

在 Redis 重启时，AOF 文件会被加载到内存中。Redis 会按顺序执行 AOF 文件中的命令，从而恢复数据。恢复过程比 RDB 快照更慢，因为 Redis 需要按顺序重放所有的操作命令，但能够提供更精确的恢复（即恢复到某个时间点）

结论：

RDB 快照：保存的是 Redis 数据库 在某一时刻的完整状态（即所有键值对和其元数据），而不包括实际执行的操作命令。
AOF 持久化：保存的是执行的每个操作命令，可以按顺序重放这些命令恢复数据。

AOF 重写

AOF 重写（AOF Rewrite）是 Redis 提供的一种机制，用于优化 AOF 文件的大小和性能，避免 AOF 文件在长时间运行后变得过于庞大，导致加载和恢复数据时变慢。AOF 重写过程会将当前数据库状态以最小的操作量重新写入新的 AOF 文件，替代原先的 AOF 文件，从而减少冗余和提高性能。

AOF 重写的基本原理：
1>AOF 重写的目的：
随着 Redis 运行，所有写操作会被追加到 appendonly.aof 文件中。随着时间的推移，这个文件可能变得非常大，特别是当你进行大量小的写操作时。由于 AOF 文件会记录每个操作命令，而 Redis 实际的内存状态可能已经发生了很大的变化，许多操作已经不再需要（例如，如果一个键已经被修改或删除，它的历史命令就不再重要）。
AOF 重写就是通过将当前数据库状态（包括所有现有数据）写入一个新的文件，替代现有的 AOF 文件，从而减小文件大小，消除冗余的命令。

2>AOF 重写的工作流程：
异步执行：AOF 重写是异步进行的。Redis 会在后台启动一个新的进程来重写 AOF 文件，这样 Redis 主进程可以继续处理客户端请求，不会阻塞。
新文件生成：在重写过程中，Redis 会通过将数据库的当前状态（从内存中导出的键值对）转换成 AOF 命令的形式，并写入新的 AOF 文件中。这些 AOF 命令会被精简，仅包含最基本的操作（即能够将数据库恢复到当前状态的命令）。
重写完成：当新的 AOF 文件完成后，原有的 AOF 文件会被替换掉。

3>AOF 重写的触发条件： AOF 重写并不是每次都会触发，它有一定的触发条件。Redis 会根据配置选项自动触发 AOF 重写，或者你可以手动触发。常见的触发条件有：
auto-aof-rewrite-percentage：AOF 文件的大小变化百分比。如果当前 AOF 文件的大小比上一次 AOF 重写时大了指定百分比（例如 100%），则触发重写。
auto-aof-rewrite-min-size：AOF 文件的最小大小。如果 AOF 文件的大小超过了这个最小值，并且符合 auto-aof-rewrite-percentage 的要求，AOF 重写将会触发。
手动触发：你也可以通过执行 BGREWRITEAOF 命令来手动触发 AOF 重写操作。

Redis持久化有个常见问题，不管是RDB还是 AOF, 如果都不用阻塞的方式持久化，那么在持久化的时候，还有写操作或者更新操作，有影响吗

这个问题涉及到一个 数据一致性问题，对于AOF是没有任何影响的，因为 AOF 是以追加的方式将命令写入文件的，并不涉及创建副本或进行内存快照，所以不存在像 RDB 那样需要担心 COW 问题。但是对于RDB是由影响的，但是有方法加解决,
为了确保数据的一致性，Redis 采用了一种叫做 copy-on-write (COW) 的机制。这是通过操作系统级的内存管理机制来实现的。具体来说，copy-on-write 允许子进程在进行快照时，只读取内存数据的快照，而不影响主进程对数据的修改。

COW机制

写时复制（Copy-on-Write, COW），这是操作系统内存管理的一个优化技术。当 Redis 执行 RDB 快照时，创建一个子进程(从父进程fork)用于复制内存中的数据。在这个过程中，父进程继续处理写操作，但不会直接影响子进程的数据。具体来说，这个机制通过操作系统的内存管理实现了“惰性复制”，即只有在修改数据时才会实际复制数据。让我们一步步解析：

写时复制（COW）概念：
写时复制（COW）是一个内存优化策略，主要用于避免不必要的数据复制。在 COW 机制下，当进程创建一个子进程时，子进程并不会直接复制父进程的所有内存数据，而是和父进程共享相同的内存页面（内存的最小单元）。这时，父进程和子进程都可以访问相同的数据。
但是，当父进程或子进程对共享内存做修改时(这个才是重点，cow其实为了处理父进程/子进程对内存内容修改的问题，对如RDB,子进程不会修改数据，所以子进程不会cow,只会在父进程出现)，操作系统才会实际创建内存的副本，并且修改的部分仅会影响其中一个进程。这就避免了不必要的内存复制，提高了效率。

在 Redis 中的应用：
1.子进程创建快照：当 Redis 执行 BGSAVE 命令时，创建一个子进程来进行 RDB 快照生成。子进程会开始读取 Redis 内存中的数据，但是在这时，父进程的数据和子进程的数据是共享的，没有立即复制。父进程和子进程都访问同一块内存区域。

2.父进程修改数据：如果此时父进程有写操作，操作系统会利用 COW 特性延迟复制被修改的内存页面。假设父进程修改了某个内存数据，当父进程试图修改该数据时，操作系统会为父进程“复制”一个新的内存页。父进程继续操作这个新的内存页，而子进程仍然保持对旧内存页的只读访问。

3.子进程的读取操作：子进程在进行快照时，读取的是父进程内存中没有被修改的部分。如果父进程没有修改某些数据，子进程和父进程可以共享这部分数据，避免不必要的复制。

4.写操作的影响：因为修改的内存会被复制到新的内存页，所以写操作不会影响到子进程正在读取的快照数据。也就是说，子进程快照的数据并不会被父进程的写操作改变，它会保持快照开始时的一致性。

5.完成快照：当子进程完成快照时，它会将快照数据写入磁盘。此时，子进程和父进程的数据已经分离，互不干扰。父进程继续进行写操作，子进程已经完成快照。

操作系统会为父进程创建一个新的内存副本，这个新的内存副本包括哪些数据

在 写时复制（Copy-on-Write, COW） 机制中，当父进程（如 Redis 主进程）修改数据时，操作系统为父进程创建的新的内存副本仅包括 父进程修改的内存页，而不会复制整个内存空间。

具体来说，内存副本的内容包括哪些数据？
1.修改过的数据页（Memory Page）：

操作系统采用的是 按页（page）进行内存管理。内存通常是按 4KB（或更大）为单位划分为多个页。父进程修改内存中的数据时，操作系统并不会直接复制整个数据块，而是只会 复制那些实际被修改的内存页。
这些修改后的内存页是新的副本，只对父进程可见，子进程仍然看到旧的内存页，直到子进程尝试修改这些数据页时才会触发复制。

2.修改的数据内容：
如果父进程修改了某个键的值，操作系统会为该键所在的内存页创建一个新的副本，存储修改后的值。
其他没有被修改的内存页则仍然由父进程和子进程共享，不会被复制。

3.其他内存区域：
对于未被修改的内存区域（例如其他键值对或数据结构），操作系统不会为这些部分创建副本，而是让父进程和子进程共享这些内存页面。这样，内存使用得到有效优化。

副本的页数据不需要和原始内存页的数据同步吗

为什么副本和原始数据不需要同步？
在 COW 机制下，内存页在进程修改数据时被复制。具体来说，当一个进程修改共享内存页时，操作系统会将该页复制到该进程的私有地址空间，之后修改会发生在副本上。原始内存页保持不变，直到有另一个进程尝试修改它时，才会再次触发 COW 机制。

为什么不需要同步？
减少开销：COW 机制的主要优势是 延迟内存复制，只有在需要修改数据时才会进行复制。通过这种方式，多个进程可以共享相同的数据，直到某个进程修改数据时才会消耗额外的内存来创建副本。这个过程避免了不必要的复制开销。
独立修改：副本和原始内存页在被复制后是 独立的。修改副本只会影响该进程的数据，而不会影响其他进程。如果副本和原始数据是同步的，那么这将使得数据在多个进程间共享时出现冲突和复杂性。
并发性：不同的进程在不同的时间对数据进行修改，副本机制保证了每个进程都有自己的独立数据副本，这样就避免了多个进程对同一块内存进行并发写入时的竞争问题。

对于父进程(主进程)在触发 COW 后，父进程会访问两个数据页(副本和原始)

COW 机制和内存页访问
共享内存页：
初始时，父进程和子进程共享同一块内存。假设父进程和子进程共享两个数据：key1 = "value1" 和 key2 = "value2"，这两个数据通常会存储在 相同的内存页 中。这个内存页是只读的。

触发 COW：
当父进程修改 key1（例如将其值改为 "new_value"）时，操作系统会创建 key1 的副本（这通常是一个新的内存页），并将修改后的值存储在副本中。此时，原始内存页中的 key1 = "value1" 保持不变，父进程会访问新的副本，修改后的 key1 = "new_value"。

父进程访问内存页：
key1 的副本：父进程访问修改后的 key1 = "new_value" 时，操作系统会将父进程指向新创建的副本内存页。
key2 仍然在原始内存页：对于 key2，因为父进程并没有修改它，所以父进程仍然会访问原始内存页中的 key2 = "value2"，而该内存页没有发生改变。

总结:
在父进程修改 key1 时，操作系统创建了 key1 的副本，但父进程 仍然可以访问 key2，并且会继续访问原始的内存页。父进程通过不同的内存页访问 key1 和 key2，因此 父进程会同时访问两个数据页：一个包含修改后的 key1，另一个包含未修改的 key2。

redis持久化分析

Redis 提供两种持久化机制：

1. RDB（Redis Database）

2. AOF（Append Only File）

两者组合

适用场景

redis默认持久化方式

RDB方式的影响

最新的RDB文件包括哪些信息

AOF方式影响

AOF 的配置选项

AOF 的恢复过程

最新的AOF文件会包含哪些信息

结论：

AOF 重写

Redis持久化有个常见问题，不管是RDB还是 AOF, 如果都不用阻塞的方式持久化，那么在持久化的时候，还有写操作或者更新操作，有影响吗

COW机制

操作系统会为父进程创建一个新的内存副本，这个新的内存副本包括哪些数据

副本的页数据不需要和原始内存页的数据同步吗

对于父进程(主进程)在触发 COW 后，父进程会访问两个数据页(副本和原始)