星途面试题库

面试题：Redis集群中复制是如何保障数据一致性的

请阐述Redis集群复制机制在一般情况下是怎样确保数据一致性的，涉及哪些关键步骤和参数？

39.9万热度

难度

数据库Redis

知识考点

AI 面试

面试题答案

确保数据一致性关键步骤

数据写入主节点：客户端将写请求发送到Redis集群的主节点，主节点接收并处理该写操作，将数据更新到自己的数据集。
主节点同步数据给从节点：主节点通过复制流（replication stream）将写操作的命令同步给其对应的从节点。从节点接收到命令后，在本地执行相同的操作，从而保证数据副本的一致性。
故障检测与自动故障转移：集群中的节点会定期发送心跳消息（PING）来检测彼此的状态。如果主节点在一定时间内没有收到某个从节点的心跳响应，会标记该从节点为疑似下线（PFAIL）。当多数节点都标记某个主节点为疑似下线时，会触发自动故障转移。在故障转移过程中，从节点会被选举为新的主节点，继续提供服务，确保数据的可用性和一致性。

关键参数

repl-backlog-size：主节点的复制积压缓冲区大小。这个缓冲区用于保存主节点最近发送给从节点的写命令。当从节点因为网络问题等原因暂时与主节点断开连接后重新连接时，如果断开期间主节点发送的写命令量没有超过该缓冲区大小，从节点可以通过部分重同步（partial resynchronization）的方式快速恢复数据，而不需要进行全量同步，从而提高复制效率和减少数据不一致的时间窗口。
repl-timeout：复制超时时间。主节点等待从节点响应的最大时间，如果超过这个时间没有收到从节点的响应，主节点会认为复制连接出现问题，可能会采取相应措施，如标记从节点为疑似下线等。该参数影响着故障检测的及时性，进而对数据一致性有间接影响。
cluster-node-timeout：集群节点超时时间。用于判断节点是否下线。如果一个节点在该时间段内没有收到其他节点的心跳消息，就会被标记为疑似下线。这个参数对于及时发现故障节点，触发自动故障转移以保证数据一致性非常关键。