面试题：MongoDB集群级别持久性之高级难度问题

副本集机制：MongoDB分片的每个分片都是一个副本集。当Primary节点故障时，副本集中的Secondary节点会通过选举机制选出新的Primary节点。在故障发生前，副本集内采用同步复制的方式，Primary节点将写操作记录在oplog（操作日志）中，并将这些操作同步到Secondary节点。因此，即使Primary节点故障，已同步到Secondary节点的数据依然存在，保证了数据的持久性。
Journal日志：MongoDB使用Journal日志来确保即使在系统崩溃等极端情况下数据也不会丢失。Journal日志记录了所有的写操作，在节点重启时，MongoDB会重放Journal日志中的操作，以恢复到故障前的状态。对于副本集，Secondary节点在应用来自Primary的oplog时，也会记录自己的Journal日志，进一步保障数据持久性。

选举新Primary：当检测到Primary节点故障后，副本集内的Secondary节点开始选举新的Primary。选举过程基于节点的优先级、日志时间戳等因素。只有拥有最新oplog的节点才有资格成为新的Primary，以确保新Primary拥有尽可能多的最新数据。
数据同步：
- 新Primary与其他Secondary同步：新Primary节点选举完成后，会与其他Secondary节点进行数据同步。它会检查每个Secondary节点的oplog，确定哪些操作需要回滚（如果有）以及哪些操作需要继续应用，以确保所有节点的数据达到一致状态。
- 其他分片与新Primary同步：对于整个分片集群，其他分片可能需要与新选举出的Primary进行数据同步（例如在进行跨分片操作时）。这通常通过心跳机制和元数据信息来协调，确保集群范围内的数据一致性。
重新平衡：在节点故障及恢复过程中，集群的负载和数据分布可能受到影响。恢复完成后，MongoDB会自动触发数据重新平衡机制。Balancer会根据集群的负载情况和数据分布情况，在分片之间移动数据块（chunk），以保证整个集群的数据分布均匀，同时维持数据一致性。

知识考点