面试题：MariaDB 日志的高可用与灾难恢复策略

确保日志一致性以支持灾难恢复

二进制日志（Binlog）
- 配置同步策略：在 MariaDB 中，通过 sync_binlog 参数配置二进制日志刷盘策略。sync_binlog=1 表示每次事务提交时，都将二进制日志同步到磁盘，确保日志不丢失。但这会带来一定的性能开销，在实际生产中，可根据业务对数据一致性和性能的要求进行权衡。例如，对于金融交易类业务，数据一致性要求极高，可设置为 sync_binlog=1；对于一些允许少量数据丢失以换取更高性能的业务场景，可设置为 sync_binlog=N（N > 1），表示每 N 次事务提交才进行一次磁盘同步。
- 多副本存储：使用 RAID 等磁盘阵列技术，对存储二进制日志的磁盘进行冗余配置，防止因单块磁盘故障导致日志丢失。同时，可以通过设置 log_slave_updates 参数，让从库也记录二进制日志，实现多份日志副本，进一步提高日志的可靠性。
中继日志（Relay Log）
- 自动清理与维护：从库在应用主库二进制日志时，会将其记录到中继日志中。中继日志需要及时清理，防止磁盘空间被耗尽。MariaDB 会自动管理中继日志，当从库成功应用完中继日志中的事件后，会自动删除相应的中继日志文件。但管理员也可以通过 expire_logs_days 参数设置中继日志的过期时间，进一步优化磁盘空间使用。
- 可靠存储：与二进制日志类似，中继日志存储的磁盘也应采用 RAID 等冗余存储方式，确保日志在从库节点故障时不丢失。
InnoDB 重做日志（Redolog）
- 配置合适的日志文件大小：通过 innodb_log_file_size 参数设置 InnoDB 重做日志文件的大小。适当增大日志文件大小可以减少日志切换的频率，提高性能，但同时也会增加恢复时间。例如，在一个写操作频繁的电商订单系统中，如果日志文件过小，频繁的日志切换会带来额外的 I/O 开销；而过大的日志文件在崩溃恢复时，可能需要较长时间来应用重做日志。一般可根据系统的写负载和恢复时间目标来调整该参数值。
- 双写缓冲区（Doublewrite Buffer）：InnoDB 使用双写缓冲区来确保重做日志的可靠性。当数据页写入重做日志前，会先写入双写缓冲区，再从双写缓冲区写入磁盘。这样即使在写入磁盘过程中发生故障，也可以从双写缓冲区恢复数据，保证日志的一致性。

主从切换时日志管理和同步机制特殊处理

主库切换
- 确保所有日志同步：在进行主库切换前，需要确保原主库上所有未同步的二进制日志都已同步到从库。可以通过 SHOW PROCESSLIST 查看从库复制线程状态，确认 Seconds_Behind_Master 为 0，即从库已追上主库。同时，可使用 SHOW MASTER STATUS 和 SHOW SLAVE STATUS 命令来对比主从库的日志位置，确保一致性。
- 新主库设置：新主库切换后，需要重新配置二进制日志相关参数，确保日志记录正常进行。例如，检查 log_bin 参数是否开启，sync_binlog 参数是否符合业务要求等。同时，新主库的二进制日志文件名和位置信息会发生变化，需要通知从库进行相应的调整。
从库切换
- 调整复制配置：当一个从库晋升为主库后，其他从库需要调整复制配置，将复制源指向新主库。这包括修改 CHANGE MASTER TO 语句中的主库地址、端口、日志文件名和位置等信息。例如：

CHANGE MASTER TO
    MASTER_HOST='new_master_host',
    MASTER_USER='replication_user',
    MASTER_PASSWORD='replication_password',
    MASTER_LOG_FILE='new_master_binlog_file',
    MASTER_LOG_POS=new_master_binlog_position;

数据一致性检查与修复：在从库切换后，可能存在数据不一致的情况。可以通过一些工具如 pt-table-checksum（Percona Toolkit 中的工具）来检查主从库之间的数据一致性。如果发现不一致，可根据具体情况使用 pt-table-sync 工具进行数据同步修复。例如，在一个电商库存管理系统中，主从库之间库存数据不一致可能导致库存显示错误，影响业务正常运行，通过这些工具可以及时发现并修复问题。

故障检测与自动切换
- 使用监控工具：采用如 MHA（Master High Availability）、Orchestrator 等工具来监控 MariaDB 集群的健康状态。这些工具可以实时监测主从库的心跳、日志同步情况等。例如，MHA 可以通过定期向主从库发送心跳包来检测节点状态，当主库出现故障时，能够快速自动切换到从库，并确保日志同步的连续性。
- 配置故障切换策略：在监控工具中配置合适的故障切换策略。比如，设定在主库心跳丢失 N 次后触发切换操作，同时考虑从库的优先级，优先选择数据最新、性能最好的从库晋升为主库。例如，在一个新闻资讯网站的数据库集群中，可根据从库的硬件配置和当前负载情况，为不同的从库设置不同的优先级，确保在主库故障时能够快速、合理地完成主从切换，保障网站的正常运行。

星途面试题库

面试题：MariaDB 日志的高可用与灾难恢复策略

知识考点

面试题答案

确保日志一致性以支持灾难恢复

主从切换时日志管理和同步机制特殊处理