面试题：消息队列中如何通过持久化机制实现基本的容错与恢复

RabbitMQ消息持久化

如何持久化
- 队列持久化：声明队列时将durable参数设置为true，这样即使RabbitMQ服务器重启，该队列依然存在。例如使用Python的pika库声明持久化队列：
```
import pika
connection = pika.BlockingConnection(pika.ConnectionParameters('localhost'))
channel = connection.channel()
channel.queue_declare(queue='my_queue', durable=True)
```
- 消息持久化：发送消息时将delivery_mode属性设置为2（1表示非持久化，2表示持久化）。例如：
```
channel.basic_publish(exchange='', routing_key='my_queue', body='Hello World!', properties=pika.BasicProperties(delivery_mode = 2))
```
关键配置
- 磁盘写入策略：RabbitMQ有两种磁盘写入策略，always和on_sync_confirm。always策略下，每次消息持久化都会进行磁盘写入，保证数据不丢失，但性能较低；on_sync_confirm策略下，只有在生产者等待确认时才进行磁盘写入，性能相对较高，但在确认前若服务器崩溃，可能丢失少量消息。可通过rabbitmq.conf文件中的queue_index_embed_msgs_below参数配置，此参数表示小于该字节数的消息会嵌入到队列索引文件中，减少磁盘I/O。
可能遇到的问题
- 性能问题：持久化操作会增加磁盘I/O，导致性能下降。尤其是在高并发场景下，频繁的磁盘写入可能成为瓶颈。
- 数据丢失风险：虽然持久化能提高消息的可靠性，但在极端情况下，如服务器在消息刚写入内存还未来得及持久化到磁盘时崩溃，可能会丢失消息。此外，如果磁盘损坏，也可能导致数据丢失。

Kafka消息持久化

如何持久化
- 日志文件：Kafka的消息以日志文件的形式持久化到磁盘。每个分区对应一个日志目录，日志又由多个日志段（Log Segment）组成。当一个日志段达到一定大小（可通过log.segment.bytes配置，默认1GB）或者经过一定时间（可通过log.roll.ms配置），就会滚动生成新的日志段。
- 刷盘机制：Kafka采用异步刷盘机制，消息先写入页缓存，然后由后台线程定期将页缓存的数据刷入磁盘。消费者可以通过配置enable.auto.commit为true（默认）来自动提交消费偏移量，也可以手动提交偏移量。这样即使Kafka服务器重启，消费者也能从上次消费的位置继续消费。
关键配置
- 副本因子（replication.factor）：设置每个分区的副本数量，默认为1。增加副本因子可以提高数据的容错性，即使部分副本所在的Broker节点宕机，数据依然可用。例如设置为3，则每个分区会有2个副本。
- acks参数：生产者发送消息时，通过acks参数指定需要等待多少个副本确认消息已写入。acks = 0表示生产者发送消息后不需要等待任何确认，性能最高但数据可能丢失；acks = 1表示生产者只需等待Leader副本确认，若Leader副本在确认后但还未同步到Follower副本时宕机，数据可能丢失；acks = all（或acks = -1）表示生产者需要等待所有同步副本确认，数据最可靠但性能相对较低。
可能遇到的问题
- 磁盘空间管理：由于Kafka会持久化大量消息，需要合理管理磁盘空间。若磁盘空间不足，可能导致新消息无法写入，甚至影响整个集群的正常运行。
- 副本同步延迟：当副本同步延迟较大时，可能会导致数据不一致。例如在acks = all的情况下，如果Follower副本长时间不同步，可能影响生产者的消息发送性能，甚至在Leader副本宕机时，由于没有合格的Follower副本，导致分区不可用。

星途面试题库

面试题：消息队列中如何通过持久化机制实现基本的容错与恢复

知识考点

面试题答案

RabbitMQ消息持久化

Kafka消息持久化