面试题：消息队列 Kafka 如何保证消息的顺序性？

Kafka 保证消息顺序的机制

单分区内顺序
- Kafka 消息在每个分区内是顺序写入的。生产者发送到同一分区的消息，会按照发送的顺序依次追加到分区日志文件中。这是因为 Kafka 采用了分区日志文件的结构，每个分区是一个有序的、不可变的记录序列，新消息总是追加到文件末尾。
- 消费者从分区中按顺序拉取消息，这样就保证了在单分区内，消费者消费到的消息顺序与生产者发送的顺序一致。
生产者端幂等性
- 对于生产者发送消息，Kafka 0.11.0.0 版本引入了幂等性生产者。幂等性生产者保证在重试时，不会重复写入消息。例如，当生产者发送消息后，因网络等原因没有及时收到 Kafka 服务端的确认，此时生产者进行重试。幂等性生产者可以确保即使重试多次，也只会在 Kafka 分区中写入一条相同的消息，不会破坏消息顺序。
- 幂等性生产者通过 PID（Producer ID）和 Sequence Number 来实现。每个幂等性生产者实例在初始化时会被分配一个唯一的 PID，每次发送消息时，消息会携带一个递增的 Sequence Number。Kafka 服务端会缓存每个生产者发送到每个分区的最大 Sequence Number，当收到新消息时，会验证该消息的 Sequence Number 是否大于缓存的最大 Sequence Number，如果是，则接收该消息并更新最大 Sequence Number；否则，丢弃该消息。
事务
- Kafka 从 0.11.0.0 版本开始支持事务。事务可以保证一组消息要么全部成功写入 Kafka，要么全部失败，不会出现部分成功的情况。例如，在一个事务中，生产者可能需要向多个分区发送消息，事务机制确保这些消息要么都写入对应的分区，要么都不写入，从而维护了消息之间的逻辑顺序。
- 事务通过 Transaction Coordinator 来管理。生产者在开始事务时，会向 Transaction Coordinator 注册事务，获取一个 Transaction ID。在事务执行过程中，生产者发送的所有消息都会携带这个 Transaction ID。Transaction Coordinator 负责协调事务的提交或回滚，当事务提交时，它会向 Kafka 服务端发送相应的指令，确保事务内的所有消息都被正确持久化；当事务回滚时，它会通知 Kafka 服务端丢弃事务内未完成的消息。

多分区场景下特定主题消息有序消费且尽量不影响性能的方法

消息路由策略
- 基于特定字段路由：在生产者端，根据消息中的某个业务关键字段（如订单 ID、用户 ID 等）进行哈希计算，将具有相同关键值的消息发送到同一个分区。例如，如果是订单相关的消息，按照订单 ID 进行哈希分区，这样同一订单的所有消息就会进入同一个分区，从而保证了该订单相关消息的顺序性。
- 自定义分区器：如果 Kafka 内置的分区器不能满足需求，可以实现自定义分区器。在自定义分区器中，可以根据业务逻辑更灵活地决定消息发送到哪个分区。比如，根据消息的优先级和某个业务标识共同决定分区，既保证特定业务标识的消息有序，又能在一定程度上处理不同优先级的消息。
消费者端处理
- 单线程消费：最简单的方式是为每个分区分配一个消费者线程进行消费。这样可以确保每个分区内的消息按照顺序被消费。但这种方式在高并发场景下，由于单个线程的处理能力有限，可能会影响整体性能。
- 多线程有序消费：可以采用“一个分区对应一个队列，多个线程从队列中取消息处理”的方式。消费者从 Kafka 拉取消息后，按照分区将消息放入对应的队列，每个队列由一个专门的线程负责消费，这样既能保证每个分区内消息的顺序性，又能利用多线程提高整体的消费处理能力。例如，可以使用 Java 中的 BlockingQueue 来实现这种队列，消费者线程从队列中取出消息进行处理，在处理过程中可以采用异步方式（如使用线程池）来执行具体的业务逻辑，以进一步提高处理效率。
Kafka Streams
- Kafka Streams 是 Kafka 提供的流处理库。它可以在多分区场景下实现消息的有序处理。Kafka Streams 会将输入的 Kafka 主题作为流数据源，通过定义拓扑结构来处理消息。在处理过程中，可以利用 Kafka Streams 的分区和窗口等机制来保证消息的顺序性。
- 例如，对于基于时间窗口的聚合操作，Kafka Streams 可以确保在每个时间窗口内，消息按照进入窗口的顺序进行处理。同时，Kafka Streams 会根据配置的并行度自动在多个任务之间分配分区，以提高处理性能，并且在任务失败时能够自动进行重新平衡，保证有序处理的连续性。

星途面试题库

面试题：消息队列 Kafka 如何保证消息的顺序性？

知识考点

面试题答案

Kafka 保证消息顺序的机制

多分区场景下特定主题消息有序消费且尽量不影响性能的方法