面试题：消息队列之Kafka在复杂微服务架构中的架构设计

业务模块划分：根据不同的业务模块来划分Topic，每个业务模块对应一个或多个Topic。例如，订单模块可以有“order - create”（订单创建）、“order - update”（订单更新）等Topic。这样设计的原理是将不同业务的数据分开处理，便于管理和维护，不同业务模块之间的消息不会相互干扰，提高系统的可扩展性。
粒度控制：Topic的粒度不宜过粗或过细。过粗会导致大量无关数据混合，难以精准消费；过细会增加Topic管理成本。比如，将所有用户相关操作都放在一个“user - all - operations”Topic就太粗，而针对每个用户操作都创建一个Topic又太细。合理的做法是按照操作类型或业务流程划分，如“user - registration”（用户注册）、“user - login”（用户登录）等。

分区数量：
- 考虑吞吐量：根据预估的消息生产和消费速率来确定分区数量。如果生产速率高，需要更多分区来并行处理消息。例如，一个高并发的订单系统，每秒产生大量订单消息，就需要较多分区。一般可通过性能测试来预估，公式可参考：分区数 = 预估每秒消息数 / 单个分区每秒处理消息数。单个分区每秒处理消息数可通过测试获取。
- 考虑负载均衡：分区数要与消费者实例数相匹配，避免有的分区负载过高，有的分区空闲。理想情况是每个消费者实例对应一个分区进行消费，这样能充分利用消费者资源。比如有10个消费者实例，分区数也设置为10左右比较合适。
分区分配策略：
- 轮询策略：Kafka默认的分区分配策略，将消息依次发送到各个分区。原理是简单公平，能均匀分配消息到各个分区，避免某个分区消息堆积。例如，生产者依次向分区0、分区1、分区2发送消息。
- 哈希策略：根据消息的某个属性（如消息中的用户ID）计算哈希值，根据哈希值分配到相应分区。这样相同属性的消息会被发送到同一个分区，对于需要保证相同属性消息顺序处理的场景很有用。比如，同一用户的订单消息需要按顺序处理，就可按用户ID哈希分配到同一分区。

副本数量：为每个分区设置一定数量的副本，一般设置2 - 3个副本。设置副本的原理是提高系统的容错性，当某个分区所在的Broker节点故障时，副本可以替代其继续提供服务。例如，设置2个副本，一个主副本和一个从副本，主副本故障时，从副本可成为新的主副本。
副本放置策略：Kafka会尽量将副本分散到不同的Broker节点上。这样设计是为了防止某个Broker节点故障导致所有副本丢失，提高系统的可靠性。例如，有3个Broker节点，一个分区的主副本在Broker1，从副本1在Broker2，从副本2在Broker3，当Broker1故障时，Broker2或Broker3上的副本可继续提供服务。
ISR（In - Sync Replicas）机制：Kafka通过ISR机制来保证数据一致性。只有在ISR中的副本才被认为是与主副本同步的。主副本接收到消息后，会等待ISR中的所有副本都确认收到消息后才向生产者确认消息已成功发送。如果某个副本长时间未与主副本同步，会被移出ISR。这种机制确保了只有同步的副本才有资格成为新的主副本，从而保证数据一致性。

星途面试题库