面试题：消息队列 Kafka在微服务高并发场景下的性能优化策略

合理分区数量：根据预估的吞吐量和服务器资源来确定。若分区过少，可能导致单个分区负载过高，无法充分利用多核CPU等资源；若分区过多，会增加管理开销（如文件句柄数增加、网络请求数增多等）。可以通过测试不同分区数量下的性能表现，选择最优值。
分区分配策略：
- 轮询策略：简单地将消息轮询分配到各个分区，能平均分配负载，但可能导致数据局部性差。
- 按Key分配：对消息的Key进行哈希计算，将相同Key的消息发送到同一个分区，有利于保证特定业务数据的顺序性和局部性。例如在订单处理场景中，按订单ID作为Key分配，可确保同一订单的消息在同一分区，便于顺序处理。
数据分布优化：确保数据在各个分区上均匀分布，避免出现数据倾斜。可以通过合理设计Key，如对一些热门Key进行打散处理，避免大量消息集中在少数分区。

批量发送：设置batch.size参数，生产者会将多条消息攒成一批再发送，减少网络请求次数，提高吞吐量。但batch.size不宜设置过大，否则会增加消息发送延迟。需根据业务场景平衡吞吐量和延迟要求，进行调优。
异步发送：使用Future模式或回调函数实现异步发送，生产者发送消息后无需等待响应即可继续发送下一条消息，提高发送效率。例如使用producer.send(record, new Callback() {...})进行异步发送并设置回调处理发送结果。
压缩算法：启用消息压缩，如选择Snappy、Gzip或LZ4等压缩算法，设置compression.type参数。压缩可以减少网络传输的数据量，提高传输效率，但会增加生产者和消费者的CPU开销，需根据服务器资源情况选择合适的压缩算法。
重试机制：合理设置retries和retry.backoff.ms参数。当发送消息失败时，生产者可以自动重试，retries指定最大重试次数，retry.backoff.ms指定重试间隔时间。避免因短暂的网络波动等问题导致消息发送失败。

多线程消费：使用多个消费者线程同时消费不同分区的数据，充分利用多核CPU资源，提高消费速度。可以通过KafkaConsumer的subscribe方法订阅主题，并在应用层创建多个线程来处理不同分区的数据。
批量拉取：设置fetch.max.bytes参数，消费者一次从Kafka拉取的最大数据量。适当增大该值，可以减少拉取次数，提高消费效率，但可能会占用更多内存。需根据消费者所在服务器的内存情况进行调整。
自动提交与手动提交：
- 自动提交：设置enable.auto.commit为true，消费者会定期自动提交偏移量。优点是简单，缺点是可能会导致重复消费（如在自动提交后但还未处理完消息时消费者故障重启）。
- 手动提交：设置enable.auto.commit为false，由应用程序手动调用commitSync()或commitAsync()方法提交偏移量。手动提交可以更精确地控制消息处理的一致性，但增加了编程复杂度。
消费组管理：合理规划消费组数量和每个消费组内的消费者数量。每个消费组内的消费者会均衡分配分区进行消费，消费组数量应根据业务需求和数据处理并行度来确定。避免过多消费组导致资源浪费，或过少消费组无法充分利用并行处理能力。

星途面试题库