面试题：消息队列 Kafka 在高并发电商订单实时处理系统下的性能调优与架构优化

Kafka 配置参数优化

Broker 配置
- 日志段大小（log.segment.bytes）：适当增大此参数，减少日志段切换频率，降低磁盘 I/O 开销。例如从默认的 1GB 调整为 2GB，但需注意如果设置过大，在清理或恢复日志时可能会增加处理时间。
- 刷盘策略（log.flush.interval.messages 和 log.flush.interval.ms）：根据业务场景调整，若对数据持久性要求极高且性能允许，可设置较小值，如 log.flush.interval.messages 设为 10000，log.flush.interval.ms 设为 5000，使消息更频繁刷盘；若追求高性能，可适当增大值，但可能增加数据丢失风险。
- 网络线程数（num.network.threads）：根据服务器 CPU 核心数及网络流量调整，一般设置为 CPU 核心数的 2 倍，例如 8 核 CPU 可设为 16，以提高网络数据处理能力。
- I/O 线程数（num.io.threads）：同样依据服务器配置，通常设置为 CPU 核心数的 8 倍左右，如 8 核 CPU 设为 64，加快磁盘 I/O 操作。
Topic 配置
- 分区数（num.partitions）：根据订单量及消费者并行度估算，一般原则是分区数大于消费者线程数，且分区数应充分利用集群资源。例如预估订单量每秒 10 万条，每个分区处理能力每秒 1 万条，则可设置分区数为 10 以上。但分区数过多会增加管理开销，需平衡。
- 副本因子（replication.factor）：在保证数据可靠性前提下，适当降低副本因子可提升性能。如原本为 3，在允许一定数据丢失风险场景下可设为 2，但要确保集群仍有足够容错能力。

集群架构优化

增加 Broker 节点：根据性能瓶颈情况，适时添加 Broker 节点扩充集群处理能力。新节点加入后，Kafka 会自动重新分配分区，提高整体吞吐量。
负载均衡：合理规划数据在各 Broker 间分布，避免数据倾斜。可通过 Kafka 自带的工具或第三方工具，如 Kafka-manager，定期检查并手动调整分区分布，确保各节点负载均匀。
采用多数据中心部署：对于高可用性要求极高场景，将 Kafka 集群部署在多个数据中心，通过跨数据中心复制机制，保证在一个数据中心故障时，系统仍能正常运行，同时可提升不同地域用户的访问性能。

生产者代码优化

批量发送：设置合适的 batch.size 参数，如 16KB，生产者会将多条消息批量发送，减少网络请求次数。同时配合 linger.ms 参数，如 5ms，等待一定时间以积累更多消息再发送，进一步提高批量发送效率，但注意设置过大可能增加消息延迟。
异步发送：使用生产者的异步发送接口，通过回调函数处理发送结果。这样生产者在发送消息后无需等待确认，可继续发送下一批消息，提高发送性能。
优化序列化：选择高效的序列化方式，如 Protobuf 替代默认的 Java 序列化，减少消息序列化后的大小，降低网络传输和存储开销。

消费者代码优化

多线程消费：根据 Topic 分区数创建多个消费者线程，每个线程负责消费一个或多个分区数据，提高消费并行度。但需注意线程安全问题，如共享资源访问控制。
优化消费逻辑：尽量减少消费逻辑中的复杂计算和 I/O 操作，如将复杂业务逻辑异步化处理或转移到其他系统。对于消息处理失败情况，合理设置重试机制，避免因个别消息处理失败影响整体消费进度。
合理设置偏移量提交策略：根据业务需求选择自动提交（enable.auto.commit=true）或手动提交（enable.auto.commit=false）。自动提交简单但可能导致重复消费；手动提交可精确控制消费位置，但需开发者确保在合适时机提交偏移量，避免数据丢失或重复消费。

星途面试题库

面试题：消息队列 Kafka 在高并发电商订单实时处理系统下的性能调优与架构优化

知识考点

面试题答案

Kafka 配置参数优化

集群架构优化

生产者代码优化

消费者代码优化