MST

星途 面试题库

面试题:消息队列之RocketMQ集群监控基础指标

在RocketMQ集群监控中,通常需要关注哪些关键指标来确保消息的正常收发和集群的稳定运行?请至少列举5个,并简要说明每个指标的作用。
40.1万 热度难度
后端开发消息队列

知识考点

AI 面试

面试题答案

一键面试
  1. 消息发送成功率
    • 作用:反映生产者向RocketMQ集群发送消息的成功比例。若发送成功率低,可能是网络问题、生产者配置错误或集群负载过高,影响消息的正常发送。
  2. 消息消费成功率
    • 作用:体现消费者从RocketMQ集群拉取消息并成功处理的比例。消费成功率低可能意味着消费者代码存在逻辑错误、依赖服务不可用等,导致消息不能被正常处理。
  3. 消息堆积量
    • 作用:表示在某个Topic或队列中未被消费的消息数量。消息堆积量持续增长可能表明消费端处理能力不足,会影响消息的实时性,严重时可能导致集群性能问题。
  4. Broker负载
    • 作用:包含CPU使用率、内存使用率、磁盘I/O等指标。负载过高可能导致Broker处理消息的能力下降,影响集群的整体性能和稳定性。
  5. TPS(Transaction Per Second)
    • 作用:指每秒处理的事务数,这里主要是消息处理事务数。TPS反映了集群整体的消息处理能力,TPS的变化可以帮助判断集群是否能满足业务的消息处理需求。
  6. 网络延迟
    • 作用:包括生产者与Broker之间、Broker与消费者之间的网络延迟。网络延迟过高会影响消息的发送和消费速度,甚至导致消息传输失败。
  7. Topic的吞吐量
    • 作用:衡量某个Topic在单位时间内能够处理的消息数量,反映了该Topic的业务承载能力,可帮助评估业务增长对集群的影响。