MST

星途 面试题库

面试题:消息队列之RocketMQ架构监控指标

在RocketMQ架构的监控体系构建中,你认为有哪些关键的监控指标需要关注,并且简要说明每个指标对于系统运维的意义。
36.8万 热度难度
后端开发消息队列

知识考点

AI 面试

面试题答案

一键面试

消息发送相关指标

  1. 消息发送成功率
    • 意义:反映生产者能否成功将消息发送到Broker。成功率低可能暗示网络问题、Broker负载过高或配置错误,影响业务数据的正常流转。
  2. 消息发送时延
    • 意义:体现消息从生产者发出到被Broker接收的时间。时延过长可能导致业务处理延迟,影响用户体验,也可能提示网络拥塞或生产者性能瓶颈。
  3. 消息发送TPS(Transaction Per Second)
    • 意义:展示单位时间内生产者发送消息的数量。该指标可帮助评估系统在不同时段的生产压力,为容量规划和资源调配提供依据。

消息接收相关指标

  1. 消息消费成功率
    • 意义:表明消费者从Broker拉取消息并成功处理的比例。成功率低可能意味着消费者代码存在问题、消息格式错误或依赖的外部服务不稳定,影响业务逻辑的正确执行。
  2. 消息消费时延
    • 意义:指消息从被消费者拉取到处理完成的时间。时延过大可能导致消息堆积,影响系统处理效率,可帮助定位消费端性能瓶颈。
  3. 消息消费TPS
    • 意义:显示单位时间内消费者处理消息的数量。用于衡量消费端处理能力,判断是否能满足业务实时性需求,指导消费端资源扩展。

Broker相关指标

  1. Broker负载
    • 意义:包括CPU、内存、磁盘I/O等负载情况。负载过高可能影响消息的接收、存储和转发,是判断Broker健康状态和是否需要扩容的重要依据。
  2. 消息堆积量
    • 意义:即Broker中未被消费的消息数量。堆积量持续增加可能预示消费端处理能力不足,影响系统稳定性和数据一致性,需及时排查原因并处理。
  3. 磁盘使用率
    • 意义:RocketMQ依靠磁盘存储消息,磁盘使用率过高可能导致消息写入失败,影响数据可靠性,需提前规划存储资源。

集群相关指标

  1. 节点存活状态
    • 意义:监控每个Broker节点是否正常运行。节点宕机可能导致部分消息无法接收或消费,影响整个集群的可用性,需及时发现并恢复。
  2. 集群同步状态
    • 意义:对于主从架构,同步状态反映主从节点之间数据同步的及时性和准确性。同步异常可能造成数据丢失或不一致,影响系统数据完整性。