MST

星途 面试题库

面试题:容器化 - Kubernetes集群监控指标的选择与应用

在Kubernetes集群监控中,通常会关注哪些核心指标来衡量集群的健康状况和性能?请列举至少5个,并简要说明每个指标的作用以及在何种场景下它们的变化需要引起特别关注。
39.6万 热度难度
后端开发容器化

知识考点

AI 面试

面试题答案

一键面试
  1. CPU使用率
    • 作用:反映节点或Pod对CPU资源的消耗程度,可衡量计算资源的利用效率。
    • 关注场景:当CPU使用率持续超过80% - 90%,可能导致应用程序响应变慢,需要考虑扩容或优化应用代码。
  2. 内存使用率
    • 作用:展示节点或Pod对内存资源的占用情况,确保有足够内存供应用正常运行。
    • 关注场景:若内存使用率接近100%,可能出现内存溢出,应用程序崩溃,需排查内存泄漏或增加内存资源。
  3. 磁盘I/O使用率
    • 作用:体现节点磁盘的读写负载,影响应用数据的存储和读取速度。
    • 关注场景:读写速率过高,如超过磁盘性能上限,会导致应用数据读写延迟,可能需要优化存储配置或更换高性能磁盘。
  4. 网络带宽使用率
    • 作用:表明集群内外部网络的数据传输能力,影响应用的网络通信效率。
    • 关注场景:当带宽使用率接近上限,会出现网络拥堵,应用间通信延迟增大,需升级网络带宽。
  5. Pod状态
    • 作用:反映Pod的运行情况,如Running(运行中)、Pending(等待调度)、Failed(失败)等,用于判断应用是否正常运行。
    • 关注场景:若Pod长时间处于Pending状态,可能是资源不足或调度策略问题;处于Failed状态则需排查容器内部错误。
  6. 节点状态
    • 作用:展示节点的健康状况,如Ready(就绪)、NotReady(未就绪),确保集群计算资源的可用性。
    • 关注场景:节点变为NotReady,会影响其上运行的Pod,需检查节点硬件、网络、kubelet服务等是否正常。
  7. 集群资源利用率
    • 作用:综合衡量集群整体CPU、内存、存储等资源的使用程度,帮助规划资源扩容或优化分配。
    • 关注场景:资源利用率长期处于高位,接近资源总量,预示着集群资源紧张,需考虑增加节点或优化资源分配。