面试题答案
一键面试- CPU使用率
- 作用:反映节点或Pod对CPU资源的消耗程度,可衡量计算资源的利用效率。
- 关注场景:当CPU使用率持续超过80% - 90%,可能导致应用程序响应变慢,需要考虑扩容或优化应用代码。
- 内存使用率
- 作用:展示节点或Pod对内存资源的占用情况,确保有足够内存供应用正常运行。
- 关注场景:若内存使用率接近100%,可能出现内存溢出,应用程序崩溃,需排查内存泄漏或增加内存资源。
- 磁盘I/O使用率
- 作用:体现节点磁盘的读写负载,影响应用数据的存储和读取速度。
- 关注场景:读写速率过高,如超过磁盘性能上限,会导致应用数据读写延迟,可能需要优化存储配置或更换高性能磁盘。
- 网络带宽使用率
- 作用:表明集群内外部网络的数据传输能力,影响应用的网络通信效率。
- 关注场景:当带宽使用率接近上限,会出现网络拥堵,应用间通信延迟增大,需升级网络带宽。
- Pod状态
- 作用:反映Pod的运行情况,如Running(运行中)、Pending(等待调度)、Failed(失败)等,用于判断应用是否正常运行。
- 关注场景:若Pod长时间处于Pending状态,可能是资源不足或调度策略问题;处于Failed状态则需排查容器内部错误。
- 节点状态
- 作用:展示节点的健康状况,如Ready(就绪)、NotReady(未就绪),确保集群计算资源的可用性。
- 关注场景:节点变为NotReady,会影响其上运行的Pod,需检查节点硬件、网络、kubelet服务等是否正常。
- 集群资源利用率
- 作用:综合衡量集群整体CPU、内存、存储等资源的使用程度,帮助规划资源扩容或优化分配。
- 关注场景:资源利用率长期处于高位,接近资源总量,预示着集群资源紧张,需考虑增加节点或优化资源分配。