面试题：后端开发容器化中，容器编排技术应对人工智能工作负载动态变化的策略

检测动态变化

指标收集
- 监控工具：使用如 Prometheus 等监控工具，收集容器的各项指标，例如 CPU 使用率、内存使用率、网络流量等。Prometheus 通过定义的抓取任务定期从容器暴露的指标端点获取数据。
- 自定义指标：对于人工智能工作负载，还可定义特定指标，如模型推理延迟、每秒处理请求数等。应用程序可通过库（如 OpenTelemetry）将这些自定义指标发送到监控系统。
数据分析
- 阈值设定：在监控系统（如 Grafana 结合 Prometheus）中设定指标阈值。例如，当 CPU 使用率连续 5 分钟超过 80%，或模型推理延迟超过 100 毫秒时，视为需要调整工作负载。
- 趋势分析：利用时间序列分析技术，分析指标随时间的变化趋势。例如，预测业务高峰时段的到来，提前调整资源，避免性能问题。

应对动态变化

自动伸缩机制
- 水平自动伸缩（HPA - Horizontal Pod Autoscaler）：
  - 原理：以 Kubernetes 为例，HPA 根据监控到的 CPU 使用率或其他自定义指标，自动调整 Deployment 或 ReplicaSet 中的 Pod 数量。例如，当请求量增加导致 CPU 使用率上升超过阈值，HPA 会创建新的 Pod 来处理负载；当请求量减少，CPU 使用率下降，HPA 会删除多余的 Pod。
  - 关键组件：
    - Metrics Server：负责从 Kubernetes 节点和 Pod 收集资源使用指标，为 HPA 提供数据支持。
    - Controller Manager：其中包含 HPA Controller，根据 Metrics Server 提供的数据和用户定义的伸缩策略，执行 Pod 的创建或删除操作。
- 垂直自动伸缩（VPA - Vertical Pod Autoscaler）：
  - 原理：根据容器实际的资源使用情况，动态调整容器的资源请求（如 CPU 和内存）。例如，当发现某个容器长期使用的 CPU 资源远低于请求值，VPA 会降低该容器的 CPU 请求，以便集群资源能更合理分配。
  - 关键组件：
    - VPA Admission Controller：在 Pod 创建或更新时，根据 VPA 的建议修改 Pod 的资源请求。
    - VPA Recommender：分析容器的历史资源使用数据，为 Pod 推荐合适的资源请求值。
服务发现与负载均衡
- 服务发现：
  - 原理：在容器编排系统（如 Kubernetes）中，每个服务都有一个唯一的 DNS 名称。当新的 Pod 被创建来处理增加的负载时，服务发现机制（如 CoreDNS）会自动更新 DNS 记录，使得其他服务能够通过 DNS 名称找到新的 Pod。
  - 关键组件：
    - CoreDNS：作为 Kubernetes 集群的默认 DNS 服务器，负责解析服务的 DNS 名称到对应的 Pod IP 地址。
- 负载均衡：
  - 原理：采用如 Kubernetes Service 的负载均衡机制，将外部流量均匀分配到多个 Pod 上。例如，ClusterIP 类型的 Service 用于在集群内部提供负载均衡，NodePort 和 LoadBalancer 类型的 Service 可将流量从集群外部引入并负载均衡到内部 Pod。
  - 关键组件：
    - kube - proxy：运行在每个 Kubernetes 节点上，负责实现基于 iptables 或 IPVS 的负载均衡规则，将流量转发到相应的 Pod。
    - Cloud Provider Load Balancer：如果在云环境中，云提供商（如 AWS、GCP 等）提供的负载均衡器（如 ELB、GCLB）可将外部流量分发到 Kubernetes 集群中的 Pod。

星途面试题库

面试题：后端开发容器化中，容器编排技术应对人工智能工作负载动态变化的策略

知识考点

面试题答案

检测动态变化

应对动态变化