面试题：容器化 - Kubernetes调度与优化

基于资源特性的优先级调度：
- 计算密集型任务通常对CPU资源需求高。在调度算法中，为节点的CPU性能设置权重，例如，性能高的CPU权重设为2，性能一般的设为1。当任务提交时，根据任务对CPU的需求和节点CPU权重来计算任务在各节点上的优先级得分。
- 同时考虑内存需求，避免将内存需求大的计算密集型任务调度到内存小的节点上。可以为内存设置类似的权重，结合CPU权重综合计算优先级。
公平共享调度：
- 采用公平共享调度算法，确保每个计算密集型任务能获得相对公平的资源份额。根据集群中计算密集型任务的总数，动态分配每个任务的资源配额。例如，如果集群中有10个计算密集型任务，每个任务理论上能获得1/10的可用CPU资源（在满足其最小需求的前提下）。
预留资源调度：
- 为计算密集型任务预留一定比例的节点资源，比如在每个节点上预留30%的CPU资源和相应比例的内存资源。这样可以保证即使在集群负载较高时，计算密集型任务也能有足够资源运行。

指标采集：
- 使用Prometheus等工具采集节点和任务的资源使用指标，如CPU使用率、内存使用率、任务的实时计算负载等。对于节点，定期（如每30秒）采集CPU的利用率、平均负载、空闲内存大小等；对于任务，采集其实际使用的CPU核心数、内存量等。
异常检测：
- 设定资源使用的阈值，例如当CPU使用率超过80%或者内存使用率超过90%时视为异常。当检测到异常时，向监控系统发送警报。同时，分析任务的资源使用趋势，如CPU使用率持续上升且接近阈值，提前预警可能出现的性能问题。
反馈机制：
- 将采集到的资源使用数据反馈给调度器。如果某个节点上计算密集型任务的CPU使用率过高，调度器可以调整后续任务的调度策略，避免将更多计算密集型任务调度到该节点。例如，降低该节点在调度算法中的优先级得分。

自动扩缩容：
- 基于资源监控数据，使用Kubernetes的HPA（Horizontal Pod Autoscaler）和VPA（Vertical Pod Autoscaler）机制。对于计算密集型任务的Pod，如果其CPU使用率持续超过设定阈值（如80%），HPA自动增加Pod的副本数；如果CPU使用率持续低于一定阈值（如30%），则减少Pod副本数。
- VPA根据任务实际资源使用情况，动态调整Pod的资源请求和限制。例如，如果一个计算密集型任务长期使用的CPU资源低于其请求值，可以适当降低请求值，以便将释放的资源分配给其他任务。
节点资源调整：
- 如果发现某些类型的节点资源长期处于紧张状态，比如高性能CPU节点资源不足，可以考虑增加此类节点的数量。或者，当发现某些节点资源利用率过低时，可以将其上的任务迁移到其他节点，然后将该节点从集群中移除（如果是云环境中的弹性节点）。
任务重调度：
- 当某个计算密集型任务出现性能问题（如由于资源不足导致计算速度大幅下降），调度器可以将其从当前节点重调度到资源更合适的节点上。同时，在重调度过程中，考虑任务的亲和性和反亲和性规则，避免对其他相关任务造成影响。

星途面试题库