面试题：ElasticSearch索引自动化打开关闭与性能优化及资源调度

业务低峰期操作：分析业务流量模式，选择在业务活动最少的时间段（如深夜）打开或关闭索引。例如电商平台，凌晨1 - 5点通常用户访问量极低，此时进行索引操作可最大程度减少对正常业务查询的影响。
批量操作：将多个索引的打开或关闭操作合并为一次批量任务执行，减少频繁操作对集群的冲击。但要注意批量任务规模，避免一次操作过多索引导致资源耗尽。

内存预分配：在打开索引前，通过 Elasticsearch 的配置参数，为索引预分配足够的堆内存。例如，根据索引预计占用的文档数量和字段复杂度，计算并设置 indices.memory.index_buffer_size 参数，确保索引加载时有充足内存用于数据缓存和处理。
CPU资源预留：在服务器层面，利用容器化技术（如 Docker、Kubernetes）为 Elasticsearch 节点预留一定比例的 CPU 资源。比如，设置节点的 CPU 配额，确保在索引打开过程中，其他关键业务进程不会因 CPU 竞争而受影响。
I/O资源优化：对存储 Elasticsearch 数据的磁盘进行 I/O 调优，如使用高速 SSD 磁盘、配置合理的磁盘队列深度等。对于打开包含数十亿文档的索引，可提前清理磁盘空间，减少 I/O 等待时间。

节点负载感知：Elasticsearch 内置的负载均衡机制会根据节点的 CPU、内存、磁盘 I/O 等指标自动分配索引分片。在自动化操作时，结合这些指标，优先选择负载较低的节点进行索引打开或关闭操作。例如，通过 Elasticsearch 的 REST API 获取节点实时负载信息，根据 CPU 使用率、内存使用率等指标筛选出最佳节点。
分片均衡：在索引打开后，确保分片在集群节点间均匀分布。可使用 /_cluster/reroute API 手动调整分片分布，避免某些节点因承载过多分片而成为性能瓶颈。同时，定期检查分片均衡状态，通过监控指标如 cluster_routing_shards_pending 来判断是否需要进行手动干预。

CPU指标：监控 node_stats.cpu.percent 指标，若在索引打开过程中 CPU 使用率持续超过阈值（如 80%），则动态调整自动化策略，如暂停其他索引操作，或降低当前索引操作的并发度。
内存指标：关注 indices.memory.used 和 jvm.mem.heap.used_percent 指标，当内存使用率接近 Elasticsearch 节点的堆内存上限时，采取措施如增大堆内存、优化索引数据结构（如减少字段冗余）或暂停索引操作，待内存压力缓解后再继续。
I/O指标：通过 node_stats.fs.reads、node_stats.fs.writes 等指标监控磁盘 I/O 负载。若 I/O 队列深度过高或 I/O 响应时间过长，可适当降低索引打开速度，或优化存储配置（如增加磁盘数量、调整 RAID 级别）。
集群健康指标：监控 /_cluster/health 接口返回的状态，如 status 为 yellow 或 red，表示集群存在潜在问题。此时应暂停自动化索引操作，优先处理集群健康问题，如修复故障节点、重新分配分片等，待集群恢复 green 状态后再继续。

知识考点