面试题：ElasticSearch集群状态优化之动态调整

实时监控ElasticSearch集群状态

使用Elasticsearch API：
- 通过/_cat/health?v API获取集群健康状态，包括状态（green、yellow、red）、节点数、文档数等基础信息。例如在命令行使用curl -X GET "localhost:9200/_cat/health?v"。
- /_cluster/stats API可获取更详细的集群统计信息，如索引数量、存储大小、内存使用等，用于全面了解集群运行状况。
监控工具：
- Kibana：它与Elasticsearch深度集成，通过可视化界面展示集群健康、节点状态、索引性能等指标。可以创建自定义仪表盘，实时观察关键指标变化。
- Prometheus + Grafana：Prometheus可通过Elasticsearch Exporter采集集群指标，如CPU使用率、内存使用率、磁盘I/O等。Grafana用于将采集到的数据进行可视化展示，构建丰富的监控图表。

动态调整分片数量

分片数量评估：
- 数据量增长趋势：如果监控到数据量持续快速增长，预估未来一段时间内数据量会超过当前分片承载能力（一般每个分片建议不超过50GB数据），考虑增加分片数量。例如，当前集群数据量每月增长100GB，而每个分片已使用30GB，就需要提前规划增加分片。
- 查询性能：当发现某些复杂查询（如跨索引聚合）响应时间变长，且通过分析发现是因为单个分片数据量过大导致时，可适当增加分片数量。
调整方法：
- 新建索引并重新分配数据：对于新数据，直接在创建索引时设置合适的分片数量。对于已有数据，可使用reindex API将数据从旧索引迁移到新索引，同时设置新索引的分片数量。例如：

POST _reindex
{
    "source": {
        "index": "old_index"
    },
    "dest": {
        "index": "new_index",
        "settings": {
            "number_of_shards": 10
        }
    }
}

使用_split API（针对特定场景）：在Elasticsearch 7.0及以上版本，对于已有的索引分片，可以使用_split API将一个大的分片拆分成多个较小的分片。但这种方法可能会对集群性能有一定影响，需谨慎使用。

动态调整副本数量

副本数量评估：
- 高可用性需求：如果业务对数据可用性要求极高，在监控到节点故障频繁或计划进行节点维护时，适当增加副本数量。例如，在某地区网络不稳定，经常出现节点短暂失联的情况下，可将副本数从1增加到2或3。
- 资源负载：当监控到集群资源（如CPU、内存、网络带宽）利用率过高，且发现副本数据传输和同步占用大量资源时，可适当减少副本数量。
调整方法：
- 使用/_settings API：通过该API可动态调整索引的副本数量。例如，将my_index索引的副本数从2调整为1：

PUT my_index/_settings
{
    "index": {
        "number_of_replicas": 1
    }
}

动态调整节点资源分配

资源监控与分析：
- CPU：通过监控工具获取每个节点的CPU使用率。如果某个节点CPU使用率长期超过80%，可能需要增加该节点的CPU资源（如在云环境中调整实例规格）或迁移部分分片到其他节点。
- 内存：Elasticsearch对堆内存有严格要求。监控堆内存使用率，如果接近设定的最大值且频繁发生垃圾回收，考虑增加堆内存大小或优化查询减少内存使用。同时，也要关注节点的操作系统内存使用情况，避免系统内存不足导致节点不稳定。
- 磁盘：监控磁盘使用率和I/O性能。若磁盘使用率超过90%，需及时清理无用数据或增加磁盘空间。如果I/O性能低下（如磁盘读写速度慢），可考虑更换高性能磁盘（如SSD）或优化索引存储策略。
资源调整方法：
- 节点配置调整：在云环境中，可直接调整节点实例规格，增加CPU、内存等资源。在物理机环境中，可能需要进行硬件升级。
- 分片迁移：使用/_cluster/reroute API手动迁移分片，将负载过高节点上的分片迁移到负载较低的节点，以平衡集群资源。例如：

POST _cluster/reroute
{
    "commands": [
        {
            "move": {
                "index": "my_index",
                "shard": 0,
                "from_node": "node1",
                "to_node": "node2"
            }
        }
    ]
}

同时，结合Elasticsearch的自动分片分配策略（如基于节点磁盘使用率的分配），合理配置相关参数，让集群在运行过程中自动优化分片分布，确保资源分配合理。

面试题：ElasticSearch集群状态优化之动态调整

知识考点

面试题答案

实时监控ElasticSearch集群状态

动态调整分片数量

动态调整副本数量

动态调整节点资源分配