面试题：ElasticSearch高并发环境下可选参数的极致优化与应用

优化思路：适当增大refresh_interval的值。默认情况下，Elasticsearch 每 1 秒自动刷新一次，在高并发读写场景下，频繁刷新会带来较大开销。将其设为 30 秒或 1 分钟等更大的值，可减少刷新频率，提升写性能。
原理：Elasticsearch 的写入操作先进入内存缓冲区，达到refresh_interval时间或缓冲区满时，数据会被刷新到文件系统缓存，形成新的段。减少刷新频率可减少 I/O 操作和段合并次数，提升整体性能。但这会导致数据可见性延迟增加。
验证方案：通过监控写入性能指标，如每秒写入文档数、写入延迟等。对比不同refresh_interval值下的性能指标，选择性能最优且数据可见性延迟在可接受范围内的值。同时，观察段合并的频率和开销，确保系统资源利用合理。

优化思路：
- 合理选择自定义路由字段。根据业务场景，选择具有相似查询模式或高关联度的数据字段作为路由字段。例如在电商场景中，以店铺 ID 作为路由字段，将同一店铺的商品数据路由到相同分片，提高查询效率。
- 均匀分布数据。避免路由字段值的分布过于集中，导致数据倾斜。可通过分析数据分布情况，对路由算法进行调整或预处理数据，确保数据在各个分片上均匀分布。
原理：routing决定文档被存储到哪个分片。通过自定义路由，可将相关数据集中存储，减少跨分片查询开销。均匀分布数据能避免部分分片负载过高，保证集群整体性能。
验证方案：使用 Elasticsearch 提供的 API 查看每个分片的文档数量，确保数据均匀分布。在高并发查询场景下，对比使用不同路由策略时的查询响应时间和吞吐量，验证优化效果。同时，监控集群各节点的资源使用情况，确保无数据倾斜导致的性能瓶颈。

优化思路：
- 合理规划分片数量。根据数据量增长趋势、节点数量和硬件资源，预先规划合适的分片数量。在初期数据量较小时，不宜设置过多分片，避免过多的分片管理开销。随着数据量增加，可动态调整分片数量。
- 平衡分片负载。通过 Elasticsearch 的自动分片分配机制或手动干预，确保每个分片的负载均衡。对于热点分片，可考虑将其数据迁移或拆分。
原理：分片是 Elasticsearch 数据分布和并行处理的基础。合适的分片数量可充分利用集群资源，提高并发处理能力。负载均衡的分片能避免部分分片成为性能瓶颈，保证系统稳定性。
验证方案：监控每个分片的读写负载、CPU 和内存使用情况。使用 Elasticsearch 的监控工具查看分片的状态和性能指标，分析是否存在负载不均衡的情况。通过模拟高并发读写场景，观察不同分片配置下的系统性能，验证分片优化的效果。同时，定期评估数据增长情况，确保分片数量始终满足业务需求。

知识考点