面试题：ElasticSearch 批量操作性能调优之复杂场景

1. ElasticSearch 自身配置优化

索引设置：
- 分片数量：适当减少分片数量。海量文档环境下，过多分片会增加集群管理负担及写入时的资源消耗。根据数据量和节点数，通过测试找到一个较优的分片数，例如对于中小规模集群（10 - 50 个节点），每个索引的分片数可控制在 5 - 10 个。
- 副本数量：在批量插入时，可暂时降低副本数量，如设为 0。副本主要用于数据冗余和高可用，但在写入时会增加额外开销。插入完成后，再将副本数量调整到合适值，如 1 - 2 个。
线程池：
- bulk 线程池：调大 bulk 线程池的大小。可通过修改 elasticsearch.yml 文件中的 thread_pool.bulk.size 参数，根据节点的 CPU 核心数进行设置，一般可设为 CPU 核心数的 2 - 3 倍。例如，8 核 CPU 的节点，可设置 thread_pool.bulk.size: 16 - 24。
- 写入线程池：同样调大写入线程池相关参数，如 thread_pool.write.size，优化写入性能。
内存设置：
- 堆内存：合理分配 ElasticSearch 的堆内存。一般遵循堆内存不超过物理内存的 50%，且不超过 32GB 的原则。例如，在 64GB 物理内存的节点上，堆内存可设置为 30GB。通过 ES_HEAP_SIZE 环境变量进行设置。
- 字段数据缓存：适当调整字段数据缓存大小，indices.fielddata.cache.size 参数可设置为堆内存的一定比例，如 20% - 30%，避免因缓存不足导致频繁磁盘 I/O。
刷新和合并策略：
- 刷新间隔：增大 index.refresh_interval，批量插入时可设为 30s 或更大，减少刷新频率，降低 I/O 开销。插入完成后再恢复默认值 1s。
- 合并策略：调整 index.merge.policy 相关参数，如 max_merge_at_once（一次合并的最大段数）、max_merge_at_once_explicit（显式合并的最大段数）等，优化段合并过程，减少磁盘 I/O 和 CPU 消耗。

2. 操作流程优化

批量大小：调整批量插入的文档数量。通过测试确定最佳批量大小，一般在 1000 - 5000 个文档之间。如果批量大小过小，会增加网络请求次数；过大则可能导致内存溢出或其他性能问题。
数据预处理：在插入前对数据进行必要的处理，如压缩、去除不必要的字段等，减少数据传输量和索引大小。
异步操作：采用异步批量插入方式，利用 ElasticSearch 的异步 API，避免阻塞主线程，提高整体处理效率。
顺序插入：尽量按一定顺序插入文档，如按时间顺序或 ID 顺序，有助于减少段的碎片化，提高合并效率。

面试题：ElasticSearch 批量操作性能调优之复杂场景

知识考点

面试题答案

1. ElasticSearch 自身配置优化

2. 操作流程优化