面试题：ElasticSearch 近实时搜索在高并发场景下的性能调优

性能调优方面

集群拓扑结构
- 节点类型规划：根据功能划分不同类型节点，如 master 节点负责集群管理，应配置较低的资源，避免繁重的计算任务；data 节点负责存储和处理数据，需配备高性能的 CPU、大容量内存和高速磁盘；coordinating 节点负责接收客户端请求并分发，需具备高网络带宽。
- 节点数量：依据数据量和流量估算合理的节点数量。过少节点会导致资源瓶颈，过多则增加集群管理成本和网络开销。可通过前期测试和模拟流量，结合经验公式来确定。
副本和分片设置
- 分片：根据数据量和查询负载确定合适的分片数。分片数过多会增加管理开销和搜索时的合并成本，过少则可能导致单个分片数据量过大影响性能。一般可按照每分片 15 - 50GB 数据量估算初始值，之后根据实际情况调整。
- 副本：副本数增加可提高可用性，但会增加写入开销和占用更多存储。对于读多写少的场景，可适当增加副本数；写多读少的场景则减少副本。通常设置 1 - 2 个副本较为常见。
硬件资源分配
- CPU：确保 data 节点有足够的 CPU 核心来处理数据索引和搜索计算。可根据节点上分片数量和预计的并发请求数估算所需 CPU 资源，一般每个分片需要一定比例的 CPU 资源。
- 内存：Elasticsearch 会大量使用内存作为文件系统缓存，以加速数据读取。建议为每个节点分配物理内存的 50% - 70%给 Elasticsearch，且堆内存不要超过 32GB，避免内存交换影响性能。
- 磁盘：采用高速的 SSD 磁盘，减少 I/O 延迟。对于大规模数据存储，可考虑使用分布式文件系统，同时保证磁盘 I/O 带宽满足数据写入和读取需求。
查询优化
- 查询语句优化：避免使用通配符查询（如 term），尽量使用精确查询或前缀查询。使用 filter 代替 query 进行过滤操作，filter 结果会被缓存以提高后续查询效率。
- 聚合优化：减少聚合操作的层级和复杂度，避免在大规模数据集上进行深度嵌套的聚合。可采用部分聚合、预聚合等技术，降低计算量。
- 缓存机制：启用 Elasticsearch 的查询缓存，对频繁查询的结果进行缓存。可通过设置合适的缓存大小和过期时间来平衡内存使用和缓存命中率。

平衡数据一致性、可用性和性能的策略及依据

数据一致性
- 策略：在写入操作时，通过设置 consistency 参数来控制数据一致性。如设置为 quorum，表示只有当大多数副本分片成功写入后，写入操作才视为成功。对于对一致性要求极高的业务，可选择 all，但这会降低写入性能。
- 依据：保证数据在不同副本之间的一致性，防止数据丢失或不一致。但过高的一致性要求会增加写入等待时间，影响性能。
可用性
- 策略：增加副本数量，提高系统的容错能力。同时，合理设置故障检测和自动恢复机制，确保在节点故障时能快速恢复服务。例如，通过设置适当的 discovery.zen.minimum_master_nodes 参数，防止脑裂问题，保障集群可用性。
- 依据：副本数量增加可在节点故障时仍能提供数据服务，故障检测和恢复机制能快速恢复集群正常运行，保障业务的连续性。
性能
- 策略：从上述集群拓扑、副本分片、硬件资源和查询优化等方面进行调整，提升系统的整体性能。如合理设置分片和副本，优化查询语句，充分利用硬件资源等。
- 依据：通过这些优化措施，减少系统的响应时间，提高吞吐量，满足高并发搜索请求的性能需求。在平衡时，需根据业务特点进行权衡。例如，对于实时性要求高但一致性要求相对较低的业务场景，可适当降低一致性要求以提高性能；对于对数据准确性要求极高的业务，则优先保证数据一致性。

面试题：ElasticSearch 近实时搜索在高并发场景下的性能调优

知识考点

面试题答案

性能调优方面

平衡数据一致性、可用性和性能的策略及依据