面试题答案
一键面试主要参数
- 副本因子(Replica Factor):表示每个主分片拥有的副本分片数量。
- 分片数量(Number of Shards):定义索引被拆分成的主分片个数。
- 刷新间隔(Refresh Interval):控制索引数据多久被刷新到磁盘,从而可被搜索。
- 合并策略相关参数:例如
index.merge.policy.floor_segment
等,影响段合并的时机和方式。
参数调整场景
- 副本因子调整场景
- 高可用性需求变化:当对系统可用性要求提升,比如应对可能的硬件故障或网络分区,会增加副本因子;若资源紧张且对可用性要求降低时,可减少副本因子。
- 负载均衡:在集群节点负载不均衡时,通过调整副本因子来重新分配负载。
- 分片数量调整场景
- 数据量变化:数据量持续增长,原分片数量不足以有效处理时,需增加分片;若数据量大幅减少,可适当减少分片以优化资源利用。
- 查询性能:复杂查询性能不佳,发现是因为分片数不合理导致时,进行相应调整。
- 刷新间隔调整场景
- 实时性要求:对搜索实时性要求高,需缩短刷新间隔;若对实时性要求低,可延长刷新间隔以减少 I/O 开销。
- 合并策略参数调整场景
- 存储资源与性能平衡:磁盘空间紧张时,调整合并策略参数加快段合并,减少磁盘占用;但合并过于频繁影响性能时,适当调整参数降低合并频率。