面试题：MongoDB在分布式环境下类似where性能调优及最佳实践

分片键选择：
- 选择能均匀分布数据且与查询相关的字段作为分片键。例如，如果查询经常涉及某个特定业务字段（如订单的地区字段），可考虑将其作为分片键或分片键的一部分，这样能确保查询涉及的数据均匀分布在各个分片上，减少单个分片的负载压力。
- 避免选择单调递增的字段（如时间戳、自增ID等）作为单一分片键，因为这会导致数据倾斜，使大部分写操作集中在一个分片上。
副本集配置：
- 合理设置副本集成员数量，一般推荐奇数个成员（如3个或5个），以保证选举机制正常工作。对于读多写少的场景，可以增加副本集的从节点数量，并配置从节点用于读取操作，分担主节点的读压力。
- 配置优先级不同的副本集成员，将性能较好的节点设置为高优先级主节点候选，确保主节点具有较好的性能。

复合索引创建：
- 根据查询条件中的字段组合创建复合索引。例如，如果查询条件为 where field1 = value1 and field2 = value2，创建复合索引 {field1: 1, field2: 1}。索引字段的顺序很重要，应按照查询条件中字段的选择性从高到低排列，即选择性高（区分度大）的字段在前。
- 避免创建过多冗余索引，因为每个索引都会占用额外的存储空间并影响写操作性能。定期检查索引使用情况，删除未使用的索引。
覆盖索引：
- 尽量使用覆盖索引，即索引包含查询所需的所有字段。这样查询时无需回表操作，直接从索引中获取数据，能大大提高查询性能。例如，查询语句为 find({field1: value1}, {field2: 1, field3: 1, _id: 0})，可创建索引 {field1: 1, field2: 1, field3: 1}，此索引可覆盖查询。

查询优化器参数调整：
- 在MongoDB配置文件中，可以调整 queryPlanner 相关参数。例如，maxTimeMS 参数可以设置查询的最长执行时间，避免长时间运行的查询占用过多资源。如果查询超时频繁发生，可以适当增加该值，但要注意不要设置过大导致其他查询等待时间过长。
- 对于复杂查询，可以启用 allowDiskUse 选项（默认关闭），允许查询使用磁盘空间进行排序等操作，但要谨慎使用，因为这可能会导致性能问题，尤其是在磁盘I/O繁忙的情况下。
查询提示（Hints）使用：
- 在查询语句中使用查询提示，强制MongoDB使用特定的索引。例如，db.collection.find({field1: value1, field2: value2}).hint({field1: 1, field2: 1})，通过 hint 明确指定使用的索引，可避免查询优化器选择错误的执行计划。

数据倾斜：
- 挑战：数据在分片上分布不均匀，导致部分分片负载过高，而其他分片负载较低，影响整体查询性能。
- 应对方案：重新评估分片键选择，选择更均匀分布数据的字段作为分片键。如果数据已经倾斜，可以使用MongoDB的平衡器工具（sh.status() 查看平衡器状态，sh.startBalancer() 启动平衡器），将数据从负载高的分片移动到负载低的分片。
跨分片查询性能问题：
- 挑战：跨分片查询需要在多个分片上执行查询并合并结果，网络开销大，可能导致查询性能下降。
- 应对方案：优化查询条件，尽量减少跨分片查询的数据量。例如，通过索引筛选出少量数据再进行跨分片操作。同时，合理配置网络拓扑，减少分片之间的网络延迟，如使用高速网络连接和优化网络路由。
索引维护成本：
- 挑战：创建和维护大量索引会增加存储开销和写操作性能损耗。
- 应对方案：定期评估索引使用情况，删除未使用的索引。对于写操作频繁的场景，可以考虑在业务低峰期进行索引维护操作，减少对正常业务的影响。同时，尽量创建必要的最小化索引，避免创建冗余索引。

知识考点