面试题：MongoDB高并发增删改查下索引的深度优化

分析查询模式：
- 深入了解应用的查询模式，使用explain命令分析查询执行计划，确定哪些查询是高并发场景下频繁执行的。例如，对于电商应用中频繁的商品查询，可能按商品类别、价格范围等进行查询，根据这些查询特点创建合适的索引。
- 对于点查询（如按_id查询），确保_id索引存在且高效。
复合索引：
- 当多个字段经常一起用于查询时，创建复合索引。比如在一个日志系统中，经常按时间范围和日志级别查询，可创建{timestamp: 1, logLevel: 1}这样的复合索引，注意索引字段顺序按照查询条件的选择性从高到低排列。
- 避免过度创建复合索引，因为每个索引都会占用额外的存储空间和写入开销，权衡写入性能和查询性能。
部分索引：
- 对于只在数据子集上频繁查询的场景，创建部分索引。例如，在用户表中，只有高级用户的查询频繁，可创建只包含高级用户的部分索引{userType: 1, ...其他查询字段} where userType = '高级用户'，这样可以减少索引维护成本。
覆盖索引：
- 尽量使用覆盖索引，即查询的字段都包含在索引中，这样MongoDB无需回表操作就能返回结果。例如查询用户的姓名和邮箱，若创建{name: 1, email: 1}索引，并且查询语句只涉及这两个字段，就能利用覆盖索引提升查询性能。

分片键选择：
- 选择合适的分片键至关重要。对于高并发读写场景，分片键应具有良好的分布性，避免热点分片。例如，在社交网络应用中，以用户ID作为分片键可能导致某些热门用户所在分片负载过高，而以时间戳（如发布动态时间）结合用户ID作为复合分片键，可使数据更均匀分布。
- 考虑查询模式，确保分片键能够支持常见的查询。例如，经常按地区查询数据，可将地区字段作为分片键的一部分。
预分片：
- 在数据量还未达到大规模时，进行预分片，预先创建一定数量的分片，避免后期动态分片带来的性能开销。可以根据预估的数据增长情况，合理设置预分片数量。
平衡策略：
- 监控分片集群的负载情况，调整平衡器的参数。默认情况下，MongoDB的平衡器会自动在分片间迁移数据以平衡负载，但有时需要根据实际场景调整迁移的频率、数据量阈值等参数，防止过度迁移影响性能。

选举机制理解：
- 了解复制集的选举机制，合理设置成员数量和优先级。一般推荐奇数个成员，以避免脑裂问题。对于高并发场景，可将优先级较高的节点设置为性能较好的机器，确保主节点能够高效处理读写请求。
同步延迟处理：
- 监控从节点的同步延迟，通过调整网络配置、增加从节点资源等方式减少延迟。例如，确保从节点与主节点之间的网络带宽充足，避免网络拥塞导致同步延迟增大。
- 对于读操作，可以配置读偏好，根据应用对数据一致性的要求选择从节点读取数据。如对于实时性要求不高的报表查询，可设置读偏好为secondaryPreferred，从从节点读取数据，减轻主节点压力。

索引实践：
- 在开发环境中，使用测试数据模拟高并发查询场景，利用explain命令不断优化索引。例如，在一个在线商城项目中，开发人员模拟大量用户按商品分类和价格区间查询商品的场景，通过explain分析发现某个复合索引字段顺序不合理，调整后查询性能提升了30%。
- 定期在生产环境中使用db.collection.getIndexKeys()和db.collection.totalIndexSize()等命令检查索引的使用情况和大小，及时删除无用索引。
分片实践：
- 在项目初期规划时，根据业务特点选择好分片键。如在一个物联网数据收集系统中，根据设备ID和采集时间作为分片键，在部署时进行预分片，设置100个初始分片。
- 定期使用sh.status()命令监控分片集群状态，根据负载情况适时调整平衡器参数。
复制集实践：
- 在搭建复制集时，根据服务器资源和应用需求设置成员数量和优先级。例如，在一个金融交易系统中，设置3个成员的复制集，其中一台高性能服务器作为主节点，优先级设为2，另外两台作为从节点，优先级设为1。
- 使用rs.printReplicationInfo()和rs.printSlaveReplicationInfo()等命令监控复制集同步延迟，及时处理同步问题。

索引维护开销：
- 挑战：频繁的写入操作可能导致索引更新频繁，增加磁盘I/O和CPU开销。
- 应对措施：合理控制写入频率，例如采用批量写入方式减少索引更新次数；定期对索引进行重建或优化，使用db.collection.reIndex()命令在业务低峰期重建索引，提高索引效率。
分片热点：
- 挑战：即使选择了看似合理的分片键，随着业务发展，某些分片可能成为热点，导致读写性能下降。
- 应对措施：实时监控分片负载，当发现热点分片时，及时调整分片键或进行手动数据迁移。可以使用MongoDB提供的moveChunk命令手动迁移数据到其他负载较低的分片。
复制集同步延迟：
- 挑战：高并发写入可能使从节点同步延迟增大，影响数据一致性。
- 应对措施：优化网络配置，确保主从节点间网络稳定；增加从节点资源，如CPU、内存等，提高从节点处理能力；对于对一致性要求极高的操作，可在主节点完成后再进行后续处理。

知识考点