面试题：MongoDB分片集群中如何优化分片键的选择

选择分片键时需考虑的因素以实现数据均衡分布和高效查询

数据分布均匀性
- 基数：分片键应该具有较高的基数，即包含大量不同的值。例如，如果使用日期作为分片键，按天划分可能基数较低，而细化到秒甚至毫秒可以提高基数，避免数据集中在少数几个分片键值上，从而实现数据在各个分片上更均匀的分布。
- 避免热点：避免选择经常出现相同值的字段作为分片键。比如，在一个电商订单系统中，如果将 “订单状态”（如 “已支付”“未支付” 等有限几个值）作为分片键，会导致大量订单数据集中在某几个分片上，形成热点，影响性能。
查询模式
- 频繁查询字段：若应用程序经常基于某个字段进行查询，选择该字段作为分片键可以提高查询效率。例如，在一个用户信息系统中，如果经常根据用户ID查询用户信息，将用户ID作为分片键，查询时可以直接定位到对应的分片，减少跨分片查询的开销。
- 范围查询：对于范围查询，选择合适的分片键很关键。如果按时间范围查询订单数据，选择时间字段作为分片键，可以使相关的数据集中在连续的分片上，便于范围查询的执行。但要注意时间粒度的选择，过粗可能导致数据分布不均，过细可能增加管理成本。
数据增长模式
- 递增字段：如果数据是按递增方式增长，如自增ID，需要谨慎选择作为分片键。因为这种情况下，新插入的数据可能总是集中在一个分片上，造成数据分布不均衡。可以通过一些哈希算法对递增字段进行处理，再作为分片键，以实现数据的均匀分布。
- 动态变化：考虑数据未来的变化趋势。如果业务发展可能导致某个字段的值分布发生较大变化，选择该字段作为分片键可能会在未来出现数据分布问题。例如，随着业务拓展，原来基于地区分布较为均匀的业务数据，可能因某个地区业务量突然激增而导致分布不均，此时若以地区作为分片键就需要重新评估。
数据关联性
- 关联字段：如果数据存在较强的关联性，如订单和订单详情，选择能够将相关数据尽量放在同一分片上的字段作为分片键，有利于减少跨分片的关联查询操作，提高查询效率。比如，可以选择订单ID作为订单和订单详情数据的分片键，确保订单及其详情数据在同一分片，避免跨分片查询。

已有的分片键选择不合理时的调整方法（尽量不影响业务）

逐步迁移
- 双写模式：开启双写，在应用程序中同时向原分片集群和新的、基于合理分片键的集群写入数据。在此期间，应用程序的读操作仍然从原集群读取，以保证业务正常运行。
- 逐步切换：当新集群的数据达到一定程度（如覆盖了大部分活跃数据）后，开始逐步将读操作切换到新集群。可以通过设置权重等方式，先将部分读请求导向新集群，观察业务运行情况，确保没有问题后，再逐渐增加新集群的读权重，直至全部切换。最后，停止向原集群写入数据，并将其下线。
使用中间层代理
- 路由调整：在应用程序和MongoDB分片集群之间添加一个中间层代理（如MongoDB Sharding Proxy等）。通过代理来调整数据的路由规则，将基于原不合理分片键的请求，按照新的合理分片键规则转发到相应的分片。这样，应用程序无需修改代码，业务可以正常运行，同时实现了分片键调整后的正确数据访问。
- 缓存辅助：在代理层添加缓存机制，缓存热点数据，减少因路由调整带来的性能波动。对于经常访问的数据，代理可以直接从缓存中返回，而不需要每次都根据新的分片键规则查询数据库，提高响应速度，降低对业务的影响。
在线重分片
- MongoDB内部机制：MongoDB本身提供了一些在线重分片的功能。可以使用 reshardCollection 等命令，在不停止业务的情况下，对集合进行重分片操作。在操作过程中，MongoDB会自动将数据从原分片键分布迁移到新的分片键分布，应用程序仍然可以正常读写数据，但可能会对性能有一定影响，需要在业务低峰期进行，并密切监控性能指标。
- 监控与调整：在重分片过程中，密切监控集群的性能指标，如CPU、内存、网络流量等。如果发现性能问题，及时调整重分片的速度或暂停操作，待问题解决后继续。同时，确保应用程序对可能出现的短暂性能波动有一定的容忍度，避免业务中断。

面试题：MongoDB分片集群中如何优化分片键的选择

知识考点

面试题答案

选择分片键时需考虑的因素以实现数据均衡分布和高效查询

已有的分片键选择不合理时的调整方法（尽量不影响业务）