面试题：MongoDB的存储引擎优化策略

MongoDB不同存储引擎特点及适用场景

WiredTiger
- 特点：
  - 文档级并发控制：支持文档级别的并发读写，相比MMAPv1的表级锁，大大提高了并发性能。在高并发写入场景下，不同文档的写入操作可以并行进行，不会相互阻塞。
  - 压缩：具有高效的压缩算法，如Snappy和Zlib。压缩可以显著减少磁盘空间占用，同时在一定程度上提高I/O性能，因为减少了磁盘I/O的数据量。例如，对于包含大量文本数据的集合，压缩可以使存储文件大小大幅降低。
  - 多线程：采用多线程架构，能更好地利用多核CPU的性能，提高数据库的整体处理能力。
- 适用场景：
  - 高并发读写场景：如社交平台的动态发布与浏览，大量用户同时进行读写操作，WiredTiger的文档级并发控制能有效应对这种情况。
  - 存储密集型场景：当数据量巨大且对磁盘空间有限制时，其压缩特性可发挥优势，如日志记录系统，数据量持续增长，压缩可减少存储成本。
MMAPv1（较旧，不再推荐使用，但了解其特点有助于对比）
- 特点：
  - 表级锁：读写操作以表为单位加锁，在高并发写入时，同一表的不同操作可能相互阻塞，导致性能下降。
  - 简单的数据文件管理：直接将数据文件映射到内存，通过操作系统的内存管理机制进行处理。
- 适用场景：
  - 低并发、简单读写场景：早期一些小型应用，对并发要求不高，MMAPv1简单的架构可以满足基本需求。但随着业务发展，高并发场景增多，MMAPv1逐渐被淘汰。

性能优化

配置参数调整
- WiredTiger：
  - cache大小设置：通过调整wiredTigerCacheSizeGB参数来设置WiredTiger引擎的缓存大小。例如，在mongod.conf文件中：

storage:
  wiredTiger:
    engineConfig:
      cacheSizeGB: 2

  适当增加缓存大小，可以提高数据读取性能，因为更多的数据可以缓存在内存中，减少磁盘I/O。但要注意不要设置过大，避免影响操作系统和其他进程的运行。
  - **压缩算法选择**：根据数据特点选择合适的压缩算法。如果数据对压缩速度要求较高，可选择Snappy；如果对压缩率要求更高，可选择Zlib。在创建集合时指定：

db.createCollection("myCollection", {
  storageEngine: {
    wiredTiger: {
      config: 'block_compressor=snappy'
    }
  }
});

索引优化
- 分析查询模式：使用explain()方法分析查询语句，了解查询执行计划，找出需要优化的查询。例如：

db.users.find({ age: { $gt: 30 } }).explain("executionStats");

- **创建复合索引**：对于经常一起使用的查询条件，创建复合索引。比如，如果经常按`age`和`name`查询用户：

db.users.createIndex({ age: 1, name: 1 });

- **避免过度索引**：过多的索引会增加写入成本，因为每次写入都需要更新索引。定期评估索引使用情况，删除不必要的索引。

3. 数据布局优化 - 合理分块：在分片集群中，合理选择分片键。例如，对于按时间序列存储的数据，选择时间字段作为分片键，可使数据均匀分布，提高查询性能。 - 预分配空间：对于已知会持续增长的集合，可以预先分配一定的空间，减少动态分配带来的性能开销。在创建集合时设置capped和size参数：

db.createCollection("myCappedCollection", {
  capped: true,
  size: 1000000
});

实际操作方法举例

假设我们有一个电商订单系统，订单数据量较大且读写并发较高。

配置参数调整：根据服务器内存情况，设置wiredTigerCacheSizeGB为服务器可用内存的50%左右，以提高数据缓存命中率。同时，因为订单数据包含大量文本描述，选择压缩率较高的Zlib算法进行压缩。
索引优化：订单查询经常按订单状态和下单时间进行，创建复合索引：

db.orders.createIndex({ status: 1, orderTime: -1 });

数据布局优化：考虑到订单量持续增长，在创建订单集合时预分配一定空间，如size设置为1GB。并且，由于订单按地区分布查询较多，在分片集群中选择地区字段作为分片键，使数据均匀分布，提高查询性能。

面试题：MongoDB的存储引擎优化策略

知识考点

面试题答案

MongoDB不同存储引擎特点及适用场景

性能优化

实际操作方法举例