面试题：MongoDB增删改查场景下索引优化策略

索引设计思路

范围查询
- 对于范围查询，例如按时间范围（如日期）或数值范围查询，在查询字段上创建单字段索引。例如，如果是按日期范围查询文档，在日期字段上创建索引，语法如下：
```
db.collection.createIndex({dateField: 1});
```
- 如果查询涉及多个字段的范围查询，并且这些字段的查询条件有一定顺序（例如先按日期范围，再按用户ID范围），则创建复合索引。复合索引的顺序很重要，要按照查询条件的顺序排列。例如：
```
db.collection.createIndex({dateField: 1, userId: 1});
```
单文档更新
- 如果单文档更新操作主要基于某个特定字段查找文档，在这个字段上创建索引。比如基于文档的_id或唯一标识字段更新，_id字段默认有索引，如果是基于其他字段（如用户名）更新，可创建：
```
db.collection.createIndex({userName: 1});
```
批量插入操作
- 批量插入时，索引会增加插入操作的开销。因此，尽量避免在插入操作前有过多复杂索引。如果可能，在批量插入完成后再创建索引。
- 如果必须在插入前有索引，对于插入时涉及到的关联字段（如外键等），可以创建稀疏索引，以减少索引占用空间和插入时的性能损耗。例如，如果某个字段在部分文档中有值，可以创建稀疏索引：
```
db.collection.createIndex({optionalField: 1}, {sparse: true});
```

性能测试方法

使用基准测试工具
- mongostat：这是MongoDB自带的性能分析工具，可以实时查看MongoDB实例的各种状态指标，如插入、查询、更新、删除操作的速率，以及内存使用情况等。在命令行运行mongostat即可，它会持续输出相关指标数据。
- YCSB（Yahoo! Cloud Serving Benchmark）：可以用来模拟各种工作负载对MongoDB进行性能测试。首先要下载并安装YCSB，然后编写针对MongoDB的工作负载文件，定义范围查询、单文档更新和批量插入等操作的比例和参数。例如，通过以下命令运行测试：
```
bin/ycsb load mongodb -s -P workloads/workloadfile
bin/ycsb run mongodb -s -P workloads/workloadfile
```

自定义脚本测试

使用编程语言（如Python的pymongo库）编写测试脚本。例如，编写脚本进行大量的范围查询、单文档更新和批量插入操作，并记录每个操作的开始和结束时间，从而计算平均响应时间和吞吐量。以下是一个简单的Python示例：

import pymongo
from timeit import default_timer as timer

client = pymongo.MongoClient('mongodb://localhost:27017/')
db = client['testdb']
collection = db['testcollection']

# 范围查询测试
start = timer()
for _ in range(1000):
    result = collection.find({'dateField': {'$gte': '2023 - 01 - 01', '$lte': '2023 - 12 - 31'}})
end = timer()
print(f"Range query average time: {(end - start)/1000} seconds")

# 单文档更新测试
start = timer()
for _ in range(1000):
    collection.update_one({'_id': ObjectId('5f9b2d3a158c2e7e7e9c1e0b')}, {'$set': {'newField': 'value'}})
end = timer()
print(f"Single - document update average time: {(end - start)/1000} seconds")

# 批量插入测试
data = [{"field1": "value1", "field2": "value2"} for _ in range(1000)]
start = timer()
collection.insert_many(data)
end = timer()
print(f"Batch insert time: {end - start} seconds")

分析查询计划
- 使用explain方法查看查询计划，分析索引是否被正确使用。例如，对于一个范围查询：
```
db.collection.find({'dateField': {'$gte': '2023 - 01 - 01', '$lte': '2023 - 12 - 31'}}).explain('executionStats')
```
- 查看executionStats中的winningPlan部分，确认索引是否被用于查询，以及查询的执行效率相关指标，如扫描的文档数、返回的文档数等。根据分析结果调整索引设计。

面试题：MongoDB增删改查场景下索引优化策略

知识考点

面试题答案

索引设计思路

性能测试方法