面试题：MongoDB固定集合与普通集合在数据恢复与迁移上的差异及处理

MongoDB固定集合与普通集合在数据恢复和迁移过程中的主要差异

数据结构与存储
- 普通集合：采用动态的文档存储结构，文档大小可以灵活变化，存储空间根据数据增长动态分配。在恢复和迁移时，可按常规的备份与恢复机制，对文档逐个处理，相对灵活。
- 固定集合：有固定大小的存储空间，按插入顺序存储数据，当空间满时，新数据会覆盖旧数据。在恢复和迁移时，需特殊考虑其固定大小及顺序特性，不能简单按普通集合方式处理。
备份与恢复机制
- 普通集合：常见备份工具（如mongodump和mongorestore）能很好地适应，可完整备份和恢复集合内所有文档，恢复时文档顺序不影响其使用。
- 固定集合：使用常规备份工具恢复时，需注意保持原有的插入顺序和数据量限制。若恢复数据量超过固定集合大小，可能导致数据丢失或异常。
数据迁移
- 普通集合：迁移相对简单，可直接将数据从一个实例复制到另一个实例，无需考虑特殊顺序或空间限制，只要目标实例有足够空间。
- 固定集合：迁移时要确保目标固定集合大小与原集合一致，且数据顺序保持不变，否则可能影响应用逻辑，如依赖插入顺序的查询等。

针对固定集合数据恢复与迁移复杂场景的解决方案设计

备份阶段
- 使用mongodump：利用mongodump工具对包含固定集合的数据库进行备份，确保备份过程中记录集合的元数据，包括固定集合的大小、最大文档数等信息。例如，执行mongodump -h <source_host> -d <source_database> -o <backup_directory>命令进行备份。
- 自定义脚本辅助：编写一个自定义脚本，遍历固定集合，记录每个文档的插入顺序（可通过时间戳等方式标记）。这在后续恢复和迁移时用于保证数据顺序。
恢复与迁移阶段
- 创建目标固定集合：在目标实例上，根据备份时记录的元数据，创建与源固定集合大小、最大文档数等参数一致的固定集合。例如，使用db.createCollection("<collection_name>", {capped: true, size: <size_in_bytes>, max: <max_documents>})命令创建。
- 数据恢复：
  - 按顺序恢复：利用mongorestore工具恢复数据，但在恢复过程中，结合之前记录的文档插入顺序，确保文档按原顺序插入到目标固定集合。例如，可将备份数据按顺序读取，然后逐个插入到目标集合。
  - 处理溢出数据：如果恢复的数据量超过目标固定集合大小，制定策略处理溢出数据。可以选择丢弃最旧的数据（模拟固定集合的覆盖机制），或者将溢出数据存储到其他地方（如普通集合），并在应用层提供相应的查询逻辑，以便查询完整数据。
验证阶段
- 数据完整性验证：编写脚本来验证恢复和迁移后的数据与原数据在数量、内容上是否一致。例如，计算源集合和目标集合的文档哈希值，对比两者是否相等。
- 功能验证：在应用层面，对涉及固定集合的功能进行测试，确保依赖固定集合顺序或其他特性的功能正常运行。例如，运行依赖插入顺序的查询，检查结果是否与原系统一致。

星途面试题库

面试题：MongoDB固定集合与普通集合在数据恢复与迁移上的差异及处理

知识考点

面试题答案

MongoDB固定集合与普通集合在数据恢复和迁移过程中的主要差异

针对固定集合数据恢复与迁移复杂场景的解决方案设计