面试题：分布式系统中微服务架构的服务拆分与数据一致性难题及解决方案

数据一致性问题产生的原因

网络延迟与故障：在分布式系统中，各微服务之间通过网络进行通信。网络延迟可能导致数据同步不及时，而网络故障（如丢包、连接中断）则可能使部分数据无法正常传输，从而破坏数据一致性。例如，电商系统中订单服务和库存服务之间通信时，若网络延迟，库存减少的消息不能及时到达库存服务，就会出现订单已生成但库存未扣减的情况。
服务可用性差异：不同微服务的可用性不同。如果一个依赖的微服务出现故障不可用，而调用它的微服务仍在进行业务操作，就可能导致数据状态不一致。比如，支付服务依赖银行接口服务，若银行接口服务故障，支付服务可能无法准确更新支付状态，造成数据不一致。
并发操作：多个微服务可能同时对共享数据进行操作。例如，多个订单服务实例同时处理订单，都尝试减少库存，若没有合适的并发控制机制，就会出现库存扣减错误，导致数据不一致。

解决方案

分布式事务处理
- 两阶段提交（2PC）
  - 适用场景：适用于对数据一致性要求极高，且业务场景相对简单，涉及的微服务数量较少的情况。例如金融系统中的转账操作，必须保证转出和转入金额的一致性。
  - 局限性：协调者单点故障问题，若协调者崩溃，整个分布式事务可能无法完成。而且它是强一致性模型，性能较低，因为所有参与者在准备阶段都要锁定资源，等待全局提交或回滚，会造成较长时间的资源占用。
- 三阶段提交（3PC）
  - 适用场景：在对2PC改进的基础上，适用于对系统可用性和数据一致性都有较高要求，且允许一定性能损耗的场景。例如一些对数据准确性和系统稳定性要求严格的关键业务流程。
  - 局限性：虽然部分解决了2PC协调者单点故障问题，但性能开销更大，因为增加了预提交阶段。而且仍然存在一致性风险，比如在预提交阶段后部分参与者故障，可能导致数据不一致。
最终一致性模型的应用
- 消息队列
  - 适用场景：适用于对数据一致性要求不是非常即时，允许一定时间内存在数据不一致的场景。例如电商系统中订单生成后，通过消息队列异步通知库存服务扣减库存，即使库存扣减稍有延迟，用户也能接受。
  - 局限性：消息可能丢失、重复或乱序，需要额外的机制来保证消息的可靠性和顺序性。例如通过消息确认机制和消息重试机制来解决消息丢失问题，通过消息顺序号等方式解决消息乱序问题。
- 补偿机制
  - 适用场景：当业务操作出现异常导致数据不一致时，用于事后恢复数据一致性。例如在订单支付成功但库存扣减失败时，通过补偿机制重新发起库存扣减操作或回滚订单。
  - 局限性：实现复杂，需要对业务逻辑有深入理解，准确判断哪些操作需要补偿以及如何补偿。而且补偿操作可能会对系统造成额外的压力。
- 读写分离与缓存
  - 适用场景：适用于读多写少的场景，通过读写分离提高系统性能，同时利用缓存减轻数据库压力。例如新闻资讯类应用，大量用户读取新闻内容，写操作（如发布新闻）相对较少。
  - 局限性：缓存一致性问题，缓存数据和数据库数据可能存在短暂不一致。需要设置合理的缓存过期时间，或者采用缓存更新策略（如写后失效、写时更新等）来尽量减少不一致时间。

星途面试题库

面试题：分布式系统中微服务架构的服务拆分与数据一致性难题及解决方案

知识考点

面试题答案

数据一致性问题产生的原因

解决方案