星途面试题库

面试题：缓存设计与数据一致性保证

在实时数据分析与可视化系统里，涉及多个数据源和多层缓存结构。如何确保在高并发读写情况下，缓存中的数据与数据源的数据始终保持一致性？请描述具体的技术方案和可能遇到的挑战及应对措施。

27.3万热度

难度

后端开发缓存设计

知识考点

AI 面试

面试题答案

技术方案

读写锁机制 在缓存读写操作时，使用读写锁。读操作可以并发执行，因为读操作不会改变数据，而写操作则需要获取写锁，以确保同一时间只有一个写操作在执行，避免数据冲突。例如在Java中，可以使用ReentrantReadWriteLock实现读写锁。
版本控制 为数据源和缓存中的数据添加版本号。每次数据源数据更新时，版本号递增。缓存读写操作时，对比版本号。如果缓存版本号低于数据源版本号，则从数据源重新加载数据。
数据同步队列 建立一个数据同步队列，当数据源数据发生变化时，将变化的数据及其相关信息（如版本号、数据标识等）放入队列。缓存更新线程从队列中取出数据，按照一定策略更新缓存。
缓存更新策略

写后更新：数据源数据更新后，立即更新缓存。这种方式能保证数据一致性，但在高并发写场景下可能影响性能。
失效策略：数据源数据更新后，使相关缓存失效，下次读取缓存时发现失效则从数据源重新加载。这种方式实现简单，但在缓存失效到重新加载期间，可能存在数据不一致。
写前更新：在更新数据源之前，先更新缓存。这种方式可以减少数据不一致的时间窗口，但如果数据源更新失败，可能导致缓存数据与数据源不一致，需要额外的补偿机制。

可能遇到的挑战及应对措施

缓存雪崩

挑战：当大量缓存同时失效，高并发请求都去访问数据源，可能导致数据源压力过大甚至崩溃。
应对措施：设置缓存失效时间时，添加随机值，使缓存失效时间分散；或者使用二级缓存，当一级缓存失效时，先从二级缓存获取数据。

缓存穿透

挑战：恶意请求访问不存在的数据，每次都绕过缓存直接访问数据源，可能导致数据源压力过大。
应对措施：使用布隆过滤器，在请求访问数据源前，先通过布隆过滤器判断数据是否存在。如果布隆过滤器判断不存在，则直接返回，避免访问数据源。

网络延迟

挑战：在数据同步过程中，网络延迟可能导致缓存更新不及时，从而出现数据不一致。
应对措施：设置合理的超时机制和重试策略。如果同步操作超时，进行重试；同时监控网络状态，当网络异常时，采取降级措施，如暂时使用缓存中的旧数据。

分布式缓存一致性

挑战：在分布式缓存环境下，各个缓存节点之间的数据一致性维护更加复杂。
应对措施：使用分布式一致性协议，如Raft、Paxos等；或者采用缓存同步机制，当一个节点数据更新时，通过消息队列等方式通知其他节点进行同步。