星途面试题库

面试题：缓存设计之高并发下的平衡策略

在一个高并发的后端系统中，缓存使用Redis，持久化存储使用分布式文件系统（如Ceph）。当大量请求同时读取和写入数据时，如何设计缓存与持久化存储的交互机制，确保数据的强一致性和系统的高性能？请详细阐述设计思路、关键技术点以及可能涉及的算法。

36.2万热度

难度

后端开发缓存设计

知识考点

AI 面试

面试题答案

设计思路

读写顺序控制：
- 写操作：先更新持久化存储（如Ceph），在更新成功后，再更新Redis缓存。这样能保证持久化存储是最新数据，即使Redis更新失败，数据一致性也不会受太大影响。
- 读操作：优先从Redis缓存读取数据。若缓存中不存在，则从持久化存储（Ceph）读取，并将读取到的数据更新到Redis缓存，以提高后续读取性能。
缓存失效策略：
- 设置合理的缓存过期时间，对于不经常变化的数据可设置较长过期时间；对于变化频繁的数据，设置较短过期时间。过期后的数据再次读取时会从持久化存储重新加载并更新缓存。
- 引入主动失效机制，当数据在持久化存储更新时，主动使Redis中对应缓存失效，确保下次读取能获取最新数据。

关键技术点

分布式锁：在高并发写操作时，为防止多个请求同时更新持久化存储和缓存导致数据不一致，使用分布式锁（如Redis的SETNX命令实现简单分布式锁）。只有获取到锁的请求才能执行写操作，完成后释放锁。
缓存更新原子性：利用Redis的事务（MULTI/EXEC）或Lua脚本，确保缓存更新操作的原子性，避免并发更新时出现数据不一致问题。
数据同步：
- 对于持久化存储到缓存的数据同步，可采用消息队列（如Kafka）。当持久化存储数据更新时，发送消息到队列，由消费者负责更新Redis缓存，保证数据最终一致性。
- 监控持久化存储的变更日志（如Ceph的RADOSGW日志），从中获取数据更新信息，触发缓存更新操作。

可能涉及的算法

缓存淘汰算法：
- LRU（Least Recently Used）：淘汰最长时间未被使用的数据。Redis可通过配置maxmemory-policy volatile-lru或maxmemory-policy allkeys-lru实现基于LRU的缓存淘汰。
- LFU（Least Frequently Used）：淘汰使用频率最低的数据。在Redis 4.0 及以上版本，可通过maxmemory-policy volatile-lfu或maxmemory-policy allkeys-lfu配置实现。
分布式一致性算法：虽然Ceph本身采用CRUSH算法实现数据分布和一致性，但在与Redis交互确保整体数据一致性过程中，若采用分布式锁等机制，可参考Paxos、Raft等分布式一致性算法的思想，保证在分布式环境下锁的正确获取与释放，以及数据更新的一致性。