星途面试题库

面试题：缓存设计之高级难度：复杂场景下的缓存缩容策略

在一个高并发、数据量庞大且读写频繁的后端系统中，缓存使用Memcached。由于业务调整，需要对缓存进行缩容。考虑到不能影响系统正常运行，且要保证数据的一致性和可用性，你会如何设计缓存缩容策略？请从数据迁移、淘汰算法调整、系统监控与预警等方面进行阐述。

21.8万热度

难度

后端开发缓存设计

知识考点

AI 面试

面试题答案

数据迁移

逐步迁移：
- 采用分批次迁移的方式，避免一次性迁移大量数据对系统造成冲击。例如，按照缓存数据的key前缀或者哈希值范围，将数据分成若干个小批次。
- 可以利用定时任务，在系统负载较低的时间段（如凌晨），每次迁移一小部分数据到新的缩容后的缓存集群中。
双写策略：
- 在迁移期间，对读写操作采用双写机制。即写操作同时写入原缓存和新缩容后的缓存，读操作优先从新缓存读取，如果读取不到再从原缓存读取，并将数据回写到新缓存。这样可以保证新老缓存数据的一致性，随着时间推移，原缓存的数据逐渐被淘汰，最终完成迁移。

淘汰算法调整

优化LRU（最近最少使用）算法：
- 对于Memcached默认的LRU淘汰算法，可以进行优化。例如，增加一个热度因子，对于近期频繁读写的数据，提高其留存的优先级。可以通过记录数据的访问次数和访问时间间隔来综合计算热度。
- 采用二次机会算法，当一个数据块被标记为淘汰候选时，如果在一定时间内再次被访问，则给予它第二次留在缓存中的机会，避免重要数据被误淘汰。
设置不同的淘汰优先级：
- 根据业务数据的重要性，将数据划分不同的优先级。例如，对于影响核心业务流程的数据，如用户登录信息、重要配置参数等，设置较高的优先级，使其在缓存缩容时更不容易被淘汰；而对于一些辅助性的数据，如非关键统计信息等，设置较低的优先级。

系统监控与预警

监控指标：
- 缓存命中率：实时监控缓存命中率，若命中率大幅下降，可能意味着缓存缩容过度或者数据迁移未完成导致部分数据无法命中。设置合理的命中率阈值，如低于80%触发预警。
- 缓存负载：监控缓存集群的内存使用率、CPU使用率等负载指标。当内存使用率接近缩容后设定的上限（如90%）或者CPU使用率过高（如超过80%）时，发出预警，以便及时调整。
- 数据迁移进度：跟踪数据迁移的进度，确保迁移任务按计划进行。如果迁移速度过慢或者长时间停滞，发出预警，检查迁移过程中是否出现错误。
预警机制：
- 采用多种方式进行预警，如邮件、短信、即时通讯工具等。当监控指标超过阈值时，及时通知相关技术人员。
- 建立值班制度，确保预警信息能够得到及时处理，技术人员能够迅速采取措施，如调整缓存缩容策略、排查数据迁移问题等，保障系统的正常运行。