面试题：缓存设计之Caffeine与分布式系统融合

设计思路

数据读取流程：
- 应用程序首先尝试从 Caffeine 本地缓存中获取数据。因为 Caffeine 是本地缓存，访问速度极快，可以快速响应大量重复请求，减少对分布式缓存和后端存储的压力。
- 如果 Caffeine 本地缓存中未命中，则去 Redis 分布式缓存中查找。Redis 作为分布式缓存，可以在多个应用实例间共享数据，确保数据的一致性。
- 若 Redis 中也没有数据，则从后端数据库或其他数据源获取数据。获取到数据后，将其同时写入 Caffeine 本地缓存和 Redis 分布式缓存，以便后续使用。
数据更新流程：
- 当数据发生更新时，首先更新后端数据源，确保数据的持久化和准确性。
- 然后同时使 Caffeine 本地缓存和 Redis 分布式缓存中的相关数据失效或更新。这样可以保证后续读取时获取到最新的数据。

可能遇到的问题

缓存一致性问题：
- 由于存在本地缓存和分布式缓存，在数据更新时，如果未能及时同步，可能导致不同缓存中的数据不一致，从而使应用程序读取到旧数据。
缓存穿透问题：
- 大量请求查询不存在的数据，这些请求会绕过缓存直接打到后端数据源，可能导致后端压力过大甚至崩溃。
缓存雪崩问题：
- 如果大量缓存数据在同一时间过期，可能会导致大量请求同时穿透缓存，直接访问后端数据源，造成后端服务压力骤增，甚至引发系统崩溃。
网络问题：
- 分布式缓存（如 Redis）与应用实例之间通过网络连接，网络波动、延迟或中断可能影响缓存的读写性能，甚至导致缓存无法使用。

解决方案

缓存一致性问题：
- 同步更新：在更新数据时，使用事务机制或分布式锁确保本地缓存和分布式缓存的更新操作原子性执行，即要么同时更新成功，要么都不更新。例如，在更新数据库后，先更新 Redis，成功后再更新 Caffeine 本地缓存。
- 缓存失效策略：采用合理的缓存失效策略，如设置较短的缓存过期时间，让缓存数据定期更新，降低不一致的概率。同时，结合缓存刷新机制，在数据变化时主动通知相关应用实例更新缓存。
缓存穿透问题：
- 布隆过滤器：在应用程序前端部署布隆过滤器，当请求到达时，先通过布隆过滤器判断数据是否存在。如果布隆过滤器判断数据不存在，则直接返回，不再查询缓存和后端数据源，从而避免无效请求穿透缓存。
- 空值缓存：当后端数据源查询到数据不存在时，将空值也缓存起来，并设置较短的过期时间，这样后续相同的请求就可以直接从缓存中获取空值，而不会穿透到后端。
缓存雪崩问题：
- 随机过期时间：在设置缓存过期时间时，采用随机值，避免大量缓存同时过期。例如，原本设置 1 小时过期，可以改为在 50 - 70 分钟之间随机设置过期时间。
- 缓存预热：在系统启动时，提前将部分热点数据加载到缓存中，避免系统启动后大量请求同时查询缓存，导致缓存雪崩。
网络问题：
- 重试机制：在访问 Redis 出现网络异常时，应用程序采用重试机制，在一定次数内尝试重新连接 Redis 进行缓存操作，提高系统的容错性。
- 备用缓存：可以设置备用的本地缓存策略，当 Redis 由于网络问题不可用时，临时使用备用的本地缓存策略（如扩大 Caffeine 本地缓存的容量等），以保证系统的基本缓存功能。同时，监控网络状态，当 Redis 恢复正常时，及时切换回正常的缓存使用模式。

面试题：缓存设计之Caffeine与分布式系统融合

知识考点

面试题答案

设计思路

可能遇到的问题

解决方案