面试题：高并发场景下Redis热点数据识别与缓存加载优化

优化Redis热点数据识别算法以降低系统开销

采样统计法：
- 定期从Redis的访问日志中采样一部分请求，分析这些样本中的数据访问频率。例如，每10分钟从日志中随机抽取1000条请求记录，统计每个键的出现次数。
- 为了减少内存开销，可以使用概率数据结构，如布隆过滤器（Bloom Filter）来快速判断一个键是否在采样数据中，避免全量存储。
基于时间窗口的计数法：
- 划分时间窗口，比如以1分钟为一个窗口。在每个窗口内，对每个键的访问次数进行计数。
- 随着时间推移，旧窗口的数据权重逐渐降低。可以采用衰减因子，例如每过一个新窗口，旧窗口数据的计数乘以0.8，这样能更关注近期的热点数据。
哈希取模法：
- 根据键的哈希值对服务器数量取模，将数据均匀分布到多个Redis实例上。例如，有3个Redis实例，键key1的哈希值为hash(key1)，则hash(key1) % 3的结果决定该键存储在哪个实例上。
- 同时，结合一致性哈希算法，当有新的实例加入或旧实例移除时，能尽量减少数据迁移量，降低系统开销。

应对缓存雪崩现象保证系统稳定性和数据正常获取的措施

设置不同的过期时间：
- 避免大量缓存数据在同一时间过期。对于不同的数据，可以在原过期时间的基础上增加一个随机的小偏移量。例如，原本1小时过期的缓存，随机在55 - 65分钟之间设置过期时间。
使用二级缓存：
- 当一级缓存（如Redis）失效时，先从二级缓存（如本地内存缓存，Guava Cache）中获取数据。如果二级缓存也没有，则查询数据库，并将数据同时更新到一级和二级缓存中。
缓存预热：
- 在系统启动时，提前将部分热点数据加载到缓存中。可以通过脚本或预先生成的配置文件，指定要加载的热点数据，确保系统上线后，这些数据已经在缓存中，避免冷启动时大量请求直接穿透到数据库。
限流与降级：
- 限流：对访问系统的请求流量进行限制，比如使用令牌桶算法（Token Bucket Algorithm）或漏桶算法（Leaky Bucket Algorithm）。例如，每秒只允许1000个请求访问数据库，超出部分返回友好的提示信息，如“系统繁忙，请稍后重试”。
- 降级：当系统压力过大时，暂时屏蔽一些非核心功能，优先保证核心业务的正常运行。例如，电商系统在缓存雪崩时，暂时关闭商品评论展示功能，保证商品详情页的正常访问。
启用Redis集群的持久化：
- 开启AOF（Append - Only File）或RDB（Redis Database）持久化机制。如果Redis服务器重启，能快速从持久化文件中恢复数据，减少缓存重建的时间和压力。同时，可以配置多个从节点，在主节点出现故障时，从节点能快速接管服务。

面试题：高并发场景下Redis热点数据识别与缓存加载优化

知识考点

面试题答案

优化Redis热点数据识别算法以降低系统开销

应对缓存雪崩现象保证系统稳定性和数据正常获取的措施