星途面试题库

面试题：Redis缓存分片技术在中等规模数据场景中的常用分片策略有哪些

在中等规模数据场景下使用Redis缓存分片技术，通常会用到哪些分片策略？请简要阐述每种策略的原理及优缺点。

28.2万热度

难度

数据库Redis

知识考点

AI 面试

面试题答案

哈希分片（Hash Sharding）

原理：对数据的键进行哈希计算，通过哈希值将数据均匀分布到不同的Redis实例中。例如使用CRC16、MurmurHash等哈希函数，将键映射到一个固定范围的整数，再通过取模运算决定数据存储到哪个实例。
优点：简单直观，数据分布相对均匀，能有效利用各个实例资源，可扩展性较好，新增或移除实例时，数据迁移量相对可控。
缺点：当增加或减少Redis实例时，需要重新计算哈希值和取模，导致大量数据需要迁移，可能影响系统性能。

一致性哈希分片（Consistent Hashing Sharding）

原理：将哈希空间组织成一个虚拟的圆环，把每个Redis实例映射到这个环上的一个点，数据的键经过哈希计算后也映射到环上的点，数据存储在顺时针方向遇到的第一个实例上。当新增或移除实例时，只会影响该实例相邻的部分数据。
优点：在节点动态变化时，数据迁移量小，仅影响相邻节点的数据，对系统整体性能影响较小。系统的扩展性和稳定性较好。
缺点：实现相对复杂，可能存在数据分布不均匀的情况（如节点较少时），需要引入虚拟节点来优化数据分布，但增加了系统复杂度。

范围分片（Range Sharding）

原理：按照数据的某个属性（如时间范围、ID范围等）将数据划分成不同的范围，每个范围对应一个Redis实例。例如按时间将数据划分为不同时间段的数据，分别存储到不同实例。
优点：便于进行数据管理和维护，如按照时间范围分片，便于进行数据归档和清理。对特定范围数据的批量操作效率高。
缺点：数据分布可能不均匀，某些范围的数据量可能远大于其他范围，导致实例负载不均衡。当数据范围发生变化时，可能需要对数据进行重新分片和迁移。