星途面试题库

面试题：Redis字典API性能调优之常见优化点

在使用Redis字典API时，为了提升性能，从数据结构选择角度来说，有哪些常见的优化点？请举例说明。

41.2万热度

难度

数据库Redis

知识考点

AI 面试

面试题答案

1. 选择合适的哈希表类型

ziplist：当字典中元素数量较少，且每个元素的键和值都比较小（例如，字符串长度较短）时，Redis会使用ziplist来存储字典。ziplist是一种紧凑的、内存高效的数据结构，它将多个元素紧凑地存储在一块连续的内存中。例如，存储一个包含少量用户信息（如用户名和简单描述）的字典，由于数据量小且数据项不大，使用ziplist可节省内存。
hashtable：当元素数量较多或者单个元素的键或值较大时，Redis会使用hashtable。hashtable提供了快速的查找和插入性能，时间复杂度接近O(1)。比如一个大型的缓存系统，存储大量的网页缓存数据，使用hashtable能保证快速的读写操作。

2. 预分配内存

在批量插入数据时，可以预先估计数据量，并使用相应的API进行内存预分配。例如，在Python中使用redis - py库，若要插入1000个键值对，可以先调用r.hmset()函数时，预先分配好足够的内存空间，这样可以减少多次动态内存分配带来的开销，提升性能。

3. 减少哈希冲突

合理选择哈希函数：Redis默认的哈希函数对于大部分情况都能很好工作，但在某些特殊数据分布下，可能需要自定义哈希函数。例如，如果数据的键具有某种特定的分布规律，通过设计针对性的哈希函数，使得键能更均匀地分布在哈希表中，减少冲突。
调整哈希表大小：通过redis.conf中的hash-max-ziplist-entries和hash-max-ziplist-value配置参数，根据实际数据情况调整哈希表从ziplist转换为hashtable的阈值，以避免因哈希表过小导致过多冲突，或因哈希表过大浪费内存。