面试题：在Hbase的HBase LRUBlockCache动态调整策略下如何应对高并发读场景

可能出现的性能瓶颈点

缓存命中率低：高并发读场景下，如果数据分布不均匀，热门数据可能频繁被替换出缓存，导致缓存命中率降低，增加磁盘I/O开销。
缓存空间不足：LRUBlockCache动态调整策略虽然会根据负载调整缓存大小，但如果整体业务数据量增长过快或突发大量新数据读取，可能导致缓存空间无法满足需求。
缓存更新开销：LRU算法在缓存满时需要淘汰最近最少使用的块，这个淘汰和新数据插入操作会带来一定的开销，在高并发场景下可能影响性能。
读放大：当缓存命中率低时，会频繁从磁盘读取数据，可能导致读放大问题，加重磁盘I/O负担，进而影响整个系统的读性能。

提升读性能的方法

调整LRUBlockCache相关参数
- 调整缓存大小：通过hbase.regionserver.global.memstore.size和hbase.regionserver.global.memstore.size.lower.limit等参数，合理分配堆内存中用于BlockCache的比例，确保有足够的缓存空间来容纳热门数据。例如，在内存充足的情况下，适当增大hbase.regionserver.global.memstore.size的值。
- 设置缓存淘汰策略：可以考虑调整LRU算法中的一些参数，如hbase.block.cache.eviction.lru.single.size，控制单个缓存块的大小，避免过大的块占用过多缓存空间，影响整体缓存命中率。
- 优化缓存预热：在系统启动或数据加载时，提前将热门数据加载到缓存中，减少初始阶段的缓存缺失。可以通过自定义脚本或工具实现数据预加载。
结合其他HBase机制
- 使用布隆过滤器：在表设计时启用布隆过滤器（Bloom Filter），可以快速判断数据是否存在于某个Region中，减少不必要的磁盘I/O操作。例如，在创建表时设置BLOOMFILTER => 'ROW'或BLOOMFILTER => 'ROWCOL'，根据业务需求选择合适的布隆过滤器类型。
- 数据预取：利用HBase的BlockCache预取机制，通过hbase.client.read.shortcutToMemStore参数设置，当读取数据时，如果MemStore中有对应数据，直接从MemStore读取，减少从磁盘读取的次数。同时，可以调整hbase.regionserver.blockcache.prefetch.size参数，控制预取块的大小。
- 负载均衡：通过HBase的负载均衡机制，如hbase.balancer.period参数设置负载均衡的执行周期，确保集群中的Region分布均匀，避免部分RegionServer负载过高，影响读性能。
- 多级缓存：可以结合应用层的缓存（如Redis）构建多级缓存体系。对于读请求，先从应用层缓存获取数据，如果未命中再访问HBase的BlockCache，最后从磁盘读取，进一步提高读性能。

面试题：在Hbase的HBase LRUBlockCache动态调整策略下如何应对高并发读场景

知识考点

面试题答案

可能出现的性能瓶颈点

提升读性能的方法