面试题：HBase中不同BlockCache方案对读取性能的影响有哪些

默认的单BlockCache：
- 所有类型的数据块（如索引块、数据块等）都缓存在同一个缓存空间中。当缓存空间满时，采用LRU（Least Recently Used）算法淘汰最近最少使用的块。这种方案简单直接，适用于多种应用场景，但没有针对不同类型数据块的特性进行优化。
分级的BlockCache：
- 通常分为两级，如L1和L2。L1缓存一般较小且采用LRU - K算法（K通常大于1），用于快速缓存最近频繁访问的数据块，命中率较高。L2缓存相对较大，采用LRU算法，用于缓存相对不那么频繁访问但可能再次用到的数据块。分级缓存通过对数据块访问频率的细分，提高了缓存的整体效率，尤其适用于数据访问模式有明显分层的场景。

随机读：
- 默认的单BlockCache：随机读时，由于数据块访问的随机性，单BlockCache中的数据块可能频繁被替换。如果缓存空间不足，大量随机读取的数据块可能无法在缓存中命中，导致每次读取都需要从磁盘读取数据，I/O开销较大，性能受到影响。
- 分级的BlockCache：分级缓存的L1缓存可以快速捕获最近随机访问过的数据块。对于重复的随机读，数据块有较高概率在L1缓存中命中，减少磁盘I/O。即使L1未命中，L2缓存也可能存储相关数据块，相比单BlockCache，增加了数据块在缓存中的命中机会，从而提升随机读性能。
顺序读：
- 默认的单BlockCache：顺序读时，大量连续的数据块被读取，可能很快将缓存填满，后续顺序读取的数据块会不断替换前面顺序读取的数据块。由于缓存中的数据块被频繁替换，再次读取时可能无法命中缓存，导致性能下降。
- 分级的BlockCache：顺序读取的数据块在L1缓存中停留时间较短，很快被淘汰到L2缓存。由于L2缓存空间较大，能容纳更多顺序读取的数据块，对于后续再次顺序读取这些数据块，有一定概率在L2缓存中命中，减少磁盘I/O，相比单BlockCache，在顺序读场景下能有更好的性能表现。

知识考点