面试题：如何自定义并优化Hbase中HBase LRUBlockCache的动态调整策略

缓存淘汰算法：如果现有LRU不适用，可能需要修改org.apache.hadoop.hbase.io.cache.BlockCache相关实现类中关于缓存淘汰的逻辑，比如采用更适合业务场景的MRU（Most Recently Used）或LFU（Least Frequently Used）等算法。在BlockCache接口的实现类（如LRUBlockCache）中修改evict等方法来实现新的淘汰逻辑。
缓存分配：在BlockCache类中，可能需要修改put方法，调整不同类型数据（如热点数据、冷数据）在缓存中的分配比例和方式。例如，对于热点数据，给予更高的缓存优先级。
动态调整触发条件：在BlockCache类的sizeOf等方法相关逻辑处，修改动态调整缓存大小的触发条件，以适应业务需求。例如，不再仅仅基于缓存占用空间，还可以结合业务的读写请求频率等因素来触发调整。

缓存大小参数：修改hbase-site.xml中的hbase.bufsize参数，控制每个RegionServer上的缓存总大小，以适应自定义策略下对缓存空间的新需求。
缓存比例参数：可能需要自定义参数来控制不同类型数据在缓存中的占比。例如，在hbase-site.xml中新增参数hbase.cache.hotdata.percentage，用于指定热点数据在缓存中的理想占比，在自定义策略代码中读取该参数进行缓存分配。

性能测试：
- 测试工具：使用HBase自带的性能测试工具hbase org.apache.hadoop.hbase.PerformanceEvaluation，可以通过调整参数来模拟不同的业务负载，如读写比例、数据量等。同时也可以结合外部工具如YCSB（Yahoo! Cloud Serving Benchmark），对自定义策略下的HBase集群进行性能测试。
- 测试指标：重点关注读写性能指标，如读吞吐量（Read Throughput）、写吞吐量（Write Throughput）、平均读延迟（Average Read Latency）、平均写延迟（Average Write Latency）等。同时监测缓存命中率（Cache Hit Ratio），以评估自定义策略对缓存利用的有效性。
优化：
- 参数优化：根据性能测试结果，不断调整之前提到的相关参数，如缓存大小、缓存比例等，观察性能指标的变化，找到最优参数组合。
- 代码优化：分析性能测试过程中发现的性能瓶颈，对自定义策略的代码进行优化。例如，如果发现缓存淘汰算法执行效率低，可以优化算法实现，减少计算资源的消耗。同时检查代码中的锁机制，确保在高并发情况下不会因为锁争用导致性能下降。

知识考点