星途面试题库

面试题：缓存设计在机器学习模型预测场景中的作用

在机器学习模型用于实时预测的场景下，阐述缓存设计如何提高系统性能，并列举至少两种常见的缓存策略及其适用场景。

25.9万热度

难度

后端开发缓存设计

知识考点

AI 面试

面试题答案

缓存设计提高系统性能的方式

减少模型推理时间：对于相同输入数据，若之前已进行过预测，直接从缓存中获取结果，无需再次运行机器学习模型进行复杂的推理计算，从而显著降低预测延迟，满足实时性要求。例如在股票价格实时预测场景中，对于特定时间窗口和指标组合的预测结果缓存，再次遇到相同输入时可快速响应。
降低资源消耗：避免重复计算节省了计算资源（如CPU、GPU等），使得系统能够在有限资源下处理更多的实时预测请求，提高系统整体吞吐量。比如在大规模物联网设备数据实时预测场景，减少不必要计算可服务更多设备。

常见缓存策略及其适用场景

最近最少使用（LRU）策略
- 适用场景：适用于数据访问具有时间局部性的场景，即最近访问过的数据在未来很可能再次被访问。如在线广告投放实时预测系统，用户近期浏览行为相关的预测结果，后续可能因用户持续浏览同一类型内容等原因再次被用到，使用LRU可保证热点数据留在缓存中。
先进先出（FIFO）策略
- 适用场景：适合缓存空间有限且数据时效性要求不高，更注重数据进入缓存先后顺序的场景。例如一些简单的日志分析实时预测场景，新日志不断产生，旧日志预测结果即使在缓存中停留时间长但也可能不再需要，FIFO可简单地管理缓存空间，优先淘汰最早进入缓存的数据。