面试题：缓存设计：ARC算法基本原理

数据结构：
- ARC维护两个缓存列表，分别是T1和T2，以及一个幽灵列表B1和B2。T1和T2用于存储当前缓存中的数据，B1和B2用于记录最近被淘汰的数据。
- T1列表存储近期刚被访问一次的数据，T2列表存储近期被多次访问的数据。
访问处理：
- 当一个请求到达：
  - 如果请求的数据在T1或T2中，这是一次命中，该数据会被移动到T2列表（如果它原本在T1）。并且如果它在T2，会根据T2的规则（类似LRU，将最近使用的移到头部）进行位置调整。
  - 如果请求的数据不在T1和T2中，这是一次未命中：
    - 首先检查B1和B2列表。如果数据在B1中，将其从B1移到T1，并将T1中最久未使用的元素移到B1（保持T1大小不变）。
    - 如果数据在B2中，将其从B2移到T2，并将T2中最久未使用的元素移到B2（保持T2大小不变）。
    - 如果数据既不在T1、T2，也不在B1、B2中，需要淘汰一个元素。ARC会根据一定的比例规则，决定从T1或T2中淘汰最久未使用的元素。同时，会按照一定策略更新B1和B2列表。
动态调整：
- ARC会根据访问模式动态调整T1和T2的大小比例。如果T2中的元素被频繁访问，T2的大小会增加，反之亦然。这样可以更好地适应不同的访问模式。

适应多种访问模式：
- LRU假设最近最少使用的元素在未来也最少被使用，对于具有突发访问模式的数据不太适应。而ARC通过维护T1、T2以及幽灵列表，可以动态调整缓存结构，更好地应对不同的访问模式，如突发访问和周期性访问等。
减少缓存污染：
- 在LRU中，当缓存满时，新数据加入会淘汰最久未使用的数据，可能会淘汰掉那些即将被再次访问的有用数据（缓存污染）。ARC通过幽灵列表记录近期淘汰的数据，如果这些数据再次被访问，可以快速重新加入缓存，减少了缓存污染的可能性。
预取友好：
- ARC的动态调整机制使其能够更好地利用预取数据。当预取数据进入缓存时，ARC可以根据其访问历史，合理地将其放置在T1或T2中，提高缓存命中率，相比LRU更能适应预取场景。

知识考点