上一讲提到,缓存的容量总是小于后端数据库的。随着业务系统的使用,缓存数据会撑满内存空间,该怎么处理呢?
本节我们来学习内存淘汰机制。在Redis 4.0之前有6种内存淘汰策略,之后又增加2种,一共8种,如下图所示:
- noeviction策略:内存空间达到maxmemory时,不会淘汰数据,有新写入时会返回错误。
- volatile-ttl策略:针对设置了过期时间的键值对,根据过期时间的先后进行修改,越早过期的越先被删除。
- volatile-random策略:在设置了过期时间的键值对中,进行随机删除。
- volatile-lru策略:使用LRU算法筛选设置了过期时间的键值对,进行删除。
- volatile-lfu策略:使用LFU算法筛选设置了过期时间的键值对,进行删除。
- allkeys-random策略:在所有键值对中随机选择并删除数据。
- allkeys-lru策略:使用LRU算法在所有数据中进行筛选并删除数据。
- allkeys-lfu策略:使用LFU算法在所有数据中进行筛选并删除数据。
对于TTL、Random比较好理解,下面学习一下LRU和LFU算法。
LRU算法
LRU算法,全称Least Recently Used。
其中MRU端指最近访问的数据;LRU端指最早访问的数据。
被访问的数据和新插入的数据会移到MRU端,空间满了后从LRU端删除。这样一来,最早访问的数据会逐渐被淘汰。
但LRU算法也有其缺点:
- 需要用链表管理所有缓存数据,带来额外的空间开销
- 大量数据被访问,就会带来很多链表移动操作,降低Redis性能
而Redis对其进行简化:
- Redis会记录每个数据的最近一次访问的时间戳(RedisObject中的lru字段)
- Redis第一次淘汰数据时,会随机选出N个数据,作为一个候选集合。
- 然后比较这N个数据的lru,把lru最小的从缓存中淘汰。
当再次淘汰数据时,会挑选数据放到第一次淘汰时的候选集合,要求小于候选集合中最小的lru值才能加入。
其中maxmemory-samples
配置项:表示选出的个数N。可以通过以下命令进行设置:
CONFIG SET maxmemory-samples 100
LFU算法
LFU算法是在LRU策略基础上,为每个数据增加一个计数器,来统计这个数据的访问次数。
使用LFU策略筛选淘汰数据时,根据数据的访问次数进行筛选,把访问次数最低的数据淘汰。如果两个数据访问次数相同,再比较两个数据的访问时效性,把更久的数据淘汰。
如何实现
LFU也是使用RedisObject的lru字段来实现。
把24bit的lru字段拆分成两部分:
- ldt值:lru字段的前16bit,表示数据的访问时间戳;
- counter值:lru字段的后8bit,表示数据的访问次数;
当LFU策略淘汰数据时,Redis在候选集合中,根据lru字段的后8bit选择访问次数最小的数据进行淘汰。如果访问次数相同,再根据lru字段的前16bit值大小,选择更久的数据进行淘汰。
关于counter只有8bit(255)的问题
Redis并没有采用数据每被访问一次,就+1的规则,而是采用一个类似于随机+1的规则:
double r = (double)rand()/RAND_MAX; ... double p = 1.0/(baseval*server.lfu_log_factor+1); if (r < p) counter++;
通过设置 lfu_log_factor
配置项来控制计数器值增加的速度,避免counter很快到255。下图是 lfu_log_factor
设置不同值时,counter的增长情况:
总结
- 如何设置缓存空间大小:设置为总数据量的15%到30%,兼顾访问性能和内存空间开销。
- 优先使用allkeys-lru策略。如果业务数据中有明显的冷热数据区分,建议使用allkeys-lru策略。
- 如果业务数据访问频繁相关不大,没有明显的冷热数据区分,建议使用allkeys-random策略。
- 如果业务中有置顶的需要,可以使用volatile-lru策略,同时不给这些置顶数据设置过期时间。
参考资料
- 24 | 替换策略:缓存满了怎么办?