redis ziplist剖析
说明
本篇文章介绍redis的ziplist结构。ziplist跟zipmap一样,是在以节约内存为前提下的一个双向链表存储结构,他有着比zipmap更高的压缩率:
- 字符串如果能转成整形的话会转成整形存储
- 不会向zipmap一样预留free空间,所以所有插入和删除操作都会导致内存重新分配
redis在元素较少的情况下使用ziplist来替代dict
实现
同样跟zipmap一样,ziplist也是一个char数组,使用约定好的格式来存放每一个元素,但是格式会比zipmap复杂很多,特别是插入和删除可能会导致一系列瀑布式更改后面entry的内存。下面是ziplist的内存格式:<zlbytes><zltail><zllen><entry><entry><zlend>
- zlbytes:4 bytes,unsigned int,存放ziplist实际使用的内存大小,通过它能够迅速的定位到ziplist的尾部
- zltail:4 bytes,unsigned int,存放尾部元素entry地址的偏移量,通过它能够迅速定位到尾部元素的地址
- zllen:2 bytes,存放ziplist中的元素个数,如果ziplist实际元素超过2^16-2的话,就需要遍历整个ziplist来获取元素个数,这个跟zipmap中的zmlen,但zmlen是1 byte
- zlend:1 byte,值为255,ziplist结束标记位
- entry: 每个entry里也有固定的二进制格式:
<prevlen><encode+len><value>
- prevlen:1 byte/5 bytes,前一个元素的entry占用大小,如果前一个entry长度<254则,使用1 byte来存储,否则第一个byte赋值为254,后面4 bytes存放前一个entry的长度。有了该变量,ziplist就可以做到从后往前遍历
- encode+len:value编码方式和实际占用的长度,value传入的时候为字符串,但redis会尝试将它转为整形,以节约内存。所以最终存储的value可能是字符串或者是整形,下面是一系列可能的编码方式:
- |00pppppp|:1 byte,value为字符串,且字符串长度<=63(2^6-1),长度存放在低6位中
- |01pppppp|qqqqqqqq|:2 bytes,value为字符串,且长度<=16384(2^14-1),长度存放在这两个bytes的低14位中
- |10______|qqqqqqqq|rrrrrrrr|ssssssss|tttttttt|: 5 bytes,value为字符串,且长度>=16384,长度存放在后4 bytes中
- |11000000|:1 byte,value为整形,值>=2^8且<2^16,值存放在跟在后面的两个bytes中
- |11010000|:1 byte,value为整形,值>=2^32且<2^32,值存放在跟在后面的四个bytes中
- |11100000|:1 byte,value为整形,值>=2^32且<2^64,值存放在跟在后面的八个bytes中
- |11110000|:1 byte,value为整形,值>=2^16且<2^24,值存放在跟在后面的三个bytes中
- |11111110|:1 byte,value为整形,值>=13且<2^8,值存放在跟在后面的一个byte中
- |1111xxxx|:1 byte,除去上面5中整形编码,xxxx可以存放0001到1101,即1-13,redis对这种编码做了下加减1的偏移处理,所以这种编码可以存放的范围为0-12,这样可以完整的存放所有大小的整形
因为prevlen的编码方式,所以当插入和删除节点的时候可能会导致后续一系列瀑布式更改后面entry的内存。例如:现在ziplist中存放每个entry长度正好都是253,则每个entry的prevlen只需要1 byte编码即可;这个时候如果在中间插入个entry,长度大于253,则需要更改后面那个entry的prevlen的编码方式,因为根据prevlen的编码规则,1 byte不够存储大于253的数据,需要改成5 bytes,这样会导致该entry长度原本是253长度的,变成了257,同样该entry后面的entry也需要改prevlen的编码…..这样就有可能导致一系列的内存修改操作。当然这比较极端,一般不会出现这种情况。所以redis还是采用了这种编码方式来进行节约内存的操作。
主要函数分析
函数 | 描述 | 时间复杂度 |
---|---|---|
ziplistNew | 创建一个空的ziplist | O(1) |
ziplistMerge | 合并两个ziplist, second会被追加到first的ziplist中;合并的时候采用长度较长的ziplist进行relloc,具体是哪个通过first或者second返回,没有被选择relloc的将会返回NULL | O(N) |
ziplistPush | 插入元素到ziplist中,where表示插入的位置ZIPLIST_HEAD or ZIPLIST_TAIL | O(N), N为元素个数 |
ziplistIndex | 返回ziplist中index为下标的元素,如果index为正值,则从头往后开始,下标从0开始;如果index为负值,则从后往前开始小标从-1开始,index超出范围或者ziplist为空,则会返回NULL | O(N), N为元素个数 |
ziplistNext | 返回p指向的entry的后一个节点;如果p已经是尾部,或者p下一个元素就是尾部,则返回NULL | O(1) |
ziplistPrev | 返回p指向的entry的前一个节点;如果p已经是头部,则返回NULL | O(1) |
ziplistGet | 获取p指向的entry里面的值,根据encoding方式,返回的值可能存储在sstr/sval中,如果编码为整形的话,*sstr将设置为NULL;如果p指向尾部,则返回0,否则返回1 | O(1) |
ziplistInsert | 插入数据到ziplist中的p位置 | O(N), N为元素个数 |
ziplistDelete | 删除ziplist中p指向的entry;因为删除操作会造成ziplist内存重新分配,为了循环方便,p将重新指向ziplist中原p指向的内存,即原p的下一个entry的地址 | O(N), N为元素个数 |
ziplistDeleteRange | 从ziplist的index下标开始,删除num个数量的entry | O(N), N为元素个数 |
ziplistCompare | 比较p指向的entry的内容与指定值相等,不等返回0,否则返回1 | O(1) |
ziplistFind | 从p指向的entry开始查找指定的值,找到返回entry的地址,否则返回NULL;skip参数表示,每次比较之间忽略多少个entry,例如如果是1的话,且p的小标为1的话,则会比较1,3,5,7,9小标的entry | O(N), N为元素个数 |
ziplistLen | 返回ziplist中元素数量 | O(1),如果元素超过2^16-1则为O(N), N为元素个数 |
ziplistBlobLen | 返回ziplist实际占用的内存大小 | O(1) |
每个函数的声明及作用,具体细节可以查看我注释的redis源码
1 | // 创建一个空的ziplist |