簡單動(dòng)態(tài)字符串(Simple Dynamic String)SDS,用作Redis 的默認(rèn)字符串。
C語言中的字符串:以空字符結(jié)尾的字符數(shù)組
redis > SET msg "hello world" OK
我們通過 SET 在 Redis 數(shù)據(jù)庫中創(chuàng)建了一個(gè)數(shù)據(jù)鍵對(duì)象為 "msg" 和 數(shù)據(jù)值對(duì)象為 "hello world" 的鍵值對(duì),其中數(shù)據(jù)鍵和數(shù)據(jù)值對(duì)象底層的字符串實(shí)現(xiàn)都是 SDS 。同時(shí), SDS 還被用于 AOF 緩沖區(qū)。
struct sdshdr { # 記錄 buf 數(shù)組中已使用字節(jié)的數(shù)量,即當(dāng)前字符串長度值 # 等于 SDS 所保存字符串的字節(jié)長度 int len; # 記錄 buf 數(shù)組中未使用字節(jié)的數(shù)量,buf空余可用的長度,append時(shí)使用 int free; # 字節(jié)char數(shù)組,用于保存字符串,實(shí)際保存字符串?dāng)?shù)據(jù),最后一個(gè)字節(jié)保存了空字符 '\0' char buf[]; };
buf 屬性的字節(jié)數(shù)組中的字符串長度等于 len 屬性值加上1,因?yàn)?Redis遵循 C語言的規(guī)范,在SDS數(shù)據(jù)類型字符串的結(jié)尾加上了 空字符串,額外占用 1 個(gè)字節(jié)空間,這1個(gè)字節(jié)空間不計(jì)算在 SDS 的 len屬性里面。
由于SDS將字符串的結(jié)尾加上了 空字符串符合C語言字符串規(guī)范,Redis 字符串操作可以兼容C語言中一部分字符串庫中的函數(shù),Redis 無需專門為 SDS在編寫一套函數(shù)。
Redis 通過 len屬性的值來判斷是否結(jié)束,而不是C字符串的 \0 作為結(jié)束。
上面已經(jīng)提到SDS在末尾添加了 \0 ,這樣可以兼容部分C字符串函數(shù),可以直接使用 string.h> 函數(shù)庫。
字符串實(shí)際內(nèi)容是被存放在一個(gè)數(shù)組中,如下表
struct SDST> { T capacity; // 數(shù)組容量 T len; // 數(shù)組實(shí)際長度 byte flags; // 特殊標(biāo)識(shí)位,不理睬它 byte[] content; // 數(shù)組內(nèi)容 }
當(dāng)字符串的大小超出當(dāng)前分配的capacity大小時(shí),數(shù)組將擴(kuò)容,分配更大的數(shù)組,將舊的數(shù)組拷貝到新數(shù)組中,再將增加到字符串添加進(jìn)去。
1)Redis的字符串的儲(chǔ)存方式分為2種,當(dāng)長度特別短時(shí),使用emb形式存儲(chǔ),當(dāng)長度超出44時(shí),使用raw存儲(chǔ)。
2)倆者的區(qū)別:
Redis的對(duì)象頭結(jié)構(gòu)如下:
struct RedisObject { int4 type; // 4bits int4 encoding; // 4bits int24 lru; // 24bits int32 refcount; // 4bytes void *ptr; // 8bytes,64-bit system } robj;
解析:不同的對(duì)象具有不同類型的type;同一個(gè)類型的type會(huì)有不同的存儲(chǔ)形式encoding;使用lru來記錄對(duì)象的LRU信息,每個(gè)對(duì)象都有一個(gè)引用計(jì)數(shù),當(dāng)計(jì)數(shù)為0的時(shí)候,對(duì)象就會(huì)被銷毀,內(nèi)存被回收;pre指針用來指示對(duì)象內(nèi)容具體存儲(chǔ)位置;上訴對(duì)象有結(jié)構(gòu)內(nèi)容加起來需要占用16字節(jié)的存儲(chǔ)空間。
SDS對(duì)象頭大?。簩?shí)際內(nèi)容的大小(capacity) + 3byte,3是用來存儲(chǔ)capacity + len + flags內(nèi)容加起來的長度,而content數(shù)組初始值是16,所有SDS最小的大小是19 (16+3 );
存儲(chǔ)形式如下圖:
解析:embstr將RedisObject對(duì)象頭和SDS對(duì)象連續(xù)存在一起,使用malloc方法一次分配;而raw需要倆次malloc,倆個(gè)對(duì)象頭砸死內(nèi)存地址上一般是不連續(xù)的。embstr最大能容納的字符串長度是44字節(jié)
字符串在長度小于1M之前,擴(kuò)容空間采用加倍策略,即保留100%冗余空間。當(dāng)長度大于1M,沒次擴(kuò)容只會(huì)多分配1M的冗余空間。
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
標(biāo)簽:北京 楊凌 朝陽 大慶 江蘇 臺(tái)州 吉安 果洛
巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《Redis源碼閱讀:Redis字符串SDS詳解》,本文關(guān)鍵詞 Redis,源碼,閱讀,字符串,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。