在面試間裡等候時,感覺這可真暖和呀,我那冰冷的出租屋還得蓋兩層被子才能睡著。正要把外套脫下來,我突然聽到了門外的腳步聲,隨即門被開啟,穿著乾淨滿臉清秀的青年走了進來,一股男士香水的淡香撲面而來。
面試官:Redis中基本的資料型別有哪些?
我:Redis的基本資料型別有:字串(string)、雜湊(hash)、列表(list)、集合(set)、有序集合(zset)。
面試官:字串型別的內部實現方式是什麼?
我還沉浸在上一個問題的沾沾自喜中,頓時表情凝固了,手心開始冒出冷汗。“這個。。沒有太深入瞭解”,我支支吾吾的說到。
面試官:回去等訊息吧。
這句話說的乾淨利落,然後就沒有然後了。失敗是成功的媽媽,我不氣餒,決定馬上惡補一下。
型別和編碼
首先,整明白什麼是型別?什麼是編碼?在Redis中使用物件來表示記憶體中的鍵和值。每個物件由一個叫做redisObject
結構體表示,其中有三個屬性:型別(type)、編碼(encoding)、指向具體資料的指標(ptr)。
我們通常說的字串、雜湊、列表、集合、有序集合都是redisObject
中的型別,實際上針對每一個資料結構在Redis內部都有自己底層的多種內部編碼實現,這樣是為了在合適的場景選擇合適的內部編碼,以達到記憶體空間和處理效率的平衡,這可能就是中庸之道吧。
在面試中,經常被問到的內部實現方式、內部構造、內部原理,一般指的就是redisObject
中的編碼。
字串的編碼
字串型別的編碼有如下三種:
- int:8個位元組的長整型。
- embstr:小於等於44個位元組的字串。
- raw:大於44個位元組的字串。
在3.2版本之後,embstr和raw變為了44位元組為分界,之前是以39位元組為分界。這裡以較新版本為準。
為了驗證和理解,我們使用object encoding
命令檢視一下內部編碼。
整數型別效果如下:
127.0.0.1:6379> set one-more-num 1
OK
127.0.0.1:6379> object encoding one-more-num
"int"
短字串型別效果如下:
127.0.0.1:6379> set one-more-str 萬貓學社
OK
127.0.0.1:6379> object encoding one-more-str
"embstr"
長字串型別效果如下:
127.0.0.1:6379> set one-more-str 萬貓學社|萬貓學社|萬貓學社|萬貓學社|萬貓學社|萬貓學社|萬貓學社|萬貓學社
OK
127.0.0.1:6379> object encoding one-more-str
"raw"
當然,瞭解以上細節還沒能完全“征服”面試官,我們需要更深入一些:)
簡單動態字串
在C語言中,字串是以空字元表示結尾的字元陣列。在Redis中沒有直接使用C語言的字串,而是定義了一個叫做簡單動態字串(Simple Dynamic String,SDS)的結構,並把其作為Redis預設的字串表示。
簡單動態字串有三個屬性:
len
:記錄buf字元陣列中已使用的位元組數量free
:記錄buf字元陣列中為使用的位元組數量buf[]
:字元陣列,用於儲存字串
為了理解,我們舉個例子:
127.0.0.1:6379> set one-more-str OneMore
OK
那麼,對應的簡單動態字串就是這樣的:
其中,len
為7,表示這個簡單動態字串中儲存了一個7個位元組的字串;free
為0,表示這個簡單動態字串沒有分配未使用的空間;buf是一個字元陣列,陣列的前7個位元組分別儲存了O、n、e、M、o、r、e字元,最後一個位元組是空字元\0
。
相對於C語言的字串,簡單動態字串有什麼好處呢?
- 獲取字串長度的時間複雜度為O(1)。
- 可以儲存位元組陣列,支援安全的二進位制資料儲存。
- 內部實現了記憶體空間的預分配機制,減少記憶體空間分配次數。
- 內部實現了惰性刪除機制,字串縮減後記憶體不釋放,做為預分配空間。
- API是安全的,不會造成緩衝區溢位。
面試官你等著瞧吧,今天你對我愛答不理,明天我讓你高攀不起,哈哈哈。。。
參考文獻:
《Redis設計與實現》
《Redis開發與運維》
《Redis 深度歷險:核心原理與應用實踐》
竟然已經看到這裡了,你我定是有緣人,留下你的點贊和關注,他日必成大器。
微信公眾號:萬貓學社
微信掃描二維碼
關注後回覆「電子書」
獲取12本Java必讀技術書籍