阿里面試這樣問：redis 為什麼把簡單的字串設計成 SDS？

程式設計師小富發表於2021-02-18

原文網址 : https://learnku.com/articles/54457?order_by=created_at&

2021開工第一天，就有小夥伴私信我，還給我分享了一道他面阿里的redis題（這傢伙絕比已經拿到年終獎了），我看了以後覺得挺有意思，題目很簡單，是那種典型的似懂非懂，常常容易被大家忽略的問題。這裡整理出來分享一下，順便自己鞏固一下基礎，希望對正在面試和想要面試的兄弟有點幫助。

題目大致是這樣的

面試官：瞭解redis的String資料結構底層實現嘛?

鐵子：當然知道，是基於SDS實現的

面試官：redis是用C語言開發的，那為啥不直接用C的字串，還單獨設計SDS這樣的結構呢?

鐵子：·····

其實看得出面試官是想看看，鐵子是隻停留在redis的使用層面，還是對底層資料結構有過更深入的研究，面試嘛都愛這樣問大家都懂得。

我們知道redis是用C寫的，但它卻沒有完全直接使用C的字串，而是自己又重新構建了一個叫簡單動態字串SDS（simple dynamic string）的抽象型別。

redis也支援使用C語言的傳統字串，只不過會用在一些不需要對字串修改的地方，比如靜態的字元輸出。

而我們開發中使用redis，往往會經常性的修改字串的值，這個時候就會用SDS來表示字串的值了。有一點值得注意：在redis資料庫中，key-value鍵值對含有字串值的，都是由SDS來實現的。

比如：在redis執行一個最簡單的set命令，這時redis會新建一個鍵值對。

127.0.0.1:6379> set xiaofu "程式設計師內點事"

此時鍵值對的key和value都是一個字串物件，而物件的底層實現分別是兩個儲存著字串xiaofu和程式設計師內點事的SDS結構。

再比如：我向一個列表中壓入資料，redis 又會新建一個鍵值對。

127.0.0.1:6379> lpush xiaofu "程式設計師內點事" "程式設計師小富"

這時候鍵值對的鍵和上邊一樣，還是一個由SDS實現的字串物件，鍵值對的值是一個包含兩個字串物件的列表物件了，而這兩個物件的底層也是由SDS實現。

SDS結構

一個SDS值的資料結構，主要由len、free、buf[]這三個屬性組成。

struct sdshdr{

  int free; // buf[]陣列未使用位元組的數量

  int len; // buf[]陣列所儲存的字串的長度

  char buf[]; // 儲存字串的陣列
}

其中buf[]為實際儲存字串的char型別陣列；free表示buf[]陣列未使用位元組的數量；len表示buf[]陣列所儲存的字串的長度。

例如上圖表示的是buf[]儲存長度為6個位元組的字串，未使用的位元組數free為0，但是眼尖的同學會發現這明明是7個字元，還有一個"\0"啊？

上邊提到過SDS沒有完全直接使用C的字串，還是沿用了一些C特性的，比如遵循C的字串以空格符結尾的規則，這樣還可以使用一部分C字串的函式。而對於SDS來說，空字串佔用的一位元組是不計算在len屬性裡的，會為他分配額外的空間。

簡單瞭解SDS結構後，下邊我們來看看SDS相比於C字串有哪些優點。

效率高

舉個例子：工作中使用redis，經常會通過STRLEN命令得到一個字串的長度，在SDS結構中len屬性記錄了字串的長度，所以我們獲取一個字串長度直接取len的值，複雜度是O(1)。

而如果用C字串，在獲取一個字串長度時，需對整個字串進行遍歷，直至遍歷到空格符結束（C中遇到空格符代表一個完整字串），此時的複雜度是O(N)。

在高併發場景下頻繁遍歷字串，獲取字串的長度很有可能成為redis的效能瓶頸，所以SDS效能更好一些。

資料溢位

上邊提到C字串是不記錄自身長度的，相鄰的兩個字串儲存的方式可能如下圖，為字串分配了合適的記憶體空間。

如果此時我想把“程式設計師內點事”改成“程式設計師內點事123”，可之前分配的記憶體只有6個位元組，修改後的字串需要9個位元組才能放下啊，怎麼搞？

沒辦法只能侵佔相鄰字串的空間，自身資料溢位導致其他字串的內容被修改。

而SDS很好的規避了這點，當我們需要修改資料時，首先會檢查當前SDS空間len是否滿足，不滿足則自動擴容空間至修改所需的大小，然後再執行修改,如下圖所示。

不過有個特殊的地方，在把“程式設計師內點事”的6個位元組擴容到“程式設計師內點事123”9個位元組後，發現free屬性的值變成了擴容後字串的總長度，這就涉及到下邊要說的記憶體重分配策略了。

記憶體重分配策略

C字串長度是一定的，所以每次在增長或者縮短字串時，都要做記憶體的重分配，而記憶體重分配演算法通常又是一個比較耗時的操作，如果程式不經常修改字串還是可以接受的。

但很不幸，redis作為一個資料庫，資料肯定會被頻繁修改，如果每次修改都要執行一次記憶體重分配，那麼就會嚴重影響效能。

SDS通過兩種記憶體重分配策略，很好的解決了字串在增長和縮短時的記憶體分配問題。

1.空間預分配

空間預分配策略用於優化SDS字串增長操作，當修改字串並需對SDS的空間進行擴充套件時，不僅會為SDS分配修改所必要的空間，還會為SDS分配額外的未使用空間free，下次再修改就先檢查未使用空間free是否滿足，滿足則不用在擴充套件空間。

通過空間預分配策略，redis可以有效的減少字串連續增長操作，所產生的記憶體重分配次數。

額外分配未使用空間free的規則：

如果對 SDS 字串修改後，len 值小於 1M，那麼此時額外分配未使用空間 free 的大小與len相等。
如果對 SDS 字串修改後，len 值大於等於 1M，那麼此時額外分配未使用空間 free 的大小為1M。

2.惰性空間釋放

惰性空間釋放策略則用於優化SDS字串縮短操作，當縮短SDS字串後，並不會立即執行記憶體重分配來回收多餘的空間，而是用free屬性將這些空間記錄下來，如果後續有增長操作，則可直接使用。

資料格式多樣性

C字串中的字元必須符合某些特定的編碼格式，而且上邊我們也提到，C字串以\0空字元結尾標識一個字串結束，所以字串裡邊是不能包含\0的，不然就會被誤認是多個。

由於這種限制，使得C字串只能儲存文字資料，像音視訊、圖片等二進位制格式的資料是無法儲存的。

redis 會以處理二進位制的方式操作Buf陣列中的資料，所以對存入其中的資料做任何的限制、過濾，只要存進來什麼樣，取出來還是什麼樣。

總結

上邊只是 redis 資料結構的一點基礎知識，沒什麼難度，但以我的面試經驗，如果被問這類問題,不要只含糊其辭的說出底層是SDS，有理有據的把為什麼這樣實現也說出來。

一來可以顯得自己基本功紮實，如果表達的在條理清晰，是個很不錯的加分項；在一個主動打消面試官問下去的念頭，當然就怕不按套路出牌的人！

整理了幾百本各類技術電子書，有需要的同學可以，在我同名公眾號回覆[ 666 ]自取。技術群快滿了，想進的同學可以加我好友，和大佬們一起吹吹技術，期待你的加入。

在這裡插入圖片描述

Redis—簡單動態字串（SDS）
2021-05-08
Redis字串
一個簡單的字串，為什麼 Redis 要設計的如此特別
2021-01-11
字串Redis
Redis原始碼之SDS簡單動態字串
2023-04-11
Redis原始碼字串
Redis 設計與實現 3：字串 SDS
2020-12-25
Redis字串
深入理解Redis 資料結構—簡單動態字串sds
2021-11-29
Redis資料結構字串
為什麼Redis這麼快？5分鐘成為Redis高手
2023-11-29
Redis
【Spring面試題】Spring 為啥預設把bean設計成單例的？
2019-04-09
Spring面試題Bean單例
簡單動態字串（simple dynamic string）SDS
2019-12-06
字串
SDS-redis動態字串
2022-03-30
Redis字串
Redis原始碼閱讀：Redis字串SDS
2018-06-21
Redis原始碼字串
為什麼redis是單執行緒的以及為什麼這麼快？
2020-04-27
Redis執行緒
Redis是單執行緒的，但Redis為什麼這麼快？
2018-12-15
Redis執行緒
阿里面試Redis常考問題
2021-08-16
阿里面試Redis
redis是單執行緒的，為什麼這麼快
2023-02-01
Redis執行緒
阿里面試官用HashMap把我問倒了
2021-05-12
阿里面試HashMap
Docker入門為什麼可以這麼簡單？
2019-01-21
Docker
Redis為什麼這麼快？
2023-03-03
Redis
為什麼要用Redis？Redis為什麼這麼快？(來自知乎)
2020-09-23
Redis
【Spring進階指南】Spring 為啥預設把bean設計成單例的？
2019-04-09
SpringBean單例
為什麼要這麼設計呢但其實它只有一把鎖
2020-09-26
Redis原始碼閱讀：sds字串實現
2018-04-04
Redis原始碼字串
刨根問底：為什麼， unity 的 Y軸使用慣性座標系旋轉，原因是什麼，為什麼要這樣設計，理由
2024-05-05
Unity
怎樣把自己培養成為一個優秀的程式設計師
2019-05-11
程式設計師
這 5 個簡單的面試題，把群炸了
2019-04-24
面試題
Python為什麼發展這麼快速?原因很簡單!
2022-05-30
Python
redis string 簡單動態字串
2020-09-23
Redis字串
pdf轉換成ppt，這樣操作很簡單
2021-02-26
程式設計師垃圾簡歷長什麼樣？
2020-03-30
程式設計師
為什麼要成為「無敵」程式設計師？
2020-03-18
程式設計師
為什麼成為一名程式設計師？
2021-12-31
程式設計師
位元組跳動面試官這樣問有關字串的問題！！
2021-02-26
面試字串
簡單認識什麼是UI設計
2018-06-10
UI
HBase的架構設計為什麼這麼厲害!
2021-01-15
架構
程式設計師你為什麼這麼累？
2018-09-14
程式設計師
學Python的程式設計師，程式設計能力都“退化”成什麼樣了？
2019-06-16
Python程式設計師
前端中的簡單程式設計題-字串（1）
2019-02-23
前端程式設計字串
阿里面試常問的redis資料結構，建議收藏
2021-01-25
阿里面試Redis資料結構
[提問交流]請問首頁怎麼呼叫公司簡介這樣的單頁呢？
2020-04-04