「Redis」字串

壹言發表於2020-10-11

原文網址 : https://www.cnblogs.com/chxuan/p/13799992.html

原文連結：https://www.changxuan.top/?p=1109

簡介

Redis 中自定義的字串結構。

字串是 Redis 中最常用的一種資料型別，在 Redis 中專門封裝了一個字串結構體——簡單動態字串（Simple Dynamic String, SDS）。其結構體如下：

struct sdshdr {
    // 記錄 buf 陣列中已使用位元組的數量既 SDS 中所儲存字串的長度
    int len;
    // 記錄 buf 陣列中未使用位元組的數量
    int free;
    // 位元組陣列，用於儲存字串。
    char buf[];
}

當 len 的值為 8 時，表示在 buf 陣列中儲存了一個 8 位元組長的字串；當 free 的值為 2 時，表示在 buf 陣列中還有兩個位元組的空間未使用。如果為 0 ，則表示當前 buf 陣列的空間已經全部分配完畢；buf 則是一個 char 型別的陣列。SDS 遵循了C字串以空字元結尾的慣例，即儲存在 buf 中的字串末尾都會緊跟一個空字元 \0 ，這個空字元對於使用者來說是透明的，它並不會被計入 len 中。

優點

為什麼要在 Redis 中要自定義字串的資料結構？

1 時間複雜度

首先，由上面程式碼我們可以知道通過 SDS 獲取字串的長度的時間複雜度為 O(1)。而如果使用 C 字串每次獲取字串長度時的時間複雜度則為 O(N)。即當我們使用 STRLEN 命令獲取某個鍵值的長度時不用擔心效能問題。

2 緩衝區溢位

其次，可以避免緩衝區溢位問題。例如，兩個C字串在記憶體中緊挨著，如果沒有提前給前一個字串分配足夠空間的情況下就使用 strcat 函式在其末尾追加新的字串。那麼新拼接的字串就會溢位到後一個字串的空間中，從而導致後一個字串的內容發生改變。但是在 SDS 中，對內容進行修改之前會先檢查其記憶體空間是否滿足要求，如果不滿足要求，則會自動將空間擴充套件至所需要的大小。擴充套件空間大小的操作對於使用者來說也是透明的。

另外，為了避免可能由於頻繁的修改字串內容，而導致產生較為耗時的記憶體重分配問題。SDS 通過以空間換時間的方式即未使用空間來儘量避免這種問題。在 SDS中實現了空間預分配和惰性空間釋放兩種優化策略。

優化策略

空間預分配

當 SDS 中的字串變長時，程式先判斷當前閒置空間是否滿足需求。如果不滿足，則按照空間預分配的策略對空間進行擴充套件。Redis 不僅僅只分配所需要的空間大小，則是根據規則多分配一些空間。當 SDS 修改後的新值長度小於 1MB（len 的長度）。那麼程式將會分配和 len 同樣大小的閒置空間，即 len = free 。buf 陣列的實際長度則是 len + free + 1 位元組。如果修改後的新值大於等於 1MB，程式則會分配 1MB 的未使用空間。

如此一來，就不需要每次增加字串長度時必須對記憶體重新分配，從而提高了系統效能。

惰性空間釋放

當 SDS 中的字串變短時，程式並不是直接進行記憶體重分配回收多餘的空間，而是使用 free 記錄下來。如果將來再變長時，可以直接使用。

通過惰性空間釋放，避免了縮短字串時產生的記憶體重分配操作。

3 二進位制安全

由於C字串的特殊性，在一些場景中會出現問題。如，一個字串中存在多個空字元，那麼C字串只能識別出第一個空字元之前的內容。且C字串只能儲存文字資料。

而 SDS 的 API 都是二進位制安全的，所有的 API 都會以處理二進位制的方式來處理 SDS 存放在 buf 陣列中的資料，以保證資料寫入前與讀取後的一致性。

4 相容部分C字串函式

避免了重複造輪子的問題。

SDS API

函式	作用	備註
sdsnew	建立一個包含給定 C 字串的 SDS
sdsempty	建立一個不包含任何內容的空 SDS
sdsfree	釋放給定的 SDS
sdslen	返回 SDS 已使用的空間位元組數
sdsavail	返回SDS 未使用的空間位元組數
sdsdump	建立一個給定 SDS 的副本
sdsclear	清空 SDS 儲存的字串內容
sdscat	將給定的C字串拼接到 SDS字串末尾
sdscatsds	將給定的SDS字串拼接到另一個SDS字串的末尾
sdscpy	將給定的C字串複製到 SDS中，並覆蓋SDS中原有的字串
sdsgrowzero	用空字元將SDS擴充套件至給定長度
sdsrange	保留SDS給定區間內的資料
sdstrim	接受一個 SDS 和一個 C字串作為引數，從 SDS 中移除所有在C字串中出現過的字元
sdscmp	對比兩個 SDS 是否相同

Redis動態字串
2020-12-05
Redis字串
Redis原始碼閱讀：Redis字串SDS
2018-06-21
Redis原始碼字串
Redis的字串物件筆記
2019-04-08
Redis字串物件筆記
SDS-redis動態字串
2022-03-30
Redis字串
《Redis 使用手冊》- 字串（PHP 版本）
2019-12-24
Redis字串PHP
redis string 簡單動態字串
2020-09-23
Redis字串
Redis—簡單動態字串（SDS）
2021-05-08
Redis字串
深入剖析Redis系列(五) - Redis資料結構之字串
2018-10-09
Redis資料結構字串
Redis 字串內部資料結構
2022-04-22
Redis字串資料結構
【Redis面試題】Redis的字串是怎麼實現的？
2019-04-07
Redis面試題字串
Redis字串型別內部編碼剖析
2018-08-09
Redis字串型別
Redis的底層實現---字串章節
2018-08-28
Redis字串
Redis基礎資料結構之字串
2019-03-26
Redis資料結構字串
Redis原始碼閱讀：sds字串實現
2018-04-04
Redis原始碼字串
Redis 設計與實現 3：字串 SDS
2020-12-25
Redis字串
Redis原始碼之SDS簡單動態字串
2023-04-11
Redis原始碼字串
深入理解Redis之簡單動態字串
2021-01-19
Redis字串
Redis筆記（4）redis五大資料型別1----string（字串）
2020-12-04
Redis筆記大資料資料型別字串
Redis 五大資料型別之 String（字串）
2020-09-11
Redis大資料資料型別字串
實戰Redis序列化效能測試(Kryo和字串)
2022-06-04
Redis字串
見微知著 —— Redis 字串精緻的內部結構
2019-03-04
Redis字串
（三分鐘系列）詳解Redis字串內部結構
2018-09-10
Redis字串
見微知著——Redis字串內部結構原始碼分析
2018-09-06
Redis字串原始碼
Redis的字串底層是啥？為了速度和安全做了啥？
2020-07-20
Redis字串
redis資料結構原始碼閱讀——字串編碼過程
2020-11-17
Redis資料結構原始碼字串編碼
深入理解Redis 資料結構—簡單動態字串sds
2021-11-29
Redis資料結構字串
C# redis叢集批量操作之slot計算出16384個字串
2020-11-25
C#Redis字串
Redis系列(一)底層資料結構之簡單動態字串
2020-01-07
Redis資料結構字串
面試官：Redis中字串的內部實現方式是什麼？
2022-03-08
面試Redis字串
字串-字串分割
2019-03-17
字串
Redis 的基礎資料結構（一）可變字串、連結串列、字典
2019-02-24
Redis資料結構字串
Redis 設計與實現 6：五大資料型別之字串
2020-12-29
Redis大資料資料型別字串
一個簡單的字串，為什麼 Redis 要設計的如此特別
2021-01-11
字串Redis
字串-簡單字串排序
2019-03-18
字串排序
xml字串轉JSON字串
2024-09-19
XML字串JSON
跟著大彬讀原始碼 - Redis 7 - 物件編碼之簡單動態字串
2019-07-29
原始碼Redis物件字串
字串-簡單字串比較
2019-03-18
字串
字串查詢（字串雜湊）
2020-11-10
字串