Redis 內部使用一個 RedisObject 物件來表示所有的 key 和 value,RedisObject 中的 type,則是代表一個 value 物件具體是何種資料型別,它包含字串(String)、連結串列(List)、雜湊結構(Hash)、集合(Set)、有序集合(Sorted set)。
日常工作中我們儲存物件資訊的時候,一般有兩種做法,一種是用 Hash 儲存,另一種是 String 儲存。但好像並沒有所謂的最佳實踐,那麼實際上到底用什麼資料結構儲存更好呢?
首先簡單回顧下,Redis 的 Hash 和 String 結構。
String
String 資料結構是簡單的 key-value 型別,value 其實不僅是 String,也可以是數字。Redis 中的 String 可以表示很多語義:
-
字串(bits)
-
整數
-
浮點數
這三種型別,Redis 會根據具體的場景完成自動轉換,並且根據需要選取底層的承載方式。String 在Redis 內部儲存預設就是一個字串,被 RedisObject 所引用,當遇到 incr、decr 等操作時會轉成數值型進行計算,此時 RedisObject 的 encoding 欄位為int。
在儲存過程中,我們可以將使用者資訊使用 Json 序列化成字串,然後將序列化後的字串存入 Redis 進行快取。
由於 Redis 的字串是動態字串,可以修改,內部結構類似於 Java 的 ArrayList,採用預分配冗餘空間的方式來減少記憶體的頻繁分配。如上圖所示,內部為當前字串實際分配的空間 capacity,一般高於實際字串長度 len。
假設我們要儲存的結構是:
{
"name": "xiaowang",
"age": "35"
}
如果此時將此使用者資訊的 name 改為“xiaoli”,再存到 Redis 中,Redis 是不需要重新分配空間的。而且我們在讀取和儲存資料的時候只需要對做 Json 序列化與反序列化,比較方便。
Hash
Hash 在很多程式語言中都有著很廣泛的應用,而在 Redis 中也是如此。在 Redis 中,Hash 常常用來快取一些物件資訊,如使用者資訊、商品資訊、配置資訊等,因此也被稱為字典(dictionary),Redis 的字典使用 Hash table 作為底層實現, 一個 Hash table 裡面可以有多個雜湊表節點,而每個雜湊表節點儲存了字典中的一個鍵值對。實際上,Redis 資料庫底層也是採用 Hash table 來儲存鍵值對的。
Redis 的 Hash 相當於 Java 的 HashMap,內部結構實現與 HashMap 一致,即陣列+連結串列結構。只是 reHash 方式不一樣。
前面說到 String 適合儲存使用者資訊,而 Hash 結構也可以儲存使用者資訊,不過是對每個欄位單獨儲存,因此可以在查詢時獲取部分欄位的資訊,節省網路流量。不過 Redis 的 Hash 的值只能是字串,儲存上面的那個例子還好,如果儲存的使用者資訊變為:
{
"name": "xiaowang",
"age": 25,
"clothes": {
"shirt": "gray",
"pants": "read"
}
}
那麼該如何儲存"clothes"屬性又變成了該用 String 還是 Hash 的問題。
String 和 Hash 佔用記憶體的比較
既然兩種資料結構都可以儲存結構體資訊。到底哪種更加合適呢?
首先我們用程式碼先插入 10000 條資料,然後用視覺化工具來看看記憶體的佔用情況。
const Redis = require("ioRedis");
const Redis0 = new Redis({port: 6370});
const Redis1 = new Redis({port: 6371});
const user = {
name: 'name12345',
age: 16,
avatar: 'https://dss3.bdstatic.com/70cFv8Sh_Q1YnxGkpoWK1HF6hhy/it/u=256767015,24101428&fm=26&gp=0.jpg',
phone: '13111111111',
email: '1111111@11.email',
lastLogon: '2021-04-28 10:00:00',
}
async function main() {
for (let i = 0; i < 10000; i++) {
await Redis0.set(`String:user:${i}`, Json.Stringify(user));
await Redis1.hmset(`Hash:user:${i}`, user);
}
}
main().then(process.exit);
先看 Redis0:
再來看看 Redis1:
可以看到還是有點差距的,但是差距並不明顯。
網友討論
網上的使用者也有同樣的疑問, 因為值的長度是不確定的,所以不知道採用 String 還是 Hash 儲存更有效率。
這裡我主要給大家翻譯下該問題下優質的答案:
適合用 String 儲存的情況:
-
每次需要訪問大量的欄位
-
儲存的結構具有多層巢狀的時候
適合用 Hash 儲存的情況:
-
在大多數情況中只需要訪問少量欄位
-
自己始終知道哪些欄位可用,防止使用 mget 時獲取不到想要的資料
總結
本文主要介紹了Redis 儲存物件資訊是用 Hash 還是 String,建議是大部分情況下使用 String 儲存就好,畢竟在儲存具有多層巢狀的物件時方便很多,佔用的空間也比 Hash 小。當我們需要儲存一個特別大的物件時,而且在大多數情況中只需要訪問該物件少量的欄位時,可以考慮使用 Hash。