Redis 儲存物件資訊是用 Hash 還是 String

撈起月亮的漁民發表於2022-09-13

Redis 內部使用一個 RedisObject 物件來表示所有的 key 和 value,RedisObject 中的 type,則是代表一個 value 物件具體是何種資料型別,它包含字串(String)、連結串列(List)、雜湊結構(Hash)、集合(Set)、有序集合(Sorted set)。

日常工作中我們儲存物件資訊的時候,一般有兩種做法,一種是用 Hash 儲存,另一種是 String 儲存。但好像並沒有所謂的最佳實踐,那麼實際上到底用什麼資料結構儲存更好呢?

首先簡單回顧下,Redis 的 Hash 和 String 結構。

String

String 資料結構是簡單的 key-value 型別,value 其實不僅是 String,也可以是數字。Redis 中的 String 可以表示很多語義:

  • 字串(bits)

  • 整數

  • 浮點數

這三種型別,Redis 會根據具體的場景完成自動轉換,並且根據需要選取底層的承載方式。String 在Redis 內部儲存預設就是一個字串,被 RedisObject 所引用,當遇到 incr、decr 等操作時會轉成數值型進行計算,此時 RedisObject 的 encoding 欄位為int。

在儲存過程中,我們可以將使用者資訊使用 Json 序列化成字串,然後將序列化後的字串存入 Redis 進行快取。

String 資料結構

由於 Redis 的字串是動態字串,可以修改,內部結構類似於 Java 的 ArrayList,採用預分配冗餘空間的方式來減少記憶體的頻繁分配。如上圖所示,內部為當前字串實際分配的空間 capacity,一般高於實際字串長度 len。

假設我們要儲存的結構是:

{
  "name": "xiaowang",
  "age": "35"
}

如果此時將此使用者資訊的 name 改為“xiaoli”,再存到 Redis 中,Redis 是不需要重新分配空間的。而且我們在讀取和儲存資料的時候只需要對做 Json 序列化與反序列化,比較方便。

Hash

Hash 在很多程式語言中都有著很廣泛的應用,而在 Redis 中也是如此。在 Redis 中,Hash 常常用來快取一些物件資訊,如使用者資訊、商品資訊、配置資訊等,因此也被稱為字典(dictionary),Redis 的字典使用 Hash table 作為底層實現, 一個 Hash table 裡面可以有多個雜湊表節點,而每個雜湊表節點儲存了字典中的一個鍵值對。實際上,Redis 資料庫底層也是採用 Hash table 來儲存鍵值對的。

Redis 的 Hash 相當於 Java 的 HashMap,內部結構實現與 HashMap 一致,即陣列+連結串列結構。只是 reHash 方式不一樣。

Hash 資料結構

前面說到 String 適合儲存使用者資訊,而 Hash 結構也可以儲存使用者資訊,不過是對每個欄位單獨儲存,因此可以在查詢時獲取部分欄位的資訊,節省網路流量。不過 Redis 的 Hash 的值只能是字串,儲存上面的那個例子還好,如果儲存的使用者資訊變為:

{
  "name": "xiaowang",
  "age": 25,
  "clothes": {
    "shirt": "gray",
    "pants": "read"
  }
}

那麼該如何儲存"clothes"屬性又變成了該用 String 還是 Hash 的問題。

String 和 Hash 佔用記憶體的比較

既然兩種資料結構都可以儲存結構體資訊。到底哪種更加合適呢?

首先我們用程式碼先插入 10000 條資料,然後用視覺化工具來看看記憶體的佔用情況。

const Redis = require("ioRedis");
const Redis0 = new Redis({port: 6370});
const Redis1 = new Redis({port: 6371});


const user = {
  name: 'name12345',
  age: 16,
  avatar: 'https://dss3.bdstatic.com/70cFv8Sh_Q1YnxGkpoWK1HF6hhy/it/u=256767015,24101428&fm=26&gp=0.jpg',
  phone: '13111111111',
  email: '1111111@11.email',
  lastLogon: '2021-04-28 10:00:00',
}


async function main() {
  for (let i = 0; i < 10000; i++) {
    await Redis0.set(`String:user:${i}`, Json.Stringify(user));
    await Redis1.hmset(`Hash:user:${i}`, user);
  }
}

main().then(process.exit);

先看 Redis0:

再來看看 Redis1:

可以看到還是有點差距的,但是差距並不明顯。

網友討論

網上的使用者也有同樣的疑問, 因為值的長度是不確定的,所以不知道採用 String 還是 Hash 儲存更有效率。

截圖來源於 StackOverflow(Redis Strings vs Redis Hashes to represent Json: efficiency?)

這裡我主要給大家翻譯下該問題下優質的答案:

適合用 String 儲存的情況:

  • 每次需要訪問大量的欄位

  • 儲存的結構具有多層巢狀的時候

適合用 Hash 儲存的情況:

  • 在大多數情況中只需要訪問少量欄位

  • 自己始終知道哪些欄位可用,防止使用 mget 時獲取不到想要的資料

總結

本文主要介紹了Redis 儲存物件資訊是用 Hash 還是 String,建議是大部分情況下使用 String 儲存就好,畢竟在儲存具有多層巢狀的物件時方便很多,佔用的空間也比 Hash 小。當我們需要儲存一個特別大的物件時,而且在大多數情況中只需要訪問該物件少量的欄位時,可以考慮使用 Hash。

相關文章