Redis幾個認識誤區（轉）

物理狂人發表於2011-12-07

1. Redis是什麼

這個問題的結果影響了我們怎麼用Redis。如果你認為Redis是一個key value store, 那可能會用它來代替MySQL；如果認為它是一個可以持久化的cache, 可能只是它儲存一些頻繁訪問的臨時資料。Redis是REmote DIctionary Server的縮寫，在Redis在官方網站的的副標題是A persistent key-value database with built-in net interface written in ANSI-C for Posix systems，這個定義偏向key value store。還有一些看法則認為Redis是一個memory database，因為它的高效能都是基於記憶體操作的基礎。另外一些人則認為Redis是一個data structure server，因為Redis支援複雜的資料特性，比如List, Set等。對Redis的作用的不同解讀決定了你對Redis的使用方式。

網際網路資料目前基本使用兩種方式來儲存，關聯式資料庫或者key value。但是這些網際網路業務本身並不屬於這兩種資料型別，比如使用者在社會化平臺中的關係，它是一個list，如果要用關聯式資料庫儲存就需要轉換成一種多行記錄的形式，這種形式存在很多冗餘資料，每一行需要儲存一些重複資訊。如果用key value儲存則修改和刪除比較麻煩，需要將全部資料讀出再寫入。Redis在記憶體中設計了各種資料型別，讓業務能夠高速原子的訪問這些資料結構，並且不需要關心持久儲存的問題，從架構上解決了前面兩種儲存需要走一些彎路的問題。

2. Redis不可能比Memcache快

很多開發者都認為Redis不可能比Memcached快，Memcached完全基於記憶體，而Redis具有持久化儲存特性，即使是非同步的，Redis也不可能比Memcached快。但是測試結果基本是Redis佔絕對優勢。一直在思考這個原因，目前想到的原因有這幾方面。

Libevent。和Memcached不同，Redis並沒有選擇libevent。Libevent為了迎合通用性造成程式碼龐大(目前Redis程式碼還不到libevent的1/3)及犧牲了在特定平臺的不少效能。Redis用libevent中兩個檔案修改實現了自己的epoll event loop(4)。業界不少開發者也建議Redis使用另外一個libevent高效能替代libev，但是作者還是堅持Redis應該小巧並去依賴的思路。一個印象深刻的細節是編譯Redis之前並不需要執行./configure。
CAS問題。CAS是Memcached中比較方便的一種防止競爭修改資源的方法。CAS實現需要為每個cache key設定一個隱藏的cas token，cas相當value版本號，每次set會token需要遞增，因此帶來CPU和記憶體的雙重開銷，雖然這些開銷很小，但是到單機10G+ cache以及QPS上萬之後這些開銷就會給雙方相對帶來一些細微效能差別(5)。

3. 單臺Redis的存放資料必須比實體記憶體小

Redis的資料全部放在記憶體帶來了高速的效能，但是也帶來一些不合理之處。比如一箇中型網站有100萬註冊使用者，如果這些資料要用Redis來儲存，記憶體的容量必須能夠容納這100萬使用者。但是業務實際情況是100萬使用者只有5萬活躍使用者，1周來訪問過1次的也只有15萬使用者，因此全部100萬使用者的資料都放在記憶體有不合理之處，RAM需要為冷資料買單。

這跟作業系統非常相似，作業系統所有應用訪問的資料都在記憶體，但是如果實體記憶體容納不下新的資料，作業系統會智慧將部分長期沒有訪問的資料交換到磁碟，為新的應用留出空間。現代作業系統給應用提供的並不是實體記憶體，而是虛擬記憶體(Virtual Memory)的概念。

基於相同的考慮，Redis 2.0也增加了VM特性。讓Redis資料容量突破了實體記憶體的限制。並實現了資料冷熱分離。

4. Redis的VM實現是重複造輪子

Redis的VM依照之前的epoll實現思路依舊是自己實現。但是在前面作業系統的介紹提到OS也可以自動幫程式實現冷熱資料分離，Redis只需要OS申請一塊大記憶體，OS會自動將熱資料放入實體記憶體，冷資料交換到硬碟，另外一個知名的“理解了現代作業系統(3)”的Varnish就是這樣實現，也取得了非常成功的效果。

作者antirez在解釋為什麼要自己實現VM中提到幾個原因(6)。主要OS的VM換入換出是基於Page概念，比如OS VM1個Page是4K, 4K中只要還有一個元素即使只有1個位元組被訪問，這個頁也不會被SWAP, 換入也同樣道理，讀到一個位元組可能會換入4K無用的記憶體。而Redis自己實現則可以達到控制換入的粒度。另外訪問作業系統SWAP記憶體區域時block程式，也是導致Redis要自己實現VM原因之一。

5. 用get/set方式使用Redis

作為一個key value存在，很多開發者自然的使用set/get方式來使用Redis，實際上這並不是最優化的使用方法。尤其在未啟用VM情況下，Redis全部資料需要放入記憶體，節約記憶體尤其重要。

假如一個key-value單元需要最小佔用512位元組，即使只存一個位元組也佔了512位元組。這時候就有一個設計模式，可以把key複用，幾個key-value放入一個key中，value再作為一個set存入，這樣同樣512位元組就會存放10-100倍的容量。

這就是為了節約記憶體，建議使用hashset而不是set/get的方式來使用Redis，詳細方法見參考文獻(7)。

6. 使用aof代替snapshot

Redis有兩種儲存方式，預設是snapshot方式，實現方法是定時將記憶體的快照(snapshot)持久化到硬碟，這種方法缺點是持久化之後如果出現crash則會丟失一段資料。因此在完美主義者的推動下作者增加了aof方式。aof即append only mode，在寫入記憶體資料的同時將操作命令儲存到日誌檔案，在一個併發更改上萬的系統中，命令日誌是一個非常龐大的資料，管理維護成本非常高，恢復重建時間會非常長，這樣導致失去aof高可用性本意。另外更重要的是Redis是一個記憶體資料結構模型，所有的優勢都是建立在對記憶體複雜資料結構高效的原子操作上，這樣就看出aof是一個非常不協調的部分。

其實aof目的主要是資料可靠性及高可用性，在Redis中有另外一種方法來達到目的：Replication。由於Redis的高效能，複製基本沒有延遲。這樣達到了防止單點故障及實現了高可用。

小結

要想成功使用一種產品，我們需要深入瞭解它的特性。Redis效能突出，如果能夠熟練的駕馭，對國內很多大型應用具有很大幫助。希望更多同行加入到Redis使用及程式碼研究行列。

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/24104518/viewspace-712905/，如需轉載，請註明出處，否則將追究法律責任。

軟體測試認識中的誤區 (轉)
2007-08-15
當前Java軟體開發中幾種認識誤區
2006-09-03
Java
Linux新手常見的7個認知誤區，你中了幾個？
2022-09-02
Linux
認識Redis
2024-06-18
Redis
對軟體測試的認識誤區
2018-07-12
消除認識誤區--關於我國MRPⅡ應用的思考（轉）
2007-08-05
認識Redis叢集——Redis Cluster
2020-11-19
Redis
Redis(1)_Redis的基本認識
2024-04-23
Redis
認識 6 個被誤解的 Ruby 特性
2012-06-12
軟體測試用例的認識誤區有哪些？
2018-07-16
技術人溝通中的幾個誤區
2019-03-02
新手知識：認識(轉)
2007-08-10
人臉識別技術運用中的認知誤區
2019-12-23
[Windows程式設計] DLL_THREAD_DETACH 認識誤區薦
2009-06-01
Windows程式設計thread
創業和程式設計的7個錯誤認識
2011-07-04
創業程式設計
Redis日常運維-基礎認識
2020-07-11
Redis運維
幾個shell程式設計小知識(轉)
2007-08-11
程式設計
Windows口令管理的4個誤區(轉)
2007-08-10
Windows
Linux的這七大認識誤區，你千萬別有！
2023-05-09
Linux
zt 認識ITIL：企業實施ITIL的十大誤區
2012-05-20
關於Linux的幾個小誤解(轉)
2007-08-11
Linux
第一章認識Redis 【Redis入門教程】
2019-02-09
Redis
IT認證價值幾何 (轉)
2007-12-23
國外資料庫十大風雲人物，你認識幾個？
2019-09-09
資料庫
PHPer必學：這幾個composer命令要認識一下！
2020-12-22
PHP
區塊鏈認知過程，幾個有意思的小故事
2018-04-26
區塊鏈
Web前端開發應該避免的幾個思維誤區
2021-09-16
Web前端
Mac OS搭建Python開發環境的幾個誤區
2018-05-22
MacPython開發環境
防毒軟體要慎用!分享防毒軟體的幾個誤區
2016-08-12
防毒
Oracle認證常識(轉)
2007-08-16
Oracle
軟體專案管理的10個誤區（轉）
2007-08-13
專案管理
認識Linux與Unix區別
2011-05-29
Linux
【Redis】redis-cluster需要注意的幾個地方
2018-09-17
Redis
企業網站建設設計中常見的幾個誤區
2021-01-13
網站
Python學習中的誤區，快來看看你中了幾個！
2021-11-18
Python
學習Web前端的七大誤區，你遇到過幾個？
2022-02-14
Web前端
【編測編學】對於軟體測試四大誤區的認識
2020-12-30
對轉義字元的認識
2016-07-26
字元