花了大量時間整理了這套Redis面試題
首發50題,絕無僅有,從入門到精通
從基礎,高階知識點,再到叢集,運維,方案…
弄明白了這些題可以說可以成為麵霸了
面試官都得折服,Redis學得怎麼樣,都來檢驗下吧
1、什麼是Redis?
Redis本質上是一個Key-Value型別的記憶體資料庫,很像memcached,整個資料庫統統載入在記憶體當中進行操作,定期通過非同步操作把資料庫資料flush到硬碟上進行儲存。因為是純記憶體操作,Redis的效能非常出色,每秒可以處理超過 10萬次讀寫操作,是已知效能最快的Key-Value DB。 Redis的出色之處不僅僅是效能,Redis最大的魅力是支援儲存多種資料結構,此外單個value的最大限制是1GB,不像 memcached只能儲存1MB的資料,因此Redis可以用來實現很多有用的功能,比方說用他的List來做FIFO雙向連結串列,實現一個輕量級的高性 能訊息佇列服務,用他的Set可以做高效能的tag系統等等。另外Redis也可以對存入的Key-Value設定expire時間,因此也可以被當作一 個功能加強版的memcached來用。 Redis的主要缺點是資料庫容量受到實體記憶體的限制,不能用作海量資料的高效能讀寫,因此Redis適合的場景主要侷限在較小資料量的高效能操作和運算上。
2、Redis相比memcached有哪些優勢?
(1) memcached所有的值均是簡單的字串,redis作為其替代者,支援更為豐富的資料型別
(2) redis的速度比memcached快很多
(3) redis可以持久化其資料
3、Redis支援哪幾種資料型別?
String、List、Set、Sorted Set、hashes
4、Redis主要消耗什麼物理資源?
redis是一種基於記憶體高效能的資料庫--- 主要依賴於記憶體
記憶體。
5、Redis的全稱是什麼?
Remote Dictionary Server。
6、Redis有哪幾種資料淘汰策略?
noeviction:返回錯誤當記憶體限制達到並且客戶端嘗試執行會讓更多記憶體被使用的命令(大部分的寫入指令,但DEL和幾個例外)
allkeys-lru: 嘗試回收最少使用的鍵(LRU),使得新新增的資料有空間存放。
volatile-lru: 嘗試回收最少使用的鍵(LRU),但僅限於在過期集合的鍵,使得新新增的資料有空間存放。
allkeys-random: 回收隨機的鍵使得新新增的資料有空間存放。
volatile-random: 回收隨機的鍵使得新新增的資料有空間存放,但僅限於在過期集合的鍵。
volatile-ttl: 回收在過期集合的鍵,並且優先回收存活時間(TTL)較短的鍵,使得新新增的資料有空間存放。
7、Redis官方為什麼不提供Windows版本?
因為目前Linux版本已經相當穩定,而且使用者量很大,無需開發windows版本,反而會帶來相容性等問題。
8、一個字串型別的值能儲存最大容量是多少?
512M
9、為什麼Redis需要把所有資料放到記憶體中?
Redis為了達到最快的讀寫速度將資料都讀到記憶體中,並通過非同步的方式將資料寫入磁碟。所以redis具有快速和資料持久化的特徵。如果不將資料放在記憶體中,磁碟I/O速度為嚴重影響redis的效能。在記憶體越來越便宜的今天,redis將會越來越受歡迎。 如果設定了最大使用的記憶體,則資料已有記錄數達到記憶體限值後不能繼續插入新值。
10、Redis叢集方案應該怎麼做?都有哪些方案?
1.twemproxy,大概概念是,它類似於一個代理方式,使用方法和普通redis無任何區別,設定好它下屬的多個redis例項後,使用時在本需要連線redis的地方改為連線twemproxy,它會以一個代理的身份接收請求並使用一致性hash演算法,將請求轉接到具體redis,將結果再返回twemproxy。使用方式簡便(相對redis只需修改連線埠),對舊專案擴充套件的首選。 問題:twemproxy自身單埠例項的壓力,使用一致性hash後,對redis節點數量改變時候的計算值的改變,資料無法自動移動到新的節點。
2.codis,目前用的最多的叢集方案,基本和twemproxy一致的效果,但它支援在 節點數量改變情況下,舊節點資料可恢復到新hash節點。
3.redis cluster3.0自帶的叢集,特點在於他的分散式演算法不是一致性hash,而是hash槽的概念,以及自身支援節點設定從節點。具體看官方文件介紹。
4.在業務程式碼層實現,起幾個毫無關聯的redis例項,在程式碼層,對key 進行hash計算,然後去對應的redis例項運算元據。 這種方式對hash層程式碼要求比較高,考慮部分包括,節點失效後的替代演算法方案,資料震盪後的自動指令碼恢復,例項的監控,等等。
11、Redis叢集方案什麼情況下會導致整個叢集不可用?
有A,B,C三個節點的叢集,在沒有複製模型的情況下,如果節點B失敗了,那麼整個叢集就會以為缺少5501-11000這個範圍的槽而不可用。
12、MySQL裡有2000w資料,redis中只存20w的資料,如何保證redis中的資料都是熱點資料?
redis記憶體資料集大小上升到一定大小的時候,就會施行資料淘汰策略。
13、Redis有哪些適合的場景?
(1)、會話快取(Session Cache)
最常用的一種使用Redis的情景是會話快取(session cache)。用Redis快取會話比其他儲存(如Memcached)的優勢在於:Redis提供持久化。當維護一個不是嚴格要求一致性的快取時,如果使用者的購物車資訊全部丟失,大部分人都會不高興的,現在,他們還會這樣嗎?
幸運的是,隨著 Redis 這些年的改進,很容易找到怎麼恰當的使用Redis來快取會話的文件。甚至廣為人知的商業平臺Magento也提供Redis的外掛。
(2)、全頁快取(FPC)
除基本的會話token之外,Redis還提供很簡便的FPC平臺。回到一致性問題,即使重啟了Redis例項,因為有磁碟的持久化,使用者也不會看到頁面載入速度的下降,這是一個極大改進,類似PHP本地FPC。
再次以Magento為例,Magento提供一個外掛來使用Redis作為全頁快取後端。
此外,對WordPress的使用者來說,Pantheon有一個非常好的外掛 wp-redis,這個外掛能幫助你以最快速度載入你曾瀏覽過的頁面。
(3)、佇列
Reids在記憶體儲存引擎領域的一大優點是提供 list 和 set 操作,這使得Redis能作為一個很好的訊息佇列平臺來使用。Redis作為佇列使用的操作,就類似於本地程式語言(如Python)對 list 的 push/pop 操作。
如果你快速的在Google中搜尋“Redis queues”,你馬上就能找到大量的開源專案,這些專案的目的就是利用Redis建立非常好的後端工具,以滿足各種佇列需求。例如,Celery有一個後臺就是使用Redis作為broker,你可以從這裡去檢視。
(4),排行榜/計數器
Redis在記憶體中對數字進行遞增或遞減的操作實現的非常好。集合(Set)和有序集合(Sorted Set)也使得我們在執行這些操作的時候變的非常簡單,Redis只是正好提供了這兩種資料結構。所以,我們要從排序集合中獲取到排名最靠前的10個使用者–我們稱之為“user_scores”,我們只需要像下面一樣執行即可:
當然,這是假定你是根據你使用者的分數做遞增的排序。如果你想返回使用者及使用者的分數,你需要這樣執行:
ZRANGE user_scores 0 10 WITHSCORES
Agora Games就是一個很好的例子,用Ruby實現的,它的排行榜就是使用Redis來儲存資料的,你可以在這裡看到。
(5)、釋出/訂閱
最後(但肯定不是最不重要的)是Redis的釋出/訂閱功能。釋出/訂閱的使用場景確實非常多。我已看見人們在社交網路連線中使用,還可作為基於釋出/訂閱的指令碼觸發器,甚至用Redis的釋出/訂閱功能來建立聊天系統!(不,這是真的,你可以去核實)。
14、Redis支援的Java客戶端都有哪些?官方推薦用哪個?
Redisson、Jedis、lettuce等等,官方推薦使用Redisson。
15、Redis和Redisson有什麼關係?
Redisson是一個高階的分散式協調Redis客服端,能幫助使用者在分散式環境中輕鬆實現一些Java的物件 (Bloom filter, BitSet, Set, SetMultimap, ScoredSortedSet, SortedSet, Map, ConcurrentMap, List, ListMultimap, Queue, BlockingQueue, Deque, BlockingDeque, Semaphore, Lock, ReadWriteLock, AtomicLong, CountDownLatch, Publish / Subscribe, HyperLogLog)。
16、Jedis與Redisson對比有什麼優缺點?
Jedis是Redis的Java實現的客戶端,其API提供了比較全面的Redis命令的支援;Redisson實現了分散式和可擴充套件的Java資料結構,和Jedis相比,功能較為簡單,不支援字串操作,不支援排序、事務、管道、分割槽等Redis特性。Redisson的宗旨是促進使用者對Redis的關注分離,從而讓使用者能夠將精力更集中地放在處理業務邏輯上。
17、Redis如何設定密碼及驗證密碼?
設定密碼:config set requirepass 123456
授權密碼:auth 123456
18、說說Redis雜湊槽的概念?
Redis叢集沒有使用一致性hash,而是引入了雜湊槽的概念,Redis叢集有16384個雜湊槽,每個key通過CRC16校驗後對16384取模來決定放置哪個槽,叢集的每個節點負責一部分hash槽。
19、Redis叢集的主從複製模型是怎樣的?
為了使在部分節點失敗或者大部分節點無法通訊的情況下叢集仍然可用,所以叢集使用了主從複製模型,每個節點都會有N-1個複製品.
20、Redis叢集會有寫操作丟失嗎?為什麼?
Redis並不能保證資料的強一致性,這意味這在實際中叢集在特定的條件下可能會丟失寫操作。
21、Redis叢集之間是如何複製的?
非同步複製
22、Redis叢集最大節點個數是多少?
16384個。
23、Redis叢集如何選擇資料庫?
Redis叢集目前無法做資料庫選擇,預設在0資料庫。
24、怎麼測試Redis的連通性?
ping
25、Redis中的管道有什麼用?
一次請求/響應伺服器能實現處理新的請求即使舊的請求還未被響應。這樣就可以將多個命令傳送到伺服器,而不用等待回覆,最後在一個步驟中讀取該答覆。
這就是管道(pipelining),是一種幾十年來廣泛使用的技術。例如許多POP3協議已經實現支援這個功能,大大加快了從伺服器下載新郵件的過程。
26、怎麼理解Redis事務?
事務是一個單獨的隔離操作:事務中的所有命令都會序列化、按順序地執行。事務在執行的過程中,不會被其他客戶端傳送來的命令請求所打斷。
事務是一個原子操作:事務中的命令要麼全部被執行,要麼全部都不執行。
27、Redis事務相關的命令有哪幾個?
MULTI、EXEC、DISCARD、WATCH
28、Redis key的過期時間和永久有效分別怎麼設定?
EXPIRE和PERSIST命令。
29、Redis如何做記憶體優化?
儘可能使用雜湊表(hashes),雜湊表(是說雜湊表裡面儲存的數少)使用的記憶體非常小,所以你應該儘可能的將你的資料模型抽象到一個雜湊表裡面。比如你的web系統中有一個使用者物件,不要為這個使用者的名稱,姓氏,郵箱,密碼設定單獨的key,而是應該把這個使用者的所有資訊儲存到一張雜湊表裡面.
30、Redis回收程式如何工作的?
一個客戶端執行了新的命令,新增了新的資料。
Redi檢查記憶體使用情況,如果大於maxmemory的限制, 則根據設定好的策略進行回收。
一個新的命令被執行,等等。
所以我們不斷地穿越記憶體限制的邊界,通過不斷達到邊界然後不斷地回收回到邊界以下。
如果一個命令的結果導致大量記憶體被使用(例如很大的集合的交集儲存到一個新的鍵),不用多久記憶體限制就會被這個記憶體使用量超越。
**31、Redis回收使用的是什麼演算法? **
LRU演算法
32、Redis如何做大量資料插入?
Redis2.6開始redis-cli支援一種新的被稱之為pipe mode的新模式用於執行大量資料插入工作。
33、為什麼要做Redis分割槽?
分割槽可以讓Redis管理更大的記憶體,Redis將可以使用所有機器的記憶體。如果沒有分割槽,你最多隻能使用一臺機器的記憶體。分割槽使Redis的計算能力通過簡單地增加計算機得到成倍提升,Redis的網路頻寬也會隨著計算機和網路卡的增加而成倍增長。
34、你知道有哪些Redis分割槽實現方案?
客戶端分割槽就是在客戶端就已經決定資料會被儲存到哪個redis節點或者從哪個redis節點讀取。大多數客戶端已經實現了客戶端分割槽。
代理分割槽 意味著客戶端將請求傳送給代理,然後代理決定去哪個節點寫資料或者讀資料。代理根據分割槽規則決定請求哪些Redis例項,然後根據Redis的響應結果返回給客戶端。redis和memcached的一種代理實現就是Twemproxy
查詢路由(Query routing) 的意思是客戶端隨機地請求任意一個redis例項,然後由Redis將請求轉發給正確的Redis節點。Redis Cluster實現了一種混合形式的查詢路由,但並不是直接將請求從一個redis節點轉發到另一個redis節點,而是在客戶端的幫助下直接redirected到正確的redis節點。
35、Redis分割槽有什麼缺點?
涉及多個key的操作通常不會被支援。例如你不能對兩個集合求交集,因為他們可能被儲存到不同的Redis例項(實際上這種情況也有辦法,但是不能直接使用交集指令)。
同時操作多個key,則不能使用Redis事務.
分割槽使用的粒度是key,不能使用一個非常長的排序key儲存一個資料集(The partitioning granularity is the key, so it is not possible to shard a dataset with a single huge key like a very big sorted set).
當使用分割槽的時候,資料處理會非常複雜,例如為了備份你必須從不同的Redis例項和主機同時收集RDB / AOF檔案。
分割槽時動態擴容或縮容可能非常複雜。Redis叢集在執行時增加或者刪除Redis節點,能做到最大程度對使用者透明地資料再平衡,但其他一些客戶端分割槽或者代理分割槽方法則不支援這種特性。然而,有一種預分片的技術也可以較好的解決這個問題。
36、Redis持久化資料和快取怎麼做擴容?
如果Redis被當做快取使用,使用一致性雜湊實現動態擴容縮容。
如果Redis被當做一個持久化儲存使用,必須使用固定的keys-to-nodes對映關係,節點的數量一旦確定不能變化。否則的話(即Redis節點需要動態變化的情況),必須使用可以在執行時進行資料再平衡的一套系統,而當前只有Redis叢集可以做到這樣。
37、分散式Redis是前期做還是後期規模上來了再做好?為什麼?
既然Redis是如此的輕量(單例項只使用1M記憶體),為防止以後的擴容,最好的辦法就是一開始就啟動較多例項。即便你只有一臺伺服器,你也可以一開始就讓Redis以分散式的方式執行,使用分割槽,在同一臺伺服器上啟動多個例項。
一開始就多設定幾個Redis例項,例如32或者64個例項,對大多數使用者來說這操作起來可能比較麻煩,但是從長久來看做這點犧牲是值得的。
這樣的話,當你的資料不斷增長,需要更多的Redis伺服器時,你需要做的就是僅僅將Redis例項從一臺服務遷移到另外一臺伺服器而已(而不用考慮重新分割槽的問題)。一旦你新增了另一臺伺服器,你需要將你一半的Redis例項從第一臺機器遷移到第二臺機器。
38、Twemproxy是什麼?
Twemproxy是Twitter維護的(快取)代理系統,代理Memcached的ASCII協議和Redis協議。它是單執行緒程式,使用c語言編寫,執行起來非常快。它是採用Apache 2.0 license的開源軟體。 Twemproxy支援自動分割槽,如果其代理的其中一個Redis節點不可用時,會自動將該節點排除(這將改變原來的keys-instances的對映關係,所以你應該僅在把Redis當快取時使用Twemproxy)。 Twemproxy本身不存在單點問題,因為你可以啟動多個Twemproxy例項,然後讓你的客戶端去連線任意一個Twemproxy例項。 Twemproxy是Redis客戶端和伺服器端的一箇中間層,由它來處理分割槽功能應該不算複雜,並且應該算比較可靠的。
39、支援一致性雜湊的客戶端有哪些?
Redis-rb、Predis等。
40、Redis與其他key-value儲存有什麼不同?
Redis有著更為複雜的資料結構並且提供對他們的原子性操作,這是一個不同於其他資料庫的進化路徑。Redis的資料型別都是基於基本資料結構的同時對程式設計師透明,無需進行額外的抽象。
Redis執行在記憶體中但是可以持久化到磁碟,所以在對不同資料集進行高速讀寫時需要權衡記憶體,應為資料量不能大於硬體記憶體。在記憶體資料庫方面的另一個優點是, 相比在磁碟上相同的複雜的資料結構,在記憶體中操作起來非常簡單,這樣Redis可以做很多內部複雜性很強的事情。 同時,在磁碟格式方面他們是緊湊的以追加的方式產生的,因為他們並不需要進行隨機訪問。
41、Redis的記憶體佔用情況怎麼樣?
給你舉個例子: 100萬個鍵值對(鍵是0到999999值是字串“hello world”)在我的32位的Mac筆記本上 用了100MB。同樣的資料放到一個key裡只需要16MB, 這是因為鍵值有一個很大的開銷。 在Memcached上執行也是類似的結果,但是相對Redis的開銷要小一點點,因為Redis會記錄型別資訊引用計數等等。
當然,大鍵值對時兩者的比例要好很多。
64位的系統比32位的需要更多的記憶體開銷,尤其是鍵值對都較小時,這是因為64位的系統裡指標佔用了8個位元組。 但是,當然,64位系統支援更大的記憶體,所以為了執行大型的Redis伺服器或多或少的需要使用64位的系統。
42、都有哪些辦法可以降低Redis的記憶體使用情況呢?
如果你使用的是32位的Redis例項,可以好好利用Hash,list,sorted set,set等集合型別資料,因為通常情況下很多小的Key-Value可以用更緊湊的方式存放到一起。
43、檢視Redis使用情況及狀態資訊用什麼命令?
info
44、Redis的記憶體用完了會發生什麼?
如果達到設定的上限,Redis的寫命令會返回錯誤資訊(但是讀命令還可以正常返回。)或者你可以將Redis當快取來使用配置淘汰機制,當Redis達到記憶體上限時會沖刷掉舊的內容。
45、Redis是單執行緒的,如何提高多核CPU的利用率?
可以在同一個伺服器部署多個Redis的例項,並把他們當作不同的伺服器來使用,在某些時候,無論如何一個伺服器是不夠的, 所以,如果你想使用多個CPU,你可以考慮一下分片(shard)。
46、一個Redis例項最多能存放多少的keys?List、Set、Sorted Set他們最多能存放多少元素?
理論上Redis可以處理多達232的keys,並且在實際中進行了測試,每個例項至少存放了2億5千萬的keys。我們正在測試一些較大的值。
任何list、set、和sorted set都可以放232個元素。
換句話說,Redis的儲存極限是系統中的可用記憶體值。
47、Redis常見效能問題和解決方案?
(1) Master最好不要做任何持久化工作,如RDB記憶體快照和AOF日誌檔案
(2) 如果資料比較重要,某個Slave開啟AOF備份資料,策略設定為每秒同步一次
(3) 為了主從複製的速度和連線的穩定性,Master和Slave最好在同一個區域網內
(4) 儘量避免在壓力很大的主庫上增加從庫
(5) 主從複製不要用圖狀結構,用單向連結串列結構更為穩定,即:Master <- Slave1 <- Slave2 <- Slave3...
這樣的結構方便解決單點故障問題,實現Slave對Master的替換。如果Master掛了,可以立刻啟用Slave1做Master,其他不變。
48、Redis提供了哪幾種持久化方式?
RDB持久化方式能夠在指定的時間間隔能對你的資料進行快照儲存.
AOF持久化方式記錄每次對伺服器寫的操作,當伺服器重啟的時候會重新執行這些命令來恢復原始的資料,AOF命令以redis協議追加儲存每次寫的操作到檔案末尾.Redis還能對AOF檔案進行後臺重寫,使得AOF檔案的體積不至於過大.
如果你只希望你的資料在伺服器執行的時候存在,你也可以不使用任何持久化方式.
你也可以同時開啟兩種持久化方式, 在這種情況下, 當redis重啟的時候會優先載入AOF檔案來恢復原始的資料,因為在通常情況下AOF檔案儲存的資料集要比RDB檔案儲存的資料集要完整.
最重要的事情是瞭解RDB和AOF持久化方式的不同,讓我們以RDB持久化方式開始。
49、如何選擇合適的持久化方式?
一般來說, 如果想達到足以媲美PostgreSQL的資料安全性, 你應該同時使用兩種持久化功能。如果你非常關心你的資料, 但仍然可以承受數分鐘以內的資料丟失,那麼你可以只使用RDB持久化。
有很多使用者都只使用AOF持久化,但並不推薦這種方式:因為定時生成RDB快照(snapshot)非常便於進行資料庫備份, 並且 RDB 恢復資料集的速度也要比AOF恢復的速度要快,除此之外, 使用RDB還可以避免之前提到的AOF程式的bug。
50、修改配置不重啟Redis會實時生效嗎?
針對執行例項,有許多配置選項可以通過 CONFIG SET 命令進行修改,而無需執行任何形式的重啟。 從 Redis 2.2 開始,可以從 AOF 切換到 RDB 的快照永續性或其他方式而不需要重啟 Redis。檢索 ‘CONFIG GET *’ 命令獲取更多資訊。
但偶爾重新啟動是必須的,如為升級 Redis 程式到新的版本,或者當你需要修改某些目前 CONFIG 命令還不支援的配置引數的時候。