微服務分散式架構之redis篇
OneMoreWhy發表於2020-10-04
- 快速的redis有哪些慢操作?
- 雜湊衝突導致時間複雜度向連結串列傾斜,拉低查詢效率。解決方案:雜湊桶rehash。
- 一次性rehash會導致redis執行緒阻塞。解決方案:漸進式rehash,其實也是分步、分攤、分治思想。
- 集合型別的範圍操作時間複雜度降為O(n)。解決方案:用SCAN命令代替,漸進式遍歷,每次只返回部分資料。
- list型別由壓縮列表和雙向連結串列實現,時間複雜度都是O(n),但是這二者會記錄表頭和表尾的偏移量,適合用做先進先出的佇列使用。
- 壓縮列表與陣列的區別是:壓縮列表會允許儲存資料的每一個元素的容量大小不同。
- 為什麼單執行緒的redis能那麼快?
- 記憶體資料庫,記憶體操作
- 單執行緒,無執行緒上下文切換開銷,無鎖資源效能開銷
- 採用非阻塞IO多路複用技術
- hash表的大量使用
- 當機了,redis如何避免資料丟失?
- 資料持久化,兩種方式:RDB和AOF
- RDB可以在指定的時間段內對資料進行快照儲存,方便傳輸,適用於災難備份和災難恢復。fork子程式,備份的工作由子程式來做。redis意外中斷時,會丟失資料。資料集大的時候,fork會比較耗時。
- AOF將每次寫的操作追加到檔案末尾。AOF更加耐久,fsync策略可以自己設定。檔案體積大,速度可能會慢。
- 在RDB和AOF之間如何抉擇?看業務需求,看中什麼優點,能接受什麼缺點,或者兩種方式結合起來用。
- 可以呼叫save或者是bgsave命令進行手動備份。
- 寫時複製機制。
- AOF方式可以進行日誌重寫,優化,簡化。
- 當機後,redis如何實現快速恢復?
- 有了RDB和AOF兩種持久化的方式,可以使用備份的檔案對redis資料進行恢復。
- 主從庫如何實現資料一致?
- redis預設使用非同步複製
- redis複製對於master而言,是非阻塞的。對於slave而言,載入新資料集是阻塞的。
- 當master關閉了持久化和被允許自動重啟的時候,主從複製會面臨一個暗坑。master掛機,自動重啟,資料集為空,slave同步master的資料集後也變為空資料集。“天下武功,唯快不破”,master的重啟可以快到讓sentinel檢測不到。故即使配置了sentinel高可用,依然避免不了這個坑。所以在master關閉持久化的時候,需要禁止其自動重啟。
- Replication ID, offset,主從之間同步靠的是這兩個引數。
- 主庫掛了,如何不間斷服務?
- 哨兵模式,主庫掛了,能實現自動故障轉移,從從庫中選出一個庫升級為主庫。
- 哨兵掛了,主從庫還能切換嗎?
- 如果哨兵只有一個節點,確實存在單點故障問題,一旦這個哨兵掛了,就不實現自動主從切換了
- 但是哨兵一般也是需要配置多個節點,實現高可用的
- 資料增多了,是該加記憶體還是加例項?
- 資料量增多了,可以考慮分片叢集,其實也是一種分而治之的思想。分而治之是處理大資料量一種很常見的思路。
- 縱向擴充套件(scale up):升級單個 Redis 例項的資源配置,好理解,加記憶體,加磁碟,升CPU。縱向擴充套件的思路簡單粗暴,但是有明顯的缺點,面臨硬體成本,fork子程式會阻塞主執行緒,除非不要求持久化。
- 橫向擴充套件(scale out):增加Redis例項的個數。橫向擴充套件沒有縱向擴充套件的問題,但是也會面臨其他的挑戰,多個例項如何管理?
- 多個例項,如何決定某些資料入哪個例項?雜湊槽(Hash Slot)。在 Redis Cluster 方案中,一個切片叢集共有 16384 個雜湊槽,每個鍵值對都會根據它的 key,經過雜湊演算法(CRC16 演算法,然後對16384取模),被對映到一個雜湊槽中。
- cluster create 命令建立叢集,redis自動把16384個槽平均分配在所有例項上。
- cluster meet 命令手動建立例項間的連線,然後cluster addslots指定每個例項上的雜湊槽個數。
- 這麼多例項,客戶端怎麼怎麼直到它某次需要操作哪個例項?redis多個例項相互連線之後,會同步各個例項上的雜湊槽資訊,使得每個redis例項都有叢集全量的雜湊槽資訊,然後,當客戶端和叢集建立連線後,叢集會把雜湊槽的分配資訊傳送給客戶端,客戶端通過同樣的演算法,最後定位到它要操作哪個例項。
- 快取滿了怎麼辦?
- 如何解決快取擊穿、穿透和雪崩難題?
- 快取擊穿:快取中沒有,但是資料庫中有。若併發使用者多,資料庫壓力瞬間增大。原因:熱點key過期。解決方案:設定熱點key永不過期;加互斥鎖,當執行緒A發現快取中資料沒有時會去資料庫中取,此時其他執行緒要取相同的key會等待,而不是重複取請求資料庫,再重複更新快取。
- 快取穿透:快取和資料庫中都沒有資料,而使用者不斷髮起請求,此時可能是惡意攻擊。大量請求導致資料庫壓力增大。原因:極有可能是惡意攻擊。解決方案:介面層加校驗,儘量將惡意攻擊的請求資料儘早識別,儘早攔截,比較典型的方法是使用布隆過濾器對其進行過濾;將所請求的key的value值設定為null,可以將key的過期時間設定短一點,設定太長的話會導致該key在正常的情況下也無法使用,也就是誤殺,這樣可以防止惡意使用者反覆用同一條資料進行暴力攻擊。
- 快取雪崩:快取中大量資料同時失效,導致大量請求直接請求資料庫,導致資料庫壓力增大。與擊穿區別:擊穿的場景是多個請求併發請求同一條資料,而雪崩指的是多個請求大量請求多條資料。原因:快取中大量資料同時過期。解決方案:各個key的過期時間隨機設定,避免多個key的過期時間設定為同一時間;設定熱點資料永不過期;分散式快取情況下,熱點資料均勻分佈。
- redis如何實現分散式鎖?
- setnx命令加過期時間
- 用redis做分散式鎖為什麼要用lua指令碼來釋放鎖?為了保證原子性。在釋放鎖的時候,需要考慮鎖釋放的鎖的value是不是當前執行緒設定的鎖的value,所有取value,然後比較,在然後刪除對應的key,這三步是需要作為一個原子操作的,而lua指令碼執行的時候就是單執行緒,就能保證這三個操作的原子性。
- 如何應對資料傾斜?
- 針對hot key造成的資料傾斜,可以對hot key進行打散,可以對hot key加上字首或者是字尾,把一個key變成多個key,再通過分片演算法將資料儲存到不同的例項上,將訪問量分攤到各個不同的例項上。此時需要注意各個temp key的過期時間需要在原hot key的過期時間的基礎上,加上一個小的隨機正整數,這是為了防止多個key同時過期造成雪崩。
- 針對big key造成的資料傾斜,可以進行拆分,如果big key對應的big value是個大json的形式,可以通過mset 的方式將這個 key 的內容打散分佈到各個例項中。
- redis支援哪些資料型別?
- redis有哪些架構模式?各有什麼特點?
- 單機,特點是容量受限、處理能力受限、單點故障、沒做到高可用
- 主從複製,特點是可以在一定的程式上解決了容量問題和處理能力,讀壓力轉移給從庫了,但是還是存在單點故障問題,master寫的壓力問題還是沒有解決。
- 哨兵模式,特點:sentinel監控各redis節點,當某個節點出問題,sentinel會通知其他節點,當主節點出問題時,sentinel會自動進行故障轉移操作,保障了高可用。缺點是切換時會需要時間並且丟資料,還是沒有解決master的寫壓力問題
- 代理式叢集,對業務方而言,遮蔽後端多個redis複雜業務邏輯,但是針對代理層需要考慮高可用方案,擴縮容需要手動干預。
- 3.0版本後,直連式叢集,Redis-Cluster採用無中心結構模式。優點:無中心節點模式,不會因為某個節點影響整體效能;節點間資料共享,可動態調整資料分佈;實現了可擴充套件性,節點可動態新增或刪除;實現了高可用;實現了故障自動轉移。缺點:各節點之間資源隔離性差,容易相互影響;資料之間非同步複製,不能保證強一致性。
- 使用redis做非同步佇列,有什麼缺點?
- 使用List做非同步佇列,RPUSH生產訊息,LPOP消費訊息。生產者消費者模式,LPOP不等待佇列有值就直接消費,沒有消費到資料就認為是訊息被消費完畢。解決方案:應用層引入sleep機制,呼叫LPOP進行重試。
- BLPOP會在沒有訊息的時候阻塞,直到訊息到來或者是超時。缺點:只能供一個消費者消費
- pub/sub模式,釋出訂閱模式,缺點:訊息的釋出是無狀態的,無法保證訊息的可達。
- redis的記憶體淘汰策略有哪些?
- noeviction:不刪除策略,達到最大記憶體限制時,再申請記憶體時,直接返回錯誤資訊
- allkeys-lru:所有的key使用lru演算法,優先刪除最近最少使用的key
- volatile-lru:對於設定了expire的key,使用lru演算法進行優先刪除
- allkeys-random:對於所有的key,隨機刪除一部分key
- volatile-random:對於設定了expire的key,隨機刪除一部分key
- volatile-ttl:對於設定了expire的key, 優先刪除剩餘時間(time to live,TTL) 短的key
- 如果沒有設定expire的key,volatile-lru、volatile-random、volatile-ttl和noeviction一樣
- 具體選擇哪一種驅逐策略,需要根據業務場景來判斷。
- redis的併發競爭問題如何解決?
- 解決併發競爭問題的總體思路就是加鎖,將併發執行變成順序執行,並行變成序列。
- 業務客戶端加鎖,synchronized
- 使用redis自帶的incr命令,保證原子性
- 使用redis的watch命令,構建樂觀鎖
- 使用redis的setnx實現內建的鎖
- 分散式鎖,分散式鎖的實現方式有很多種
- 布隆過濾器是如何解決快取穿透的問題的?
- 首先,布隆過濾器是什麼?布隆過濾器的作用是迅速地判斷一個key是否在某個集合中,類似於HashSet,但是與HashSet不同的是,使用布隆過濾器,不需要儲存key的值。
- 布隆過濾器的原理是什麼?對一個key進行k個hash演算法,得到k個值。然後需要一個各位初始值為0的點陣圖,把點陣圖中這k個位置都置為1。在查詢的時候,用同樣的演算法,校驗這k個位置是否都為1,如果是,就說明該key存在,否則則認為該key不存在。
- 布隆過濾器的優缺點是什麼?優點:不需要儲存key,節省空間,運算都是用hash函式,運算速度快,避免了無謂地查詢redis和資料庫的開銷;缺點:可能誤判,可能把不存在的key判定為存在,但是概率比較小。redis的點陣圖只支援2的32方大小,對應於記憶體中也就是512MB,誤判率為萬分之一。另外,布隆過濾器不支援刪除操作。
- 布隆過濾器是如何解決快取穿透的問題的?流程:查詢key請求過來,先去redis裡面查,如果查不到,用布隆過濾器判定該key是否存在,不存在直接返回null,如果存在就去資料庫取,取到後寫回redis,然後返回給客戶端。
- 布隆過濾器還有其他的應用場景嗎?有的:網頁爬蟲對URL去重;反垃圾郵件;反垃圾簡訊;訊息推送去重;推薦系統去重。
- 布隆過濾器在程式碼層面如何用?google的guava包已經有相關的API。
- redis的紅鎖是有什麼作用?
- 用來實現分散式鎖。
- 有什麼優點?高可用
- 紅鎖的加鎖流程是怎麼樣的?有2n + 1個節點,這些節點之間是沒有主從也沒有叢集關係,客戶端使用相同的key和隨機值在這2n + 1個節點中請求鎖,注意請求鎖的超時時間應該小於鎖自動釋放的時間,當超過半數請求到鎖的時候,才算是真正加鎖成功,如果沒有加鎖成功,則回滾釋放已經鎖定的節點。
- redisson是幹什麼用的?有什麼優點?
- redisson是一個在Redis的基礎上實現的Java駐記憶體資料網格,功能非常強大。
- 可以用redisson實現分散式鎖,可以用watch dog機制來避免業務執行時間超過鎖過期時間而產生的鎖釋放的問題。