一個挺著啤酒肚,身穿格子衫,髮際線嚴重後移的中年男子,手拿著保溫杯,胳膊夾著MacBook向你走來,看樣子是架構師級別。
面試開始, 直入正題。
面試官: 你有沒有參與過秒殺系統的設計?
我: 沒有,我平時都是開發後臺管理系統、OA辦公系統、內部管理系統,從來沒有開發過秒殺系統。
面試官: 嗯...,小夥子很實誠。今天就先到這裡吧,後面有訊息會主動聯絡你。
後面還可能有訊息嗎?你們啥時候主動聯絡過我?
實話實說的被拒,八股文背的溜反而被錄取。
好吧,等我看看一燈怎麼總結的秒殺系統的八股文。
我: 參與過秒殺系統,並獨立負責過秒殺系統的架構設計(【狗頭】是的,都是我設計的)。
面試官: 這樣才對,這樣我才能接著往下問。你在設計秒殺系統的時候,怎麼防止商品超賣?比如活動中只有一臺iPhone,最終賣出100臺,肯定不行,平臺要虧錢。
我: 肯定要加鎖,不過由於秒殺系統請求量較大,一般使用分散式叢集。而Java自帶Synchronized、ReentrantLock鎖只能用在單機系統中,這時候就需要用到分散式鎖。
面試官: 你提到分散式鎖,分散式鎖都有哪些作用?
八股文這就開始了。
我:我覺得分散式鎖主要有兩個作用:
保證資料的正確性:
比如:秒殺的時候防止商品超賣,表單重複提交,介面冪等性。
避免資料重複處理:
比如:排程任務在多臺機器重複執行,快取過期所有請求都去載入資料庫。
總結八股文,還得是一燈。
面試官: 小夥子總結的挺全,你知道設計一個分散式鎖,要具有哪些特性?
我: 我覺得分散式鎖要具有以下這些特性:
互斥:同一時刻只能有一個執行緒獲得鎖。
可重入:當一個執行緒獲取鎖後,還可以再次獲取這個鎖,避免死鎖發生。
高可用:當小部分節點掛掉後,仍然能夠對外提供服務。
高效能:要做到高併發、低延遲。
支援阻塞和非阻塞:Synchronized是阻塞的,ReentrantLock.tryLock()就是非阻塞的
支援公平鎖和非公平鎖:Synchronized是非公平鎖,ReentrantLock(boolean fair)可以建立公平鎖
面試官: 小夥子,有點東西。你是怎麼設計一個分散式鎖?
我: 有幾種常用的工具都可以實現分散式鎖。
比如:關係型資料庫(例如:MySQL)、分散式資料庫(例如:Redis)、分散式協調服務框架(例如:zookeeper)
使用MySQL實現分散式鎖比較簡單,建一張表:
CREATE TABLE `distributed_lock` (
`id` bigint unsigned NOT NULL AUTO_INCREMENT COMMENT '主鍵ID',
`resource_name` varchar(200) NOT NULL DEFAULT '' COMMENT '資源名稱(唯一索引)',
PRIMARY KEY (`id`),
UNIQUE KEY `uk_resource_name` (`resource_name`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='分散式鎖';
獲取鎖的時候,就插入一條記錄。插入成功就代表獲取到鎖,插入失敗就代表獲取鎖失敗。
INSERT INTO distributed_lock (`resource_name`) VALUES ('資源1');
釋放鎖的時候,就刪除這條記錄。
DELETE FROM distributed_lock WHERE resource_name = '資源1';
實現比較簡單,不過還不能用於實際生產中,有幾個問題沒有解決:
- 這把鎖不支援阻塞,insert失敗立即就返回了。當然可以用while迴圈直到插入成功,不過自旋也會佔用CPU。
- 這把鎖不是可重入的,已經獲取到鎖的執行緒再次插入也會失敗,我們可以增加兩列,一列記錄獲取到鎖的節點和執行緒,另一列記錄加鎖次數。獲取鎖,次數加一,釋放鎖,次數減一,次數為零就刪除這把鎖。
- 這把鎖沒有過期時間,如果業務處理失敗或者機器當機,導致沒有釋放鎖,鎖就會一直存在,其他執行緒也無法獲取到鎖。我們可以增加一列鎖過期時間,再啟動一個非同步任務掃描過期時間大於當前時間的鎖就刪除。
就是這麼麻煩,我們看一下優化之後的鎖變成什麼樣了:
CREATE TABLE `distributed_lock` (
`id` bigint unsigned NOT NULL AUTO_INCREMENT COMMENT '主鍵ID',
`resource_name` varchar(200) NOT NULL DEFAULT '' COMMENT '資源名稱(唯一索引)',
`owner` varchar(200) NOT NULL DEFAULT '' COMMENT '鎖持有者(機器碼+執行緒名稱)',
`lock_count` int NOT NULL DEFAULT '0' COMMENT '加鎖次數',
`expire_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '鎖過期時間',
PRIMARY KEY (`id`),
UNIQUE KEY `uk_resource_name` (`resource_name`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='分散式鎖';
這下應該完美了吧?不行,還有個問題:
業務邏輯沒處理完,鎖過期了怎麼辦?
假如我們設定鎖過期時間是6秒,正常情況下業務邏輯可以在6秒內處理完成,但是當JVM發生FullGC或者呼叫第三方服務出現網路延遲,業務邏輯還沒處理完,鎖已經過期,被刪掉,然後被其他執行緒獲取到鎖,豈不是要出問題?
這就引入了另一個知識點“鎖續期”:
獲取鎖的同時,啟動一個非同步任務,每當業務執行到三分之一時間,也就是6秒中的第2秒的時候,就自動延長鎖過期時間,繼續延長到6秒,這樣就能保證業務邏輯處理完成之前鎖不會過期。
面試官: 小夥子,分散式鎖算是讓你玩明白了。我還想繼續問,生產中一般很少用MySQL做分散式鎖,因為MySQL併發效能跟不上。剛才提到Redis也可以實現分散式鎖,你知道該怎麼實現嗎?
我當然知道,八股文就要背全套。
我: 使用Redis實現分散式鎖,跟使用MySQL類似,也需要解決實現過程中遇到的各種問題,不過解決方案稍有不同。
最簡單的獲取鎖方式:
// 1. 獲取鎖
redis.setnx('resource_name1', 'owner1')
// 2. 釋放鎖
redis.del('resource_name1')
當“resource_name1”不存在時,set成功,也就是獲取鎖成功。
不過還需要加上過期時間,防止沒有釋放鎖。
// 1. 獲取鎖
redis.setnx('resource_name1', 'owner1')
// 2. 增加鎖過期時間
redis.exprire('resource_name1', 6, TimeUnit.SECONDS)
又引入新問題了,兩條命令不是原子的,可能獲取鎖之後還沒來得及設定過期時間就當機了,這該怎麼辦?
好辦,在Redis 2.6.12之後,提供一條複合命令:
redis.set('resource_name1', 'owner1',"NX" "EX", 6)
還有一個問題,釋放鎖的時候,並沒有判斷鎖的持有者,有可能把其他執行緒持有的鎖給釋放了,這可不行,可以這樣做:
// 釋放鎖
if ('owner1'.equals(redis.get('resource_name1'))){
redis.del('resource_name1')
}
這樣行不行呢?還不行,因為get和del兩條命令不是原子操作,需要引入Lua指令碼把兩條命令打包成一條發給Redis執行:
String script = "if redis.call('get', KEYS[1]) == ARGV[1] then return redis.call('del', KEYS[1]) else return 0 end";
redis.eval(script, Collections.singletonList('resource_name1'), Collections.singletonList('owner1'))
這樣總行了吧?還不行,還有個“鎖續期”的問題沒有解決。
更簡單了,Redis客戶端Redisson已經幫我們實現續期的功能,叫“WatchDog”(看門狗),在我們呼叫lock自動喚醒“看門狗”。
面試官: 小夥子,你可真行啊。你再講一下使用zookeeper怎麼實現分散式鎖?
我: zookeeper採用樹形節點,類似Linux目錄檔案結構,同一目錄下的節點名稱不能重複。
節點有分為四種型別:
持久節點: 一旦建立,永久儲存在伺服器上,除非手動刪除。
臨時節點: 生命週期與客戶端繫結,客戶端斷開連線,節點就被自動刪除。
持久順序節點: 特性同持久節點,只是在節點名稱後面追加自增有序數字。
臨時順序節點: 特性同臨時節點,只是在節點名稱後面追加自增有序數字。
zookeeper還有個監聽-通知機制,客戶端可以在資源節點上建立watch事件。當節點發生變化,會通知客戶端,客戶端可以根據變化做相應的業務處理。
我們可以利用臨時順序節點的特性建立分散式鎖,分以下三步:
- 在資源/resource1目錄下建立臨時順序節點node
- 獲取/resource1目錄下的所有節點,如果當前節點序號最小,代表加鎖成功
- 如果不是,就是watch監聽序號最小的節點
實現邏輯很簡單,我們來分析一下zookeeper實現分散式鎖的優點:
- 由於建立的臨時節點,斷開連線後自動刪除,所以無需設定鎖超時時間,也就不用考慮不釋放和鎖續期
- 由於節點上儲存的建立人資訊,鎖也就支援可重入
- 由於可以監聽節點,也就實現了可阻塞
面試官: 小夥子,升級加薪的機會就是留給你這樣的人。薪資double,明天就來上班吧。
總結:
關於分散式鎖的所有知識點,雖然很多,但都已經總結在這張圖上了,歡迎點贊收藏轉發評論。