阿里架構師講述:網際網路的大流量專案中的負載均衡設計
在軟體系統的架構設計中,對叢集的負載均衡設計是作為高效能系統優化環節中必不可少的方案。負載均衡本質上是用於將使用者流量進行均衡減壓的,因此在網際網路的大流量專案中,其重要性不言而喻。
一、什麼是負載均衡?
早期的網際網路應用,由於使用者流量比較小,業務邏輯也比較簡單,往往一個單伺服器就能滿足負載需求。隨著現在網際網路的流量越來越大,稍微好一點的系統,訪問量就非常大了,並且系統功能也越來越複雜,那麼單臺伺服器就算將效能優化得再好,也不能支撐這麼大使用者量的訪問壓力了,這個時候就需要使用多臺機器,設計高效能的叢集來應對。
那麼,多臺伺服器是如何去均衡流量、如何組成高效能的叢集的呢?
此時就需要請出 「負載均衡器」 入場了。
負載均衡(Load Balancer)是指把使用者訪問的流量,通過「負載均衡器」,根據某種轉發的策略,均勻的分發到後端多臺伺服器上,後端的伺服器可以獨立的響應和處理請求,從而實現分散負載的效果。負載均衡技術提高了系統的服務能力,增強了應用的可用性。
(可以按照圖中去理解,圖片來源網路)
二、負載均衡方案有幾種?
目前市面上最常見的負載均衡技術方案主要有三種:
基於DNS負載均衡
基於硬體負載均衡
基於軟體負載均衡
三種方案各有優劣,DNS負載均衡可以實現在地域上的流量均衡,硬體負載均衡主要用於大型伺服器叢集中的負載需求,而軟體負載均衡大多是基於機器層面的流量均衡。在實際場景中,這三種是可以組合在一起使用。下面來詳細講講:
基於DNS負載均衡
(網路圖片)
基於DNS來做負載均衡其實是一種最簡單的實現方案,通過在DNS伺服器上做一個簡單配置即可。
其原理就是當使用者訪問域名的時候,會先向DNS伺服器去解析域名對應的IP地址,這個時候我們可以讓DNS伺服器根據不同地理位置的使用者返回不同的IP。比如南方的使用者就返回我們在廣州業務伺服器的IP,北方的使用者來訪問的話,我就返回北京業務伺服器所在的IP。
在這個模式下,使用者就相當於實現了按照「就近原則」將請求分流了,既減輕了單個叢集的負載壓力,也提升了使用者的訪問速度。
使用DNS做負載均衡的方案,天然的優勢就是配置簡單,實現成本非常低,無需額外的開發和維護工作。
但是也有一個明顯的缺點是:當配置修改後,生效不及時。這個是由於DNS的特性導致的,DNS一般會有多級快取,所以當我們修改了DNS配置之後,由於快取的原因,會導致IP變更不及時,從而影響負載均衡的效果。
另外,使用DNS做負載均衡的話,大多是基於地域或者乾脆直接做IP輪詢,沒有更高階的路由策略,所以這也是DNS方案的侷限所在。
基於硬體負載均衡
(網路圖片)
硬體的負載均衡那就比較牛逼了,比如大名鼎鼎的 F5 Network Big-IP,也就是我們常說的 F5,它是一個網路裝置,你可以簡單的理解成類似於網路交換機的東西,完全通過硬體來抗壓力,效能是非常的好,每秒能處理的請求數達到百萬級,即 幾百萬/秒 的負載,當然價格也就非常非常貴了,十幾萬到上百萬人民幣都有。
因為這類裝置一般用在大型網際網路公司的流量入口最前端,以及政府、國企等不缺錢企業會去使用。一般的中小公司是不捨得用的。
採用 F5 這類硬體做負載均衡的話,主要就是省心省事,買一臺就搞定,效能強大,一般的業務不在話下。而且在負載均衡的演算法方面還支援很多靈活的策略,同時還具有一些防火牆等安全功能。但是缺點也很明顯,一個字:貴。
基於軟體負載均衡
(網路圖片)
軟體負載均衡是指使用軟體的方式來分發和均衡流量。軟體負載均衡,分為7層協議 和 4層協議。
網路協議有七層,基於第四層傳輸層來做流量分發的方案稱為4層負載均衡,例如 LVS,而基於第七層應用層來做流量分發的稱為7層負載均衡,例如 Nginx。這兩種在效能和靈活性上是有些區別的。
基於4層的負載均衡效能要高一些,一般能達到 幾十萬/秒 的處理量,而基於7層的負載均衡處理量一般只在 幾萬/秒 。
基於軟體的負載均衡的特點也很明顯,便宜。在正常的伺服器上部署即可,無需額外採購,就是投入一點技術去優化優化即可,因此這種方式是網際網路公司中用得最多的一種方式。
三、常用的均衡演算法有哪些?
上面講完了常見的負載均衡技術方案,那麼接下來我們們看一下,在實際方案應用中,一般可以使用哪些均衡演算法?
輪詢策略
負載度策略
響應策略
雜湊策略
下面來分別介紹一下這幾種均衡演算法/策略的特點:
輪詢策略
輪詢策略其實很好理解,就是當使用者請求來了之後,「負載均衡器」將請求輪流的轉發到後端不同的業務伺服器上。這個策略在DNS方案中用的比較多,無需關注後端服務的狀態,只藥有請求,就往後端輪流轉發,非常的簡單、實用。
在實際應用中,輪詢也會有多種方式,有按順序輪詢的、有隨機輪詢的、還有按照權重來輪詢的。前兩種比較好理解,第三種按照權重來輪詢,是指給每臺後端服務設定一個權重值,比如效能高的伺服器權重高一些,效能低的伺服器給的權重低一些,這樣設定的話,分配流量的時候,給權重高的更多流量,可以充分的發揮出後端機器的效能。
負載度策略
負載度策略是指當「負載均衡器」往後端轉發流量的時候,會先去評估後端每臺伺服器的負載壓力情況,對於壓力比較大的後端伺服器轉發的請求就少一些,對於壓力比較小的後端伺服器可以多轉發一些請求給它。
這種方式就充分的結合了後端伺服器的執行狀態,來動態的分配流量了,比輪詢的方式更為科學一些。
但是這種方式也帶來了一些弊端,因為需要動態的評估後端伺服器的負載壓力,那這個「負載均衡器」除了轉發請求以外,還要做很多額外的工作,比如採集 連線數、請求數、CPU負載指標、IO負載指標等等,通過對這些指標進行計算和對比,判斷出哪一臺後端伺服器的負載壓力較大。
因此這種方式帶來了效果優勢的同時,也增加了「負載均衡器」的實現難度和維護成本。
響應策略
響應策略是指,當使用者請求過來的時候,「負載均衡器」會優先將請求轉發給當前時刻響應最快的後端伺服器。
也就是說,不管後端伺服器負載高不高,也不管配置如何,只要覺得這個伺服器在當前時刻能最快的響應使用者的請求,那麼就優先把請求轉發給它,這樣的話,對於使用者而言,體驗也最好。
那「負載均衡器」是怎麼知道哪一臺後端服務在當前時刻響應能力最佳呢?
這就需要「負載均衡器」不停的去統計每一臺後端伺服器對請求的處理速度了,比如一分鐘統計一次,生成一個後端伺服器處理速度的排行榜。然後「負載均衡器」根據這個排行榜去轉發服務。
那麼這裡的問題就是統計的成本了,不停的做這些統計運算本身也會消耗一些效能,同時也會增加「負載均衡器」的實現難度和維護成本。
雜湊策略
Hash策略也比較好理解,就是將請求中的某個資訊進行hash計算,然後根據後端伺服器臺數取模,得到一個值,算出相同值的請求就被轉發到同一臺後端伺服器中。
常見的用法是對使用者的IP或者ID進行這個策略,然後「負載均衡器」就能保證同一個IP來源或者同一個使用者永遠會被送到同一個後端伺服器上了,一般用於處理快取、會話等功能的時候特別好用。
以上,就是實現高效能負載均衡的常見技術方案和策略了,歡迎大家加入 程式猿交流社群:839462919 一起交流。
相關文章
- 流量引導:網路世界的負載均衡解密負載解密
- 大型網站--負載均衡架構網站負載架構
- 阿里架構師Peter老師講述Java程式設計師→架構師所需要掌握的技能阿里架構Java程式設計師
- 「網際網路大廠」招聘Java架構師Java架構
- 網際網路專案的特點和架構目標架構
- 淺談大型網站之負載均衡架構網站負載架構
- 網際網路常用設計模式——通往架構師的第一步設計模式架構
- 網際網路資料庫架構設計資料庫架構
- 大型網際網路系統架構是如何設計的?架構
- 大型網站架構系列:負載均衡詳解(上)網站架構負載
- 大型網站架構系列:負載均衡詳解(下)網站架構負載
- 大型網站架構系列:負載均衡詳解(2)網站架構負載
- 大型網站架構系列:負載均衡詳解(1)網站架構負載
- 大型網站架構系列:負載均衡詳解(3)網站架構負載
- 大型網站架構系列:負載均衡詳解(4)網站架構負載
- 高可用+高併發+負載均衡架構設計負載架構
- 網際網路高併發架構設計模式架構設計模式
- 不懂高效能的負載均衡設計?沒關係,架構師帶你飛負載架構
- SSM(十) 專案重構-網際網路專案的Maven結構SSMMaven
- 阿里P8架構師講述:3—5年程式設計師的發展和出路在哪裡?阿里架構程式設計師
- 從網路到分散式-負載均衡分散式負載
- 程式設計師如何實現“網際網路+”07-如何提高網站流量程式設計師網站
- 阿里架構師,講述基於微服務的軟體架構模式(附資料)阿里架構微服務模式
- 網際網路理想架構架構
- 用 HAProxy 實現網路流量的負 載 平 衡
- 【恩墨學院】架構設計 | 什麼是網際網路架構“高可用”?架構
- 虛擬專案辦公室-網際網路浪潮中的專案管理(轉)專案管理
- 阿里P9架構師簡述從單機至億級流量大型網站系統架構的演進過程阿里架構網站
- 網際網路架構:屢試不爽的架構三馬車架構
- 網際網路分層架構的本質架構
- 大型網際網路架構概述架構
- 一個網際網路UI設計師的獨白UI
- 十年阿里java架構師的六大設計原則和專案經驗阿里Java架構
- 程式設計師如何實現“網際網路+”06-為什麼你的網站沒有流量程式設計師網站
- 網際網路專案中“延遲”分析
- 負載均衡在分散式架構中是怎麼玩起來的?負載分散式架構
- TKE基於彈性網路卡直連Pod的網路負載均衡負載
- golang 開源專案彙總(基於網際網路架構分類)Golang架構