大型網站架構系列:負載均衡詳解(上)

佚名發表於2016-04-14

面對大量使用者訪問、高併發請求,海量資料,可以使用高效能的伺服器、大型資料庫,儲存裝置,高效能Web伺服器,採用高效率的程式語言比如(Go,Scala)等,當單機容量達到極限時,我們需要考慮業務拆分和分散式部署,來解決大型網站訪問量大,併發量高,海量資料的問題。

從單機網站到分散式網站,很重要的區別是業務拆分和分散式部署,將應用拆分後,部署到不同的機器上,實現大規模分散式系統。分散式和業務拆分解決了,從集中到分佈的問題,但是每個部署的獨立業務還存在單點的問題和訪問統一入口問題,為解決單點故障,我們可以採取冗餘的方式。將相同的應用部署到多臺機器上。解決訪問統一入口問題,我們可以在叢集前面增加負載均衡裝置,實現流量分發。

負載均衡(Load Balance),意思是將負載(工作任務,訪問請求)進行平衡、分攤到多個操作單元(伺服器,元件)上進行執行。是解決高效能,單點故障(高可用),擴充套件性(水平伸縮)的終極解決方案。

本文是負載均衡詳解的第一篇文章,介紹負載均衡的原理,負載均衡分類(DNS負載均衡,HTTP負載均衡,IP負載均衡,鏈路層負載均衡,混合型P負載均衡)。部分內容摘自讀書筆記。

本次分享大綱

  1. 負載均衡原理
  2. DNS負載均衡
  3. HTTP負載均衡
  4. IP負載均衡
  5. 鏈路層負載均衡
  6. 混合型P負載均衡

一、負載均衡原理

系統的擴充套件可分為縱向(垂直)擴充套件和橫向(水平)擴充套件。縱向擴充套件,是從單機的角度透過增加硬體處理能力,比如CPU處理能力,記憶體容量,磁碟等方面,實現伺服器處理能力的提升,不能滿足大型分散式系統(網站),大流量,高併發,海量資料的問題。因此需要採用橫向擴充套件的方式,透過新增機器來滿足大型網站服務的處理能力。

比如:一臺機器不能滿足,則增加兩臺或者多臺機器,共同承擔訪問壓力。這就是典型的叢集和負載均衡架構:如下圖:

大型網站架構 網站架構最佳化 網站最佳化 網站架構

  • 應用叢集:將同一應用部署到多臺機器上,組成處理叢集,接收負載均衡裝置分發的請求,進行處理,並返回相應資料。
  • 負載均衡裝置:將使用者訪問的請求,根據負載均衡演算法,分發到叢集中的一臺處理伺服器。(一種把網路請求分散到一個伺服器叢集中的可用伺服器上去的裝置)

負載均衡的作用(解決的問題):

1.解決併發壓力,提高應用處理效能(增加吞吐量,加強網路處理能力);

2.提供故障轉移,實現高可用;

3.透過新增或減少伺服器數量,提供網站伸縮性(擴充套件性);

4.安全防護;(負載均衡裝置上做一些過濾,黑白名單等處理)

二、負載均衡分類

根據實現技術不同,可分為DNS負載均衡,HTTP負載均衡,IP負載均衡,鏈路層負載均衡等。

2.1DNS負載均衡

最早的負載均衡技術,利用域名解析實現負載均衡,在DNS伺服器,配置多個A記錄,這些A記錄對應的伺服器構成叢集。大型網站總是部分使用DNS解析,作為第一級負載均衡。如下圖:

大型網站架構 網站架構最佳化 網站最佳化 網站架構

優點

  1. 使用簡單:負載均衡工作,交給DNS伺服器處理,省掉了負載均衡伺服器維護的麻煩
  2. 提高效能:可以支援基於地址的域名解析,解析成距離使用者最近的伺服器地址,可以加快訪問速度,改善效能;

缺點

  1. 可用性差:DNS解析是多級解析,新增/修改DNS後,解析時間較長;解析過程中,使用者訪問網站將失敗;
  2. 擴充套件性低:DNS負載均衡的控制權在域名商那裡,無法對其做更多的改善和擴充套件;
  3. 維護性差:也不能反映伺服器的當前執行狀態;支援的演算法少;不能區分伺服器的差異(不能根據系統與服務的狀態來判斷負載)

實踐建議

將DNS作為第一級負載均衡,A記錄對應著內部負載均衡的IP地址,透過內部負載均衡將請求分發到真實的Web伺服器上。一般用於網際網路公司,複雜的業務系統不合適使用。如下圖:

大型網站架構 網站架構最佳化 網站最佳化 網站架構

1.3 IP負載均衡

在網路層透過修改請求目標地址進行負載均衡。

使用者請求資料包,到達負載均衡伺服器後,負載均衡伺服器在作業系統核心程式獲取網路資料包,根據負載均衡演算法得到一臺真實伺服器地址,然後將請求目的地址修改為,獲得的真實ip地址,不需要經過使用者程式處理。

真實伺服器處理完成後,響應資料包回到負載均衡伺服器,負載均衡伺服器,再將資料包源地址修改為自身的ip地址,傳送給使用者瀏覽器。如下圖:

大型網站架構 網站架構最佳化 網站最佳化 網站架構

IP負載均衡,真實物理伺服器返回給負載均衡伺服器,存在兩種方式:

(1)負載均衡伺服器在修改目的ip地址的同時修改源地址。將資料包源地址設為自身盤,即源地址轉換(snat)。

(2)將負載均衡伺服器同時作為真實物理伺服器叢集的閘道器伺服器。

優點:

(1)在核心程式完成資料分發,比在應用層分發效能更好;

缺點:

(2)所有請求響應都需要經過負載均衡伺服器,叢集最大吞吐量受限於負載均衡伺服器網路卡頻寬;

相關文章