LVS:三種負載均衡方式比較+另三種負載均衡方式

朱小廝發表於2016-07-25

什麼是LVS?

首先簡單介紹一下LVS (Linux Virtual Server)到底是什麼東西,其實它是一種叢集(Cluster)技術,採用IP負載均衡技術和基於內容請求分發技術。排程器具有很好的吞吐率,將請求均衡地轉移到不同的伺服器上執行,且排程器自動遮蔽掉伺服器的故障,從而將一組伺服器構成一個高效能的、高可用的虛擬伺服器。整個伺服器叢集的結構對客戶是透明的,而且無需修改客戶端和伺服器端的程式。

為此,在設計時需要考慮系統的透明性、可伸縮性、高可用性和易管理性。一般來說,LVS叢集採用三層結構,其體系結構如圖所示:

LVS叢集的體系結構

 


LVS主要組成部分

負載排程器(load balancer/ Director),它是整個叢集對外面的前端機,負責將客戶的請求傳送到一組伺服器上執行,而客戶認為服務是來自一個IP地址(我們可稱之為虛擬IP地址)上的。

伺服器池(server pool/ Realserver),是一組真正執行客戶請求的伺服器,執行的服務一般有WEB、MAIL、FTP和DNS等。

共享儲存(shared storage),它為伺服器池提供一個共享的儲存區,這樣很容易使得伺服器池擁有相同的內容,提供相同的服務。


LVS負載均衡方式:

Virtual Server via Network Address Translation NAT(VS/NAT)

VS/NAT是一種最簡單的方式,所有的RealServer只需要將自己的閘道器指向Director即可。客戶端可以是任意作業系統,但此方式下,一個Director能夠帶動的RealServer比較有限。在VS/NAT的方式下,Director也可以兼為一臺RealServer。VS/NAT的體系結構如圖所示。

VS/NAT的體系結構

Virtual Server via IP Tunneling(VS/TUN)

IP隧道(IP tunneling)是將一個IP報文封裝在另一個IP報文的技術,這可以使得目標為一個IP地址的資料包文能被封裝和轉發到另一個IP地址。IP隧道技術亦稱為IP封裝技術(IP encapsulation)。IP隧道主要用於移動主機和虛擬私有網路(Virtual Private Network),在其中隧道都是靜態建立的,隧道一端有一個IP地址,另一端也有唯一的IP地址。它的連線排程和管理與VS/NAT中的一樣,只是它的報文轉發方法不同。排程器根據各個伺服器的負載情況,動態地選擇一臺伺服器,將請求報文封裝在另一個IP報文中,再將封裝後的IP報文轉發給選出的伺服器;伺服器收到報文後,先將報文解封獲得原來目標地址為 VIP 的報文,伺服器發現VIP地址被配置在本地的IP隧道裝置上,所以就處理這個請求,然後根據路由表將響應報文直接返回給客戶。

VS/TUN的體系結構

Virtual Server via Direct Routing(VS/DR)

VS/DR方式是通過改寫請求報文中的MAC地址部分來實現的。Director和RealServer必需在物理上有一個網路卡通過不間斷的區域網相連。 RealServer上繫結的VIP配置在各自Non-ARP的網路裝置上(如lo或tunl),Director的VIP地址對外可見,而RealServer的VIP對外是不可見的。RealServer的地址即可以是內部地址,也可以是真實地址。

VS/DR的體系結構

VS/DR的工作流程如圖所示:它的連線排程和管理與VS/NAT和VS/TUN中的一樣,它的報文轉發方法又有不同,將報文直接路由給目標伺服器。在VS/DR中,排程器根據各個伺服器的負載情況,動態地選擇一臺伺服器,不修改也不封裝IP報文,而是將資料幀的MAC地址改為選出伺服器的MAC地址,再將修改後的資料幀在與伺服器組的區域網上傳送。因為資料幀的MAC地址是選出的伺服器,所以伺服器肯定可以收到這個資料幀,從中可以獲得該IP報文。當伺服器發現報文的目標地址VIP是在本地的網路裝置上,伺服器處理這個報文,然後根據路由表將響應報文直接返回給客戶。

VS/DR的方式是目前大型網站使用最廣泛的一種負載均衡手段。


三種負載均衡方式比較

VS/NAT 的優點是伺服器可以執行任何支援TCP/IP的作業系統,它只需要一個IP地址配置在排程器上,伺服器組可以用私有的IP地址。缺點是它的伸縮能力有限,當伺服器結點數目升到20時,排程器本身有可能成為系統的新瓶頸,因為在VS/NAT中請求和響應報文都需要通過負載排程器。我們在Pentium166 處理器的主機上測得重寫報文的平均延時為60us,效能更高的處理器上延時會短一些。假設TCP報文的平均長度為536 Bytes,則排程器的最大吞吐量為8.93 MBytes/s. 我們再假設每臺伺服器的吞吐量為800KBytes/s,這樣一個排程器可以帶動10臺伺服器。(注:這是很早以前測得的資料)

基於 VS/NAT的的叢集系統可以適合許多伺服器的效能要求。如果負載排程器成為系統新的瓶頸,可以有三種方法解決這個問題:混合方法、VS/TUN和 VS/DR。在DNS混合叢集系統中,有若干個VS/NAT負排程器,每個負載排程器帶自己的伺服器叢集,同時這些負載排程器又通過RR-DNS組成簡單的域名。

但VS/TUN和VS/DR是提高系統吞吐量的更好方法。

對於那些將IP地址或者埠號在報文資料中傳送的網路服務,需要編寫相應的應用模組來轉換報文資料中的IP地址或者埠號。這會帶來實現的工作量,同時應用模組檢查報文的開銷會降低系統的吞吐率。

在VS/TUN 的叢集系統中,負載排程器只將請求排程到不同的後端伺服器,後端伺服器將應答的資料直接返回給使用者。這樣,負載排程器就可以處理大量的請求,它甚至可以排程百臺以上的伺服器(同等規模的伺服器),而它不會成為系統的瓶頸。即使負載排程器只有100Mbps的全雙工網路卡,整個系統的最大吞吐量可超過 1Gbps。所以,VS/TUN可以極大地增加負載排程器排程的伺服器數量

VS/TUN排程器可以排程上百臺伺服器,而它本身不會成為系統的瓶頸,可以用來構建高效能的超級伺服器。VS/TUN技術對伺服器有要求,即所有的伺服器必須支援“IP Tunneling”或者“IP Encapsulation”協議。目前,VS/TUN的後端伺服器主要執行Linux作業系統,我們沒對其他作業系統進行測試。因為“IP Tunneling”正成為各個作業系統的標準協議,所以VS/TUN應該會適用執行其他作業系統的後端伺服器。

跟VS/TUN方法一樣,VS/DR排程器只處理客戶到伺服器端的連線,響應資料可以直接從獨立的網路路由返回給客戶。這可以極大地提高LVS叢集系統的伸縮性。跟VS/TUN相比,這種方法沒有IP隧道的開銷,但是要求負載排程器與實際伺服器都有一塊網路卡連在同一物理網段上,伺服器網路裝置(或者裝置別名)不作ARP響應,或者能將報文重定向(Redirect)到本地的Socket埠上。

三種LVS負載均衡技術的優缺點歸納以下表:

指標 VS/NAT VS/TUN VS/DR
伺服器作業系統 任意 支援隧道 多數(支援Non-arp)
伺服器網路 私有網路 區域網/廣域網 區域網
伺服器數目(100M網路) 10~20 100 大於100
伺服器閘道器 負載均衡器 自己的路由 自己的路由
效率 一般 最高

注:以上三種方法所能支援最大伺服器數目的估計是假設排程器使用100M網路卡,排程器的硬體配置與後端伺服器的硬體配置相同,而且是對一般Web服務。使用更高的硬體配置(如千兆網路卡和更快的處理器)作為排程器,排程器所能排程的伺服器數量會相應增加。當應用不同時,伺服器的數目也會相應地改變。所以,以上資料估計主要是為三種方法的伸縮性進行量化比較。


附:其他負載均衡演算法

  • HTTP重定向負載均衡

當使用者發來請求的時候,Web伺服器通過修改HTTP響應頭中的Location標記來返回一個新的url,然後瀏覽器再繼續請求這個新url,實際上就是頁面重定向。通過重定向,來達到“負載均衡”的目標。例如,我們在下載PHP原始碼包的時候,點選下載連結時,為了解決不同國家和地域下載速度的問題,它會返回一個離我們近的下載地址。重定向的HTTP返回碼是302。

優點:比較簡單。
缺點:瀏覽器需要兩次請求伺服器才能完成一次訪問,效能較差。重定向服務自身的處理能力有可能成為瓶頸,整個叢集的伸縮性國模有限;使用HTTP302響應碼重定向,有可能使搜尋引擎判斷為SEO作弊,降低搜尋排名。

  • DNS域名解析負載均衡

DNS(Domain Name System)負責域名解析的服務,域名url實際上是伺服器的別名,實際對映是一個IP地址,解析過程,就是DNS完成域名到IP的對映。而一個域名是可以配置成對應多個IP的。因此,DNS也就可以作為負載均衡服務。

事實上,大型網站總是部分使用DNS域名解析,利用域名解析作為第一級負載均衡手段,即域名解析得到的一組伺服器並不是實際提供Web服務的物理伺服器,而是同樣提供負載均衡服務的內部伺服器,這組內部負載均衡伺服器再進行負載均衡,將請求分發到真是的Web伺服器上。

優點:將負載均衡的工作轉交給DNS,省掉了網站管理維護負載均衡伺服器的麻煩,同時許多DNS還支援基於地理位置的域名解析,即會將域名解析成舉例使用者地理最近的一個伺服器地址,這樣可以加快使用者訪問速度,改善效能。
缺點:不能自由定義規則,而且變更被對映的IP或者機器故障時很麻煩,還存在DNS生效延遲的問題。而且DNS負載均衡的控制權在域名服務商那裡,網站無法對其做更多改善和更強大的管理。

  • 反向代理負載均衡

反向代理服務可以快取資源以改善網站效能。實際上,在部署位置上,反向代理伺服器處於Web伺服器前面(這樣才可能快取Web相應,加速訪問),這個位置也正好是負載均衡伺服器的位置,所以大多數反向代理伺服器同時提供負載均衡的功能,管理一組Web伺服器,將請求根據負載均衡演算法轉發到不同的Web伺服器上。Web伺服器處理完成的響應也需要通過反向代理伺服器返回給使用者。由於web伺服器不直接對外提供訪問,因此Web伺服器不需要使用外部ip地址,而反向代理伺服器則需要配置雙網路卡和內部外部兩套IP地址。

優點:和反向代理伺服器功能整合在一起,部署簡單。
缺點:反向代理伺服器是所有請求和響應的中轉站,其效能可能會成為瓶頸。

打賞支援我寫出更多好文章,謝謝!

打賞作者

打賞支援我寫出更多好文章,謝謝!

任選一種支付方式

LVS:三種負載均衡方式比較+另三種負載均衡方式 LVS:三種負載均衡方式比較+另三種負載均衡方式

相關文章