基於linux的叢集系統(二)(轉)

post0發表於2007-08-10
基於linux的叢集系統(二)(轉)[@more@]

在《基於Linux的叢集系統》系列文章的第二部分,作者將向我們介紹幾個最典型的叢集系統。

1. Lsf

如何管理各種各樣的計算資源(如:CPU時間、記憶體空間、網路頻寬、應用程式等)是許多企業當前都很頭疼的問題。尤其是對於那些員工遍佈全球的公司而言,如何充分利用有限的計算資源是非常關鍵的問題。由platform公司開發的lsf 多叢集系統使多個異構的計算機能夠透過區域網或廣域網共享計算資源,並能夠為使用者提供對資源的透明訪問。Lsf現在主要支援以下三種大規模資源共享:

1. 一個大企業中的多個部門,每個部門可以有一個或多個叢集,這樣就使得部門內部和部門之間可以共享資源。

2. 較小部門的資料中心。大的昂貴的計算資源如超級計算機可以透明地與遠方較小的部門直接進行共享。

3. 透過鬆散連線的站點共享資源。

Lsf將多個叢集連線在一起,一個叢集往往是企業中的一個部門,每個叢集中有一個主控機,此主控機負責收集該叢集系統中的各臺主機的負載資訊,並且根據各主機的負載資訊情況對作業進行排程。各個叢集系統之間根據一定的策略進行資源共享。在每個主控機上定義了該叢集能共享哪些叢集系統中的資源。當使用者傳送了一個任務請求時,lsf系統能將此任務傳送到對應的資源所在地,並根據排程策略選擇負載較輕的機器對此任務進行處理。當多個使用者請求同一個資源時,根據使用者的請求優先順序來確保優先順序高的使用者的緊急任務能首先得到滿足。Lsf還具有以下特點:

1. 提供了增強的計算能力。

透過全域性資源共享,使用者可以訪問各種各樣的計算資源,許多閒置的計算機現在都可以充分利用起來進行任務處理,許多機器也可以並行地執行同一個任務,這樣就大大增強了使用者的計算能力。

2. lsf提供了使用者可配置的安全策略。

透過讓使用者使用RFC931協議、Kerberos、和DCE認證等策略,系統保證了遠方的任務來自授權的使用者。

3. 每一個叢集都是一個自治的系統。

每個叢集中的主控機的配置檔案中記錄瞭如下資訊:如允許在多個叢集系統之間傳輸的任務的數量與型別,允許在多個叢集之間共享資源的使用者名稱。

4. 提供非共享的使用者賬號和檔案系統。

當任務在多個叢集之間進行傳輸時,使用者的賬號可以根據配置檔案進行對映。為了支援異構的系統,lsf透過在任務執行前後將檔案在叢集系統之間傳遞來提供對非共享的檔案系統的支援。

5. 良好的可擴充套件性。

在單一的叢集系統中透過主控機進行管理,所有的配置資訊都在主控機上,多個叢集系統之間資訊的傳遞主要是與主控機有關,而與叢集中的其它主機無關。因此lsf的叢集能非常容易地擴充套件到成百甚至上千臺。

6. lsf系統支援多種作業系統平臺。

如主要的UNIX平臺:Sun Solaris、 HP-UX、 IBM AIX、 Digital UNIX/Compaq Tru64 UNIX、SGI IRIX以及 Red hat Linux、 Windows NT、Windows 2000等。

2. TurboCluster

TurboCluster是一個企業級的叢集方案,它允許在多個計算機上構建高可用的、可擴充套件的網路。它支援Intel和Alpha晶片,支援Linux 、Windows NT 和Solaris作業系統平臺。使用TurboCluster系統可以顯著地提高基於TCP/IP協議的多種網路服務的服務質量,這些服務包括Web、 Mail、News和Ftp等。TurboCluster具有良好的可用性、可擴充套件性和可管理性,叢集內部的實際伺服器的數量可以擴充到無限臺。 TurboCluster是一種基於軟體的叢集系統解決方案,它還能夠支援異構的網路環境。它的結構如圖2-1所示。

當客戶向叢集系統傳送一個請求時,該請求首先到達高階流量管理器,高階流量管理器透過一定的排程策略將此請求轉發到叢集中的某一臺實際伺服器上對此請求進行處理,最終的回應請求將直接傳送給客戶。由於最終的回應請求沒有透過高階瀏覽管理器而是直接傳送給客戶,這樣大大減輕了高階瀏覽管理器上的負載,從而降低了瓶頸產生的可能。TurboCluster中採用的排程策略有:輪迴(Round Robin)、加權輪迴(Weighted Round Robin)、最少連線(Least Connection)。為了減少高階流量管理器產生失效的可能,TurboCluster為高階流量管理器準備了一個備份機。該備份機不斷詢問管理器來確認它正在正常工作,一旦發現主管理器已經失效,備份機將接替它繼續工作。

圖2-1 turbocluster結構圖

TurboCluster具有如下一些增強的效能。

1. 透過heartbeat在備份機上監測流量管理器的執行狀態來提供更高的可用性。

2. 對不可預測的系統或應用程式的失效進行自動管理。

3. 提供動態的負載平衡,它能夠消除瓶頸並且處理峰值負載。

4. 高階流量管理器只轉發已經授權的請求,透過在實際的應用程式伺服器的前端增加虛擬防火牆來提高網路的安全性。

5. TurboCluster對外只顯現出流量管理器的IP,而叢集系統中的實際伺服器的IP地址對外界而言是不可見的。

6. 當實際伺服器正在對外界提供服務時就可以對它進行維護工作。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/8225414/viewspace-941460/,如需轉載,請註明出處,否則將追究法律責任。

相關文章