分散式設計與開發

handawei_5發表於2010-08-27

在IDF05(Intel Developer Forum 2005)上,Intel執行長Craig Barrett就取消4GHz晶片計劃一事,半開玩笑當眾單膝下跪致歉,給廣大軟體開發者一個明顯的訊號,單純依靠垂直提升硬體效能來提高系統效能的時代已結束,分散式開發的時代實際上早已悄悄地成為了時代的主流,吵得很熱的雲端計算實際上只是包裝在分散式之外的商業概念,很多開發者(包括我)都想加入研究雲端計算這個潮流,在google上通過“雲端計算”這個關鍵詞來查詢資料,查到的都是些概念性或商業性的宣傳資料,其實真正需要深入的還是那個早以被人熟知的概念------分散式。

分散式可繁也可以簡,最簡單的分散式就是大家最常用的,在負載均衡伺服器後加一堆web伺服器,然後在上面搞一個快取伺服器來儲存臨時狀態,後面共享一個資料庫,其實很多號稱分散式專家的人也就停留於此,大致結構如下圖所示:

 

這種環境下真正進行分散式的只是web server而已,並且web server之間沒有任何聯絡,所以結構和實現都非常簡單。

有些情況下,對分散式的需求就沒這麼簡單,在每個環節上都有分散式的需求,比如Load Balance、DB、Cache和檔案等等,並且當分散式節點之間有關聯時,還得考慮之間的通訊,另外,節點非常多的時候,得有監控和管理來支撐。這樣看起來,分散式是一個非常龐大的體系,只不過你可以根據具體需求進行適當地裁剪。按照最完備的分散式體系來看,可以由以下模組組成:

分散式任務處理服務:負責具體的業務邏輯處理

分散式節點註冊和查詢:負責管理所有分散式節點的命名和物理資訊的註冊與查詢,是節點之間聯絡的橋樑

分散式DB:分散式結構化資料存取

分散式Cache:分散式快取資料(非持久化)存取

分散式檔案:分散式檔案存取

網路通訊:節點之間的網路資料通訊

監控管理:蒐集、監控和診斷所有節點執行狀態

分散式程式語言:用於分散式環境下的專有程式語言,比如Elang、Scala

分散式演算法:為解決分散式環境下一些特有問題的演算法,比如解決一致性問題的Paxos演算法

因此,若要深入研究雲端計算和分散式,就得深入研究以上領域,而這些領域每一塊的水都很深,都需要很底層的知識和技術來支撐,所以說,對於想提升技術的開發者來說,以分散式來作為切入點是非常好的,可以以此為線索,探索計算機世界的各個角落。


本文來自CSDN部落格,轉載請標明出處:http://blog.csdn.net/cutesource/archive/2010/08/14/5811914.aspx

相關文章