分散式架構 -- 學習路線圖(入門到進階)

黨偉_90發表於2018-04-23

原文:http://blog.csdn.net/chunlongyu/article/details/53943558

由於分散式系統所涉及到的領域眾多,知識龐雜,很多新人在最初往往找不到頭緒,不知道從何處下手來一步步學習分散式架構

本文試圖通過一個最簡單的、常用的分散式系統,來闡述分散式系統中的一些基本問題。

  • 負載均衡
  • 分散式快取
  • 分散式檔案系統/CDN
  • 分散式RPC
  • 分散式資料庫/Nosql
  • 分散式訊息中介軟體
  • 分散式session問題 
    -總結

下圖為一箇中大型網站/App的基本架構: 
這裡寫圖片描述

在這個架構中,涉及到以上所列的基本問題:

負載均衡

負載均衡是分散式系統中的一個最最基本的問題。在上圖中:

閘道器需要把請求分發給不同的Tomcat; 
Tomcat需要把收到的請求,分發給不同的Service;

這都需要負載均衡。一句話:凡是請求從一個入口進來,需要分發給後端不同的機器時,就需要負載均衡。

區域網負載均衡

在上圖中,負載均衡發生在區域網內部。在這裡,常用的閘道器軟體有Nginx/HAProxy/F5/LVS/各種雲上的SLB等。

廣域網負載均衡

在上圖之外,還有廣域網負載均衡。這通常發生在域名伺服器上,而不是區域網內部。 
同1個域名,對映到不同的區域網叢集。

負載均衡演算法

常用的負載均衡演算法:隨機,輪詢(Round Robin),最小資源數,hash。

分散式快取

在上圖中,當DB負載過高,我需要為Service機器加快取時,就遇到一個基本問題: 
如果使用local的記憶體做快取,則其他Service機器就沒辦法共用此快取。 
因次,我需要一個可以讓所有Service機器共享的快取,這就是分散式快取。

常用的分散式快取元件:Memcached/Redis/Tair等

分散式檔案系統

在上圖中,當我要儲存客戶端上傳的圖片檔案時,就會遇到另一個基本問題:我不能把圖片存在每個Tomcat的本地檔案系統裡面,這樣的話,其他機器就沒辦法訪問了。我需要一個讓所有機器可以共享的檔案系統,這就是分散式檔案系統。

常用的分散式檔案系統:MogileFS/TFS/HDFS/Amazon S3/OpenStack Swift

當使用了分散式檔案系統,對外提供圖片url訪問服務時,就會遇到另一個基本問題:如果每次檔案的訪問,都要到分散式檔案系統裡面去取,效率和負載就可能成為問題。 
為此,就需要引入CDN。

常用的CDN廠商,比如ChinCache。當然,現在的各種雲端儲存,比如七牛雲,阿里雲,騰訊雲,已經自帶了CDN。

分散式RPC

分散式系統的一個基本問題就是:機器與機器之間如何通訊? 我們都知道底層原理是TCP/IP,Socket。

但一般很少有人會去裸寫Socket,實現機器之間的通訊。這裡,最常用的元件就是RPC。

最簡單的實現RPC的方式就是使用http。當然,業界有很多成熟的開源RPC框架,如Facebook的Thrift, 阿里的Dubbo,點評的Pigeon。。

在RPC內部,一般都自己實現了負載均衡。還有更復雜的,如多版本,服務降級等。

補充一句:雖然底層原理都是Socket,但使用不同框架/元件時,通常都有其自己的跨機器通訊方式,比如MySQLJDBC,RPC, 訊息中介軟體等。

分散式資料庫

在上圖中,DB是單一節點。當訪問量達到一定程度,就會涉及到Mysql的分庫分表問題。

分庫/分表之後,就會涉及到join的問題,分散式事務的問題。

關於分庫分表,業界也早有成熟方案。對上層遮蔽分庫分表,sql的執行,像是在單庫一樣。

還有像MongoDB這種Nosql資料庫,天生是分散式的。但同樣會面對Mysql分庫分表所要面對的問題。

還有像阿里的OceanBase,有Mysql的強一致性保證,又是分散式的,還可以支援分散式事務。

分散式訊息中介軟體

在上圖中,沒有提及到訊息中介軟體。相對其他基本問題,這個需要一個更適合的業務場景來談,在以後的章節中,會再詳述。

常用的訊息中介軟體,比如老一輩的ActiveMQ/RabbitMQ, 新一點的,阿里的RocketMQ,LinkedIn的Kafka等。

訊息中介軟體的一個典型場景就是:通過最終一致性,解決上面的分散式事務問題。

分散式session問題

在傳統的單機版應用中,我們經常使用session。而當單機擴充套件到多機,單機的session就沒辦法被其他機器所訪問。

此時就需要使用分散式session,把session存放在一個所有Tomcat都可以訪問的地方。

關於分散式session,業界早有成熟方案,在此不再詳述。

總結

本文羅列了分散式系統的各種基本問題和業界常用的技術,希望建立起分散式系統的一個巨集觀圖譜。

後續,會針對各個領域,逐個剖析!

相關文章