分散式架構 -- 學習路線圖(入門到進階)
原文:http://blog.csdn.net/chunlongyu/article/details/53943558
由於分散式系統所涉及到的領域眾多,知識龐雜,很多新人在最初往往找不到頭緒,不知道從何處下手來一步步學習分散式架構。
本文試圖通過一個最簡單的、常用的分散式系統,來闡述分散式系統中的一些基本問題。
- 負載均衡
- 分散式快取
- 分散式檔案系統/CDN
- 分散式RPC
- 分散式資料庫/Nosql
- 分散式訊息中介軟體
- 分散式session問題
-總結
下圖為一箇中大型網站/App的基本架構:
在這個架構中,涉及到以上所列的基本問題:
負載均衡
負載均衡是分散式系統中的一個最最基本的問題。在上圖中:
閘道器需要把請求分發給不同的Tomcat;
Tomcat需要把收到的請求,分發給不同的Service;
這都需要負載均衡。一句話:凡是請求從一個入口進來,需要分發給後端不同的機器時,就需要負載均衡。
區域網負載均衡
在上圖中,負載均衡發生在區域網內部。在這裡,常用的閘道器軟體有Nginx/HAProxy/F5/LVS/各種雲上的SLB等。
廣域網負載均衡
在上圖之外,還有廣域網負載均衡。這通常發生在域名伺服器上,而不是區域網內部。
同1個域名,對映到不同的區域網叢集。
負載均衡演算法
常用的負載均衡演算法:隨機,輪詢(Round Robin),最小資源數,hash。
分散式快取
在上圖中,當DB負載過高,我需要為Service機器加快取時,就遇到一個基本問題:
如果使用local的記憶體做快取,則其他Service機器就沒辦法共用此快取。
因次,我需要一個可以讓所有Service機器共享的快取,這就是分散式快取。
常用的分散式快取元件:Memcached/Redis/Tair等
分散式檔案系統
在上圖中,當我要儲存客戶端上傳的圖片檔案時,就會遇到另一個基本問題:我不能把圖片存在每個Tomcat的本地檔案系統裡面,這樣的話,其他機器就沒辦法訪問了。我需要一個讓所有機器可以共享的檔案系統,這就是分散式檔案系統。
常用的分散式檔案系統:MogileFS/TFS/HDFS/Amazon S3/OpenStack Swift等
當使用了分散式檔案系統,對外提供圖片url訪問服務時,就會遇到另一個基本問題:如果每次檔案的訪問,都要到分散式檔案系統裡面去取,效率和負載就可能成為問題。
為此,就需要引入CDN。
常用的CDN廠商,比如ChinCache。當然,現在的各種雲端儲存,比如七牛雲,阿里雲,騰訊雲,已經自帶了CDN。
分散式RPC
分散式系統的一個基本問題就是:機器與機器之間如何通訊? 我們都知道底層原理是TCP/IP,Socket。
但一般很少有人會去裸寫Socket,實現機器之間的通訊。這裡,最常用的元件就是RPC。
最簡單的實現RPC的方式就是使用http。當然,業界有很多成熟的開源RPC框架,如Facebook的Thrift, 阿里的Dubbo,點評的Pigeon。。
在RPC內部,一般都自己實現了負載均衡。還有更復雜的,如多版本,服務降級等。
補充一句:雖然底層原理都是Socket,但使用不同框架/元件時,通常都有其自己的跨機器通訊方式,比如MySQLJDBC,RPC, 訊息中介軟體等。
分散式資料庫
在上圖中,DB是單一節點。當訪問量達到一定程度,就會涉及到Mysql的分庫分表問題。
分庫/分表之後,就會涉及到join的問題,分散式事務的問題。
關於分庫分表,業界也早有成熟方案。對上層遮蔽分庫分表,sql的執行,像是在單庫一樣。
還有像MongoDB這種Nosql資料庫,天生是分散式的。但同樣會面對Mysql分庫分表所要面對的問題。
還有像阿里的OceanBase,有Mysql的強一致性保證,又是分散式的,還可以支援分散式事務。
分散式訊息中介軟體
在上圖中,沒有提及到訊息中介軟體。相對其他基本問題,這個需要一個更適合的業務場景來談,在以後的章節中,會再詳述。
常用的訊息中介軟體,比如老一輩的ActiveMQ/RabbitMQ, 新一點的,阿里的RocketMQ,LinkedIn的Kafka等。
訊息中介軟體的一個典型場景就是:通過最終一致性,解決上面的分散式事務問題。
分散式session問題
在傳統的單機版應用中,我們經常使用session。而當單機擴充套件到多機,單機的session就沒辦法被其他機器所訪問。
此時就需要使用分散式session,把session存放在一個所有Tomcat都可以訪問的地方。
關於分散式session,業界早有成熟方案,在此不再詳述。
總結
本文羅列了分散式系統的各種基本問題和業界常用的技術,希望建立起分散式系統的一個巨集觀圖譜。
後續,會針對各個領域,逐個剖析!
相關文章
- Java 從入門到高階學習路線Java
- Java進階學習之Java架構師的學習路線Java架構
- 會計進階學習路線圖
- 鴻洋大神的安卓學習推薦書單!入門到進階,架構師學習分享!安卓架構
- Go 語言進階學習路線圖Go
- Java新手入門學習路線圖Java
- .NET 入門到高階路線
- 圖解分散式架構的演進圖解分散式架構
- Java學習路線從入門到入土Java
- Java學習福利,入門到精通學習路線分享Java
- Linux學習路線圖,入門教程分享Linux
- Linux學習路線圖,入門教程分享。Linux
- Linux學習路線圖(從入門到上崗,帶自學路線圖)Linux
- Java學習路線·進階Java
- Python學習路線·進階Python
- 我的機器學習入門路線圖機器學習
- 阿里P8架構師進階心得:分散式資料庫架構MyCat學習筆記送給你阿里架構分散式資料庫筆記
- 圖解分散式架構的演進過程!圖解分散式架構
- 從入門到精通,Java學習路線導航Java
- php從入門到精通的學習路線分享PHP
- Java學習路線·入門Java
- elk 入門到進階
- spring cloud微服務分散式雲架構-Gateway入門SpringCloud微服務分散式架構Gateway
- 圖解分散式架構的發展和演進圖解分散式架構
- 2018大資料學習路線從入門到精通大資料
- 新手入門 如何快速找到Python進階路線?Python
- Redis從入門到進階Redis
- 分散式機器學習中的模型架構分散式機器學習模型架構
- 如何學習Python?Python學習入門路線Python
- [譯]怎樣學習React—從初級到高階路線圖React
- .NET Web入門到高階路線(新版本)Web
- 2018最新大資料學習路線從入門到精通大資料
- Java從入門到精通的學習路線你知道嗎?Java
- 大資料學習路線教程圖,如何快速入門Spark大資料Spark
- 學習Java架構師的路線分享Java架構
- java培訓分享:java培訓架構師學習線路圖Java架構
- 大資料架構師從入門到精通 學習必看寶典大資料架構
- Laravel 入門到進階-推薦Laravel