[分散式]Nginx系列文章---深入淺出Nginx

加瓦一枚發表於2019-01-16

前言

Nginx是一款輕量級的Web伺服器、反向代理伺服器,由於它的記憶體佔用少,啟動極快,高併發能力強,在網際網路專案中廣泛應用。

架構圖

上圖基本上說明了當下流行的技術架構,其中Nginx有點入口閘道器的味道。

 

反向代理伺服器?

經常聽人說到一些術語,如反向代理,那麼什麼是反向代理,什麼又是正向代理呢?

正向代理:

正向代理示意圖

反向代理:

反向代理示意圖

由於防火牆的原因,我們並不能直接訪問谷歌,那麼我們可以藉助VPN來實現,這就是一個簡單的正向代理的例子。這裡你能夠發現,正向代理“代理”的是客戶端,而且客戶端是知道目標的,而目標是不知道客戶端是通過VPN訪問的。

當我們在外網訪問百度的時候,其實會進行一個轉發,代理到內網去,這就是所謂的反向代理,即反向代理“代理”的是伺服器端,而且這一個過程對於客戶端而言是透明的。

 

Nginx的Master-Worker模式

 

nginx程式

啟動Nginx後,其實就是在80埠啟動了Socket服務進行監聽,如圖所示,Nginx涉及Master程式和Worker程式。

 

Master-Worker模式

 

nginx.conf

Master程式的作用是?

讀取並驗證配置檔案nginx.conf;管理worker程式;

Worker程式的作用是?

每一個Worker程式都維護一個執行緒(避免執行緒切換),處理連線和請求;注意Worker程式的個數由配置檔案決定,一般和CPU個數相關(有利於程式切換),配置幾個就有幾個Worker程式。

思考:Nginx如何做到熱部署?

所謂熱部署,就是配置檔案nginx.conf修改後,不需要stop Nginx,不需要中斷請求,就能讓配置檔案生效!(nginx -s reload 重新載入/nginx -t檢查配置/nginx -s stop

通過上文我們已經知道worker程式負責處理具體的請求,那麼如果想達到熱部署的效果,可以想象:

方案一:

修改配置檔案nginx.conf後,主程式master負責推送給woker程式更新配置資訊,woker程式收到資訊後,更新程式內部的執行緒資訊。(有點valatile的味道)

方案二:

修改配置檔案nginx.conf後,重新生成新的worker程式,當然會以新的配置進行處理請求,而且新的請求必須都交給新的worker程式,至於老的worker程式,等把那些以前的請求處理完畢後,kill掉即可。

Nginx採用的就是方案二來達到熱部署的!

思考:Nginx如何做到高併發下的高效處理?

上文已經提及Nginx的worker程式個數與CPU繫結、worker程式內部包含一個執行緒高效迴環處理請求,這的確有助於效率,但這是不夠的。

作為專業的程式設計師,我們可以開一下腦洞:BIO/NIO/AIO、非同步/同步、阻塞/非阻塞...

要同時處理那麼多的請求,要知道,有的請求需要發生IO,可能需要很長時間,如果等著它,就會拖慢worker的處理速度。

Nginx採用了Linux的epoll模型,epoll模型基於事件驅動機制,它可以監控多個事件是否準備完畢,如果OK,那麼放入epoll佇列中,這個過程是非同步的。worker只需要從epoll佇列迴圈處理即可。

思考:Nginx掛了怎麼辦?

Nginx既然作為入口閘道器,很重要,如果出現單點問題,顯然是不可接受的。

答案是:Keepalived+Nginx實現高可用

Keepalived是一個高可用解決方案,主要是用來防止伺服器單點發生故障,可以通過和Nginx配合來實現Web服務的高可用。(其實,Keepalived不僅僅可以和Nginx配合,還可以和很多其他服務配合)

Keepalived+Nginx實現高可用的思路:

第一:請求不要直接打到Nginx上,應該先通過Keepalived(這就是所謂虛擬IP,VIP)

第二:Keepalived應該能監控Nginx的生命狀態(提供一個使用者自定義的指令碼,定期檢查Nginx程式狀態,進行權重變化,,從而實現Nginx故障切換)

 

Keepalived+Nginx

 

我們的主戰場:nginx.conf

很多時候,在開發、測試環境下,我們都得自己去配置Nginx,就是去配置nginx.conf。

nginx.conf是典型的分段配置檔案,下面我們來分析下。

虛擬主機

http的server段

 

訪問結果

其實這是把Nginx作為web server來處理靜態資源。

第一:location可以進行正則匹配,應該注意正則的幾種形式以及優先順序。(這裡不展開)

第二:Nginx能夠提高速度的其中一個特性就是:動靜分離,就是把靜態資源放到Nginx上,由Nginx管理,動態請求轉發給後端。

第三:我們可以在Nginx下把靜態資源、日誌檔案歸屬到不同域名下(也即是目錄),這樣方便管理維護。

第四:Nginx可以進行IP訪問控制,有些電商平臺,就可以在Nginx這一層,做一下處理,內建一個黑名單模組,那麼就不必等請求通過Nginx達到後端在進行攔截,而是直接在Nginx這一層就處理掉。

反向代理【proxy_pass】

所謂反向代理,很簡單,其實就是在location這一段配置中的root替換成proxy_pass即可。root說明是靜態資源,可以由Nginx進行返回;而proxy_pass說明是動態請求,需要進行轉發,比如代理到Tomcat上。

反向代理,上面已經說了,過程是透明的,比如說request -> Nginx -> Tomcat,那麼對於Tomcat而言,請求的IP地址就是Nginx的地址,而非真實的request地址,這一點需要注意。不過好在Nginx不僅僅可以反向代理請求,還可以由使用者自定義設定HTTP HEADER

負載均衡【upstream】

上面的反向代理中,我們通過proxy_pass來指定Tomcat的地址,很顯然我們只能指定一臺Tomcat地址,那麼我們如果想指定多臺來達到負載均衡呢?

第一,通過upstream來定義一組Tomcat,並指定負載策略(IPHASH、加權論調、最少連線),健康檢查策略(Nginx可以監控這一組Tomcat的狀態)等。

第二,將proxy_pass替換成upstream指定的值即可。

負載均衡可能帶來的問題?

負載均衡所帶來的明顯的問題是,一個請求,可以到A server,也可以到B server,這完全不受我們的控制,當然這也不是什麼問題,只是我們得注意的是:使用者狀態的儲存問題,如Session會話資訊,不能在儲存到伺服器上。

快取

快取,是Nginx提供的,可以加快訪問速度的機制,說白了,在配置上就是一個開啟,同時指定目錄,讓快取可以儲存到磁碟上。具體配置,大家可以參考Nginx官方文件,這裡就不在展開了。



作者:張豐哲
連結:https://www.jianshu.com/p/5eab0f83e3b4
來源:簡書
簡書著作權歸作者所有,任何形式的轉載都請聯絡作者獲得授權並註明出處。

相關文章