Tomcat組成與工作原理

VectorJin發表於2017-04-10

Tomcat是什麼

開源的 Java Web 應用伺服器，實現了 Java EE(Java Platform Enterprise Edition)的部分技術規範，比如 Java Servlet、Java Server Page、JSTL、Java WebSocket。Java EE 是 Sun 公司為企業級應用推出的標準平臺，定義了一系列用於企業級開發的技術規範，除了上述的之外，還有 EJB、Java Mail、JPA、JTA、JMS 等，而這些都依賴具體容器的實現。

上圖對比了 Java EE 容器的實現情況，Tomcat 和 Jetty 都只提供了 Java Web 容器必需的 Servlet 和 JSP 規範，開發者要想實現其他的功能，需要自己依賴其他開源實現。

Glassfish 是由 sun 公司推出，Java EE 最新規範出來之後，首先會在 Glassfish 上進行實現，所以是研究 Java EE 最新技術的首選。

最常見的情況是使用 Tomcat 作為 Java Web 伺服器，使用 Spring 提供的開箱即用的強大的功能，並依賴其他開源庫來完成負責的業務功能實現。

Servlet容器

Tomcat 組成如下圖：
主要有 Container 和 Connector 以及相關元件構成。

Server：指的就是整個 Tomcat 服務器，包含多組服務，負責管理和啟動各個 Service，同時監聽 8005 埠發過來的 shutdown 命令，用於關閉整個容器；

Service：Tomcat 封裝的、對外提供完整的、基於元件的 web 服務，包含 Connectors、Container 兩個核心元件，以及多個功能元件，各個 Service 之間是獨立的，但是共享同一 JVM 的資源；

Connector：Tomcat 與外部世界的聯結器，監聽固定埠接收外部請求，傳遞給 Container，並將 Container 處理的結果返回給外部；

Container：Catalina，Servlet 容器，內部有多層容器組成，用於管理 Servlet 生命週期，呼叫 servlet 相關方法。

Loader：封裝了 Java ClassLoader，用於 Container 載入類檔案； Realm：Tomcat 中為 web 應用程式提供訪問認證和角色管理的機制；

JMX：Java SE 中定義技術規範，是一個為應用程式、裝置、系統等植入管理功能的框架，通過 JMX 可以遠端監控 Tomcat 的執行狀態；

Jasper：Tomcat 的 Jsp 解析引擎，用於將 Jsp 轉換成 Java 檔案，並編譯成 class 檔案。 Session：負責管理和建立 session，以及 Session 的持久化(可自定義)，支援 session 的集
群。

Pipeline：在容器中充當管道的作用，管道中可以設定各種 valve(閥門)，請求和響應在經由管道中各個閥門處理，提供了一種靈活可配置的處理請求和響應的機制。

Naming：命名服務，JNDI， Java 命名和目錄介面，是一組在 Java 應用中訪問命名和目錄服務的 API。命名服務將名稱和物件聯絡起來，使得我們可以用名稱訪問物件，目錄服務也是一種命名服務，物件不但有名稱，還有屬性。Tomcat 中可以使用 JNDI 定義資料來源、配置資訊，用於開發與部署的分離。

Container組成

Engine：Servlet 的頂層容器，包含一個或多個 Host 子容器；
Host：虛擬主機，負責 web 應用的部署和 Context 的建立；
Context：Web 應用上下文，包含多個 Wrapper，負責 web 配置的解析、管理所有的 Web 資源；
Wrapper：最底層的容器，是對 Servlet 的封裝，負責 Servlet 例項的創建、執行和銷燬。

生命週期管理
Tomcat 為了方便管理元件和容器的生命週期，定義了從建立、啟動、到停止、銷燬共 12 中狀態，tomcat 生命週期管理了內部狀態變化的規則控制，元件和容器只需實現相應的生命週期方法即可完成各生命週期內的操作(initInternal、startInternal、stopInternal、 destroyInternal)；

比如執行初始化操作時，會判斷當前狀態是否 New，如果不是則丟擲生命週期異常；是的話則設定當前狀態為 Initializing，並執行 initInternal 方法，由子類實現，方法執行成功則設定當前狀態為 Initialized，執行失敗則設定為 Failed 狀態；

Tomcat 的生命週期管理引入了事件機制，在元件或容器的生命週期狀態發生變化時會通知事件監聽器，監聽器通過判斷事件的型別來進行相應的操作。
事件監聽器的新增可以在 server.xml 檔案中進行配置;

Tomcat 各類容器的配置過程就是通過新增 listener 的方式來進行的，從而達到配置邏輯與容器的解耦。如 EngineConfig、HostConfig、ContextConfig。
EngineConfig：主要列印啟動和停止日誌
HostConfig：主要處理部署應用，解析應用 META-INF/context.xml 並建立應用的 Context ContextConfig：主要解析併合並 web.xml，掃描應用的各類 web 資源 (filter、servlet、listener)

Tomcat 的啟動過程

啟動從 Tomcat 提供的 start.sh 指令碼開始，shell 指令碼會呼叫 Bootstrap 的 main 方法，實際呼叫了 Catalina 相應的 load、start 方法。

load 方法會通過 Digester 進行 config/server.xml 的解析，在解析的過程中會根據 xml 中的關係和配置資訊來建立容器，並設定相關的屬性。接著 Catalina 會呼叫 StandardServer 的 init 和 start 方法進行容器的初始化和啟動。

按照 xml 的配置關係，server 的子元素是 service，service 的子元素是頂層容器 Engine，每層容器有持有自己的子容器，而這些元素都實現了生命週期管理的各個方法，因此就很容易的完成整個容器的啟動、關閉等生命週期的管理。

StandardServer 完成 init 和 start 方法呼叫後，會一直監聽來自 8005 埠(可配置)，如果接收到 shutdown 命令，則會退出迴圈監聽，執行後續的 stop 和 destroy 方法，完成 Tomcat 容器的關閉。同時也會呼叫 JVM 的 Runtime.getRuntime()﴿.addShutdownHook 方法，在虛擬機器意外退出的時候來關閉容器。

所有容器都是繼承自 ContainerBase，基類中封裝了容器中的重複工作，負責啟動容器相關的組件 Loader、Logger、Manager、Cluster、Pipeline，啟動子容器(執行緒池併發啟動子容器，通過執行緒池 submit 多個執行緒，呼叫後返回 Future 物件，執行緒內部啟動子容器，接著呼叫 Future 物件的 get 方法來等待執行結果)。

List<Future<Void>> results = new ArrayList<Future<Void>>();
for (int i = 0; i < children.length; i++) {
    results.add(startStopExecutor.submit(new StartChild(children[i])));
}
boolean fail = false;
for (Future<Void> result ： results) {
    try {
        result.get();
    } catch (Exception e) {
        log.error(sm.getString("containerBase.threadedStartFailed")， e);
        fail = true;
    }
}複製程式碼

Web 應用的部署方式
注：catalina.home：安裝目錄;catalina.base：工作目錄;預設值 user.dir

Server.xml 配置 Host 元素，指定 appBase 屬性，預設\$catalina.base/webapps/
Server.xml 配置 Context 元素，指定 docBase，元素，指定 web 應用的路徑
自定義配置：在\$catalina.base/EngineName/HostName/XXX.xml 配置 Context 元素

HostConfig 監聽了 StandardHost 容器的事件，在 start 方法中解析上述配置檔案：

掃描 appbase 路徑下的所有資料夾和 war 包，解析各個應用的 META-INF/context.xml，並建立 StandardContext，並將 Context 加入到 Host 的子容器中。
解析$catalina.base/EngineName/HostName/下的所有 Context 配置，找到相應 web 應用的位置，解析各個應用的 META-INF/context.xml，並建立 StandardContext，並將 Context 加入到 Host 的子容器中。

注：

HostConfig 並沒有實際解析 Context.xml，而是在 ContextConfig 中進行的。
HostConfig 中會定期檢查 watched 資原始檔(context.xml 配置檔案)

ContextConfig 解析 context.xml 順序：

先解析全域性的配置 config/context.xml
然後解析 Host 的預設配置 EngineName/HostName/context.xml.default
最後解析應用的 META-INF/context.xml

ContextConfig 解析 web.xml 順序：

先解析全域性的配置 config/web.xml
然後解析 Host 的預設配置 EngineName/HostName/web.xml.default 接著解析應用的 MEB-INF/web.xml
掃描應用 WEB-INF/lib/下的 jar 檔案，解析其中的 META-INF/web-fragment.xml 最後合併 xml 封裝成 WebXml，並設定 Context

注：

掃描 web 應用和 jar 中的註解(Filter、Listener、Servlet)就是上述步驟中進行的。
容器的定期執行：backgroundProcess，由 ContainerBase 來實現的，並且只有在頂層容器中才會開啟執行緒。(backgroundProcessorDelay=10 標誌位來控制)

Servlet 生命週期

Servlet 是用 Java 編寫的伺服器端程式。其主要功能在於互動式地瀏覽和修改資料，生成動態 Web 內容。

請求到達 server 端，server 根據 url 對映到相應的 Servlet
判斷 Servlet 例項是否存在，不存在則載入和例項化 Servlet 並呼叫 init 方法
Server 分別建立 Request 和 Response 物件，呼叫 Servlet 例項的 service 方法(service 方法內部會根據 http 請求方法型別呼叫相應的 doXXX 方法)
doXXX 方法內為業務邏輯實現，從 Request 物件獲取請求引數，處理完畢之後將結果通過 response 物件返回給呼叫方
當 Server 不再需要 Servlet 時(一般當 Server 關閉時)，Server 呼叫 Servlet 的 destroy() 方法。

load on startup

當值為 0 或者大於 0 時，表示容器在應用啟動時就載入這個 servlet; 當是一個負數時或者沒有指定時，則指示容器在該 servlet 被選擇時才載入; 正數的值越小，啟動該 servlet 的優先順序越高;

single thread model

每次訪問 servlet，新建 servlet 實體物件，但並不能保證執行緒安全，同時 tomcat 會限制 servlet 的例項數目
最佳實踐：不要使用該模型，servlet 中不要有全域性變數

請求處理過程

根據 server.xml 配置的指定的 connector 以及埠監聽 http、或者 ajp 請求
請求到來時建立連線,解析請求引數,建立 Request 和 Response 物件,呼叫頂層容器 pipeline 的 invoke 方法
容器之間層層呼叫,最終呼叫業務 servlet 的 service 方法
Connector 將 response 流中的資料寫到 socket 中

Pipeline 與 Valve

Pipeline 可以理解為現實中的管道,Valve 為管道中的閥門,Request 和 Response 物件在管道中經過各個閥門的處理和控制。

每個容器的管道中都有一個必不可少的 basic valve,其他的都是可選的,basic valve 在管道中最後呼叫,同時負責呼叫子容器的第一個 valve。

Valve 中主要的三個方法:setNext、getNext、invoke;valve 之間的關係是單向鏈式結構,本身 invoke 方法中會呼叫下一個 valve 的 invoke 方法。

各層容器對應的 basic valve 分別是 StandardEngineValve、StandardHostValve、 StandardContextValve、StandardWrapperValve。

JSP引擎

JSP 生命週期

編譯階段:servlet 容器編譯 servlet 源文
件,生成 servlet 類
初始化階段:載入與 JSP 對應的 servlet 類, 建立其例項,並呼叫它的初始化方法
執行階段:呼叫與 JSP 對應的 servlet 例項的服務方法
銷燬階段:呼叫與 JSP 對應的 servlet 例項的銷燬方法,然後銷燬 servlet 例項

JSP元素
程式碼片段： <% 程式碼片段 %>
JSP宣告： <%! declaration; [ declaration; ]+ ... %>
JSP表示式：<%= 表示式 %>
JSP註釋： <%-- 註釋 --%>
JSP指令： <%@ directive attribute=“value” %>
JSP行為：
HTML元素： html/head/body/div/p/…
JSP隱式物件：request、response、out、session、application、config、
pageContext、page、Exception

JSP 元素說明
程式碼片段:包含任意量的 Java 語句、變數、方法或表示式;
JSP 宣告:一個宣告語句可以宣告一個或多個變數、方法,供後面的 Java 程式碼使用;
JSP 表示式:輸出 Java 表示式的值,String 形式;
JSP 註釋:為程式碼作註釋以及將某段程式碼註釋掉
JSP 指令:用來設定與整個 JSP 頁面相關的屬性,
<%@ page ... %>定義頁面的依賴屬性,比如 language、contentType、errorPage、 isErrorPage、import、isThreadSafe、session 等等
<%@ include ... %>包含其他的 JSP 檔案、HTML 檔案或文字檔案,是該 JSP 檔案的一部分,會被同時編譯執行
<%@ taglib ... %>引入標籤庫的定義,可以是自定義標籤
JSP 行為:jsp:include、jsp:useBean、jsp:setProperty、jsp:getProperty、jsp:forward

Jsp 解析過程

程式碼片段:在_jspService()方法內直接輸出
JSP 宣告: 在 servlet 類中進行輸出
JSP 表示式:在_jspService()方法內直接輸出
JSP 註釋:直接忽略,不輸出
JSP 指令:根據不同指令進行區分,include:對引入的檔案進行解析;page 相關的屬性會做為 JSP 的屬性,影響的是解析和請求處理時的行為
JSP 行為:不同的行為有不同的處理方式,jsp:useBean 為例,會從 pageContext 根據 scope 的類別獲取 bean 物件,如果沒有會建立 bean,同時存到相應 scope 的 pageContext 中
HTML:在_jspService()方法內直接輸出
JSP 隱式物件:在_jspService()方法會進行宣告,只能在方法中使用;

Connector

Http:HTTP 是超文字傳輸協議,是客戶端瀏覽器或其他程式與 Web 伺服器之間的應用層通訊協議
AJP:Apache JServ 協議(AJP)是一種二進位制協議,專門代理從 Web 伺服器到位於後端的應用程式伺服器的入站請求
阻塞 IO

非阻塞 IO

IO多路複用

阻塞與非阻塞的區別在於進行讀操作和寫操作的系統呼叫時，如果此時核心態沒有資料可讀或者沒有緩衝空間可寫時，是否阻塞。

IO多路複用的好處在於可同時監聽多個socket的可讀和可寫事件，這樣就能使得應用可以同時監聽多個socket，釋放了應用執行緒資源。

Tomcat各類Connector對比

Connector的實現模式有三種，分別是BIO、NIO、APR，可以在server.xml中指定。

JIO：用java.io編寫的TCP模組，阻塞IO
NIO：用java.nio編寫的TCP模組，非阻塞IO，（IO多路複用）
APR：全稱Apache Portable Runtime，使用JNI的方式來進行讀取檔案以及進行網路傳輸

Apache Portable Runtime是一個高度可移植的庫，它是Apache HTTP Server 2.x的核心。 APR具有許多用途，包括訪問高階IO功能（如sendfile，epoll和OpenSSL），作業系統級功能（隨機數生成，系統狀態等）和本地程式處理（共享記憶體，NT管道和Unix套接字）。

表格中欄位含義說明：

Support Polling：是否支援基於IO多路複用的socket事件輪詢
Polling Size：輪詢的最大連線數
Wait for next Request：在等待下一個請求時，處理執行緒是否釋放，BIO是沒有釋放的，所以在keep-alive=true的情況下處理的併發連線數有限
Read Request Headers：由於request header資料較少，可以由容器提前解析完畢，不需要阻塞
Read Request Body：讀取request body的資料是應用業務邏輯的事情，同時Servlet的限制，是需要阻塞讀取的
Write Response：跟讀取request body的邏輯類似，同樣需要阻塞寫

NIO處理相關類

Acceptor執行緒負責接收連線，呼叫accept方法阻塞接收建立的連線，並對socket進行封裝成PollerEvent，指定註冊的事件為op_read，並放入到EventQueue佇列中，PollerEvent的run方法邏輯的是將Selector註冊到socket的指定事件；

Poller執行緒從EventQueue獲取PollerEvent，並執行PollerEvent的run方法，呼叫Selector的select方法，如果有可讀的Socket則建立Http11NioProcessor，放入到執行緒池中執行；

CoyoteAdapter是Connector到Container的介面卡，Http11NioProcessor呼叫其提供的service方法，內部建立Request和Response物件，並呼叫最頂層容器的Pipeline中的第一個Valve的invoke方法

Mapper主要處理http url 到servlet的對映規則的解析，對外提供map方法

NIO Connector主要引數

Comet

Comet是一種用於web的推送技術，能使伺服器實時地將更新的資訊傳送到客戶端，而無須客戶端發出請求
在WebSocket出來之前，如果不適用comet，只能通過瀏覽器端輪詢Server來模擬實現伺服器端推送。
Comet支援servlet非同步處理IO，當連線上資料可讀時觸發事件，並非同步寫資料(阻塞)

Tomcat要實現Comet，只需繼承HttpServlet同時，實現CometProcessor介面

Begin：新的請求連線接入呼叫，可進行與Request和Response相關的物件初始化操作，並儲存response物件，用於後續寫入資料
Read：請求連線有資料可讀時呼叫
End：當資料可用時，如果讀取到檔案結束或者response被關閉時則被呼叫
Error：在連線上發生異常時呼叫，資料讀取異常、連線斷開、處理異常、socket超時

Note：

Read：在post請求有資料，但在begin事件中沒有處理，則會呼叫read，如果read沒有讀取資料，在會觸發Error回撥，關閉socket
End：當socket超時，並且response被關閉時也會呼叫；server被關閉時呼叫
Error：除了socket超時不會關閉socket，其他都會關閉socket
End和Error時間觸發時應關閉當前comet會話，即呼叫CometEvent的close方法
Note：在事件觸發時要做好執行緒安全的操作

非同步Servlet

傳統流程：

首先，Servlet 接收到請求之後，request資料解析；
接著，呼叫業務介面的某些方法，以完成業務處理；
最後，根據處理的結果提交響應，Servlet 執行緒結束

非同步處理流程：

客戶端傳送一個請求
Servlet容器分配一個執行緒來處理容器中的一個servlet
servlet呼叫request.startAsync()，儲存AsyncContext, 然後返回
任何方式存在的容器執行緒都將退出，但是response仍然保持開放
業務執行緒使用儲存的AsyncContext來完成響應（執行緒池）
客戶端收到響應

Servlet 執行緒將請求轉交給一個非同步執行緒來執行業務處理，執行緒本身返回至容器，此時 Servlet 還沒有生成響應資料，非同步執行緒處理完業務以後，可以直接生成響應資料（非同步執行緒擁有 ServletRequest 和 ServletResponse 物件的引用）

為什麼web應用中支援非同步？

推出非同步，主要是針對那些比較耗時的請求：比如一次緩慢的資料庫查詢，一次外部REST API呼叫, 或者是其他一些I/O密集型操作。這種耗時的請求會很快的耗光Servlet容器的執行緒池，繼而影響可擴充套件性。

Note：從客戶端的角度來看，request仍然像任何其他的HTTP的request-response互動一樣，只是耗費了更長的時間而已

非同步事件監聽

onStartAsync：Request呼叫startAsync方法時觸發
onComplete：syncContext呼叫complete方法時觸發
onError：處理請求的過程出現異常時觸發
onTimeout：socket超時觸發

Note :
onError/ onTimeout觸發後，會緊接著回撥onComplete
onComplete 執行後，就不可再操作request和response

解密HTTP協議：探索其組成部分與工作原理
2023-04-18
解密HTTP協議
IIC序列匯流排的組成及工作原理
2019-01-26
Jetty 的工作原理以及與 Tomcat 的比較
2017-05-04
JettyTomcat
Tomcat的簡單工作原理
2017-07-26
Tomcat
在計算機組成原理中x,計算機組成原理
2023-03-08
計算機
計算機組成原理與介面技術（二）
2018-04-01
計算機
計算機組成原理與作業系統第二章處理機組成與管理
2024-11-13
計算機作業系統
計算機組成原理
2023-03-08
計算機
（計算機組成原理）RISC與CISC的區別
2023-03-06
計算機
【Tomcat】Tomcat工作原理及簡單模擬實現
2019-03-15
Tomcat
【Tomcat】Tomcat原理與系統架構
2020-12-24
Tomcat架構
計算機組成與系統結構 cache 原理與計算
2020-11-25
計算機
計算機組成原理與介面技術筆記（一）
2018-03-30
計算機筆記
你還記得 Tomcat 的工作原理麼
2020-09-14
Tomcat
AD域與工作組
2015-06-16
tomcat伺服器訪問網址組成
2016-08-02
Tomcat伺服器
教你如何成為Oracle 10g OCP - 第十三章補充：RMAN的組成及工作原理
2011-07-11
Oracle 10g
IP組播基礎及工作原理——1
2017-12-25
計算機組成原理-全套影片教程
2021-07-21
計算機
計算機組成原理-錯題本
2020-12-21
計算機
計算機組成原理——I/O通道
2020-12-15
計算機
計算機組成原理 - 計算篇
2020-11-26
計算機
計算機組成原理核心考點
2024-10-08
計算機
王道計算機組成原理筆記
2024-08-17
計算機筆記
計算機組成與體系結構-CPU組成
2024-07-27
計算機
MPLS基礎與工作原理
2022-05-17
SSD結構與工作原理
2020-10-29
工作流引擎的工作原理與功能
2020-07-14
計算機組成原理-全套視訊教程
2021-07-21
計算機
計算機組成原理之記憶體
2017-01-11
計算機記憶體
四軸飛行器的原理和組成
2015-03-18
計算機組成原理學習 Part 2
2024-06-17
計算機
計算機組成原理複習0625
2024-06-25
計算機
tomcat原理
2016-04-22
Tomcat
PPPoE工作原理與幀格式薦
2006-10-17
Tomcat長輪詢原理與原始碼解析
2023-04-16
Tomcat原始碼
計算機組成原理學習筆記一
2020-12-15
計算機筆記
計算機組成原理期末考試題
2020-11-22
計算機