理解本真的REST架構風格

hiekay發表於2019-01-10

引子

在移動網際網路、雲端計算迅猛發展的今天,作為一名Web開發者,如果您還沒聽說過“REST”這個buzzword,顯然已經落伍了。誇張點說,甚至“出了門都不好意思跟別人打招呼”。儘管如此,對於REST這個泊來品的理解,大多數人(包括一些資深的架構師)仍然停留在“盲人摸象”的階段。常常聽到各種各樣關於REST的說法,例如:有人說:“我們這套新的API決定不用Web Service(SOAP+WSDL),而是直接使用HTTP+JSON,也就是用RESTful的方式來開發。” 不用SOAP,甚至也不用XML,就自動變成了RESTful了。還有人認為:REST與傳統的Web Service其實沒有本質區別,只是對於URI的構造方式提出了更多要求,而這些要求Web Service完全都可以實現。潛臺詞是:既生瑜,何生亮。Web Service已經足夠好了,幹嘛還要再折騰什麼REST。這些對於REST的不同說法,果真如此嗎?REST究竟是什麼?是一種新的技術、一種新的架構、還是一種新的規範?

對於這些問題筆者先不解答,為了深入理解REST是什麼,我們需要回顧一下Web發展的最初年代,從源頭上講講REST是怎麼得來的。

Web(全球資訊網World Wide Web的簡稱)是個包羅永珍的萬花筒,不同的人從不同的角度觀察,對於Web究竟是什麼會得出大不相同的觀點。作為Web開發者,我們需要從技術上來理解Web。從技術架構層面上看,Web的技術架構包括了四個基石:

  • URI
  • HTTP
  • HyperText(除了HTML外,也可以是帶有超連結的XML或JSON)
  • MIME

這四個基石相互支撐,促使Web這座巨集偉的大廈以幾何級數的速度發展了起來。在這四個基石之上,Web開發技術的發展可以粗略劃分成以下幾個階段:

  1. 靜態內容階段:在這個最初的階段,使用Web的主要是一些研究機構。Web由大量的靜態HTML文件組成,其中大多是一些學術論文。Web伺服器可以被看作是支援超文字的共享檔案伺服器。
  2. CGI程式階段:在這個階段,Web伺服器增加了一些程式設計API。通過這些API編寫的應用程式,可以向客戶端提供一些動態變化的內容。Web伺服器與應用程式之間的通訊,通過CGI(Common Gateway Interface)協議完成,應用程式被稱作CGI程式。
  3. 指令碼語言階段:在這個階段,伺服器端出現了ASP、PHP、JSP、ColdFusion等支援session的指令碼語言技術,瀏覽器端出現了Java Applet、JavaScript等技術。使用這些技術,可以提供更加豐富的動態內容。

3.瘦客戶端應用階段:在這個階段,在伺服器端出現了獨立於Web伺服器的應用伺服器。同時出現了Web MVC開發模式,各種Web MVC開發框架逐漸流行,並且佔據了統治地位。基於這些框架開發的Web應用,通常都是瘦客戶端應用,因為它們是在伺服器端生成全部的動態內容。

  1. RIA應用階段:在這個階段,出現了多種RIA(Rich Internet Application)技術,大幅改善了Web應用的使用者體驗。應用最為廣泛的RIA技術是DHTML+Ajax。Ajax技術支援在不重新整理頁面的情況下動態更新頁面中的區域性內容。同時誕生了大量的Web前端DHTML開發庫,例如Prototype、Dojo、ExtJS、jQuery/jQuery UI等等,很多開發庫都支援單頁面應用(Single Page Application)的開發。其他的RIA技術還有Adobe公司的Flex、微軟公司的Silverlight、Sun公司的JavaFX(現在為Oracle公司所有)等等。
  2. 移動Web應用階段:在這個階段,出現了大量面向移動裝置的Web應用開發技術。除了Android、iOS、Windows Phone等作業系統平臺原生的開發技術之外,基於HTML5的開發技術也變得非常流行。

從上述Web開發技術的發展過程看,Web從最初其設計者所構思的主要支援靜態文件的階段,逐漸變得越來越動態化。Web應用的互動模式,變得越來越複雜:從靜態文件發展到以內容為主的入口網站、電子商務網站、搜尋引擎、社交網站,再到以娛樂為主的大型多人線上遊戲、手機遊戲。

在網際網路行業,實踐總是走在理論的前面。Web發展到了1995年,在CGI、ASP等技術出現之後,沿用了多年、主要面向靜態文件的HTTP/1.0協議已經無法滿足Web應用的開發需求,因此需要設計新版本的HTTP協議。在HTTP/1.0協議專家組之中,有一位年輕人脫穎而出,顯示出了不凡的洞察力,後來他成為了HTTP/1.1協議專家組的負責人。這位年輕人就是Apache HTTP伺服器的核心開發者Roy Fielding,他還是Apache軟體基金會的合作創始人。

Roy Fielding和他的同事們在HTTP/1.1協議的設計工作中,對於Web之所以取得巨大成功,在技術架構方面的因素做了一番深入的總結。Fielding將這些總結納入到了一套理論框架之中,然後使用這套理論框架中的指導原則,來指導HTTP/1.1協議的設計方向。HTTP/1.1協議的第一個草稿是在1996年1月釋出的,經過了三年多時間的修訂,於1999年6月成為了IETF的正式規範(包括了RFC 2616以及用於對客戶端做身份認證的RFC 2617)。HTTP/1.1協議設計的極為成功,以至於釋出之後整整10年時間裡,都沒有多少人認為有修訂的必要。用來指導HTTP/1.1協議設計的這套理論框架,最初是以備忘錄的形式在專家組成員之間交流,除了IETF/W3C的專家圈子,並沒有在外界廣泛流傳。Fielding在完成HTTP/1.1協議的設計工作之後,回到了加州大學歐文分校繼續攻讀自己的博士學位。第二年(2000年)在他的博士學位論文Architectural Styles and the Design of Network-based Software Architectures中,Fielding更為系統、嚴謹地闡述了這套理論框架,並且使用這套理論框架推匯出了一種新的架構風格,並且為這種架構風格取了一個令人輕鬆愉快的名字“REST”——Representational State Transfer(表述性狀態轉移)的縮寫。

在筆者看來,Fielding這篇博士論文在Web發展史上的價值,不亞於Web之父Tim Berners-Lee關於超文字的那篇經典論文。然而遺憾的是,這篇博士論文在誕生之後的將近5年時間裡,一直沒有得到足夠的重視。例如Web Service相關規範SOAP/WSDL的設計者們,顯然不大理解REST是什麼,HTTP/1.1究竟是一個什麼樣的協議、為何要設計成這個樣子。

這種情況在2005年之後有了很大的改善,隨著Ajax、Ruby on Rails等新的Web開發技術的興起,在Web開發技術社群掀起了一場重歸Web架構設計本源的運動,REST架構風格得到了越來越多的關注。在2007年1月,支援REST開發的Ruby on Rails 1.2版正式釋出,並且將支援REST開發作為Rails未來發展中的優先內容。Ruby on Rails的創始人DHH做了一個名為“World of Resources”的精彩演講,DHH在Web開發技術社群中的強大影響力,使得REST一下子處在Web開發技術舞臺的聚光燈之下。

今天,各種流行的Web開發框架,幾乎沒有不支援REST開發的了。大多數Web開發者都是通過閱讀某種REST開發框架的文件,以及通過一些例子程式碼來學習REST開發的。然而,通過例子程式碼來學習REST有非常大的侷限性。因為REST並不是一種具體的技術,也不是一種具體的規範,REST其實是一種內涵非常豐富的架構風格。通過例子程式碼來學習REST,除了學習到一種有趣的Web開發技術之外,並不能全面深入的理解REST究竟是什麼。甚至還會誤以為這些簡單的例子程式碼就是REST本身,REST不過是一種簡單的Web開發技術而已。就像盲人摸象一樣,有的人摸到了象鼻子、有的人摸到了象耳朵、有的人摸到了象腿、有的人摸到了象尾巴。他們都堅信自己感覺到的大象,才是最真實的大象,而其他人的感覺都是錯誤的。

對於不理解REST的Web開發者,人們習慣於展示一些例子程式碼來讓他們理解REST,筆者不贊同上述做法。如果Web開發者想要深入理解REST是什麼,就很難避開Fielding的這篇博士論文。筆者在本文中對於REST是什麼的介紹,也是基於Fielding的博士論文的。儘管如此,筆者強烈建議本文的讀者親自去通讀一下Fielding的博士論文,就像想要了解孔子的思想應該直接去讀《論語》等著作,而不是首先去讀其他人的轉述一樣。筆者在本文中也僅僅是努力不做一個把經書唸錯了的歪嘴和尚而已。那麼,下面我們言歸正傳。

在Fielding的這篇名為Architectural Styles and the Design of Network-based Software Architectures的博士論文(中文版名為《架構風格與基於網路的軟體架構設計》)中,提出了一整套基於網路的軟體(即所謂的“分散式應用”)的設計方法,值得所有分散式應用的開發者仔細閱讀、深入體會。

在論文的前三章中,Fielding在批判性繼承前人研究成果的基礎上,建立起來一整套研究和評價軟體架構的方法論。這套方法論的核心是“架構風格”這個概念。架構風格是一種研究和評價軟體架構設計的方法,它是比架構更加抽象的概念。一種架構風格是由一組相互協作的架構約束來定義的。架構約束是指軟體的執行環境施加在架構設計之上的約束。

在論文的第四章中,Fielding研究了Web這樣一個分散式系統對於軟體架構設計提出了哪些需求。在第五章中,Fielding將第四章Web提出的需求具體化為一些架構約束,通過逐步新增各種架構約束,推匯出來了REST這種新的架構風格。

REST架構風格的推導過程如下圖所示:

[[圖片上傳中…(image-8a3830-1547122290038-2)]](https://camo.githubusercontent.com/c655878962845def2eedcc7283677e396522c43c/687474703a2f2f63646e312e696e666f717374617469632e636f6d2f7265736f757263652f61727469636c65732f756e6465727374616e64696e672d7265737466756c2d7374796c652f7a682f7265736f75726365732f32312e706e67)

圖1:REST所繼承的架構風格約束

在圖1中,每一個橢圓形裡面的縮寫詞代表了一種架構風格,而每一個箭頭邊的單詞代表了一種架構約束。

REST架構風格最重要的架構約束有6個:

  • 客戶-伺服器(Client-Server):通訊只能由客戶端單方面發起,表現為請求-響應的形式。
  • 無狀態(Stateless):通訊的會話狀態(Session State)應該全部由客戶端負責維護。
  • 快取(Cache):響應內容可以在通訊鏈的某處被快取,以改善網路效率。
  • 統一介面(Uniform Interface):通訊鏈的元件之間通過統一的介面相互通訊,以提高互動的可見性。
  • 分層系統(Layered System):通過限制元件的行為(即,每個元件只能“看到”與其互動的緊鄰層),將架構分解為若干等級的層。
  • 按需程式碼(Code-On-Demand,可選):支援通過下載並執行一些程式碼(例如Java Applet、Flash或JavaScript),對客戶端的功能進行擴充套件。

在論文中推匯出的REST架構風格如下圖所示:

[[圖片上傳中…(image-bb7364-1547122290038-1)]](https://camo.githubusercontent.com/d4d73958cfea9204a19baebbd3140e45b6798705/687474703a2f2f63646e312e696e666f717374617469632e636f6d2f7265736f757263652f61727469636c65732f756e6465727374616e64696e672d7265737466756c2d7374796c652f7a682f7265736f75726365732f32322e706e67)

圖2:REST架構風格

而HTTP/1.1協議作為一種REST架構風格的架構例項,其架構如下圖所示:

[[圖片上傳中…(image-63280a-1547122290038-0)]](https://camo.githubusercontent.com/d6e67bde6d6671e95fc4e57fc14e36b287369eef/687474703a2f2f63646e312e696e666f717374617469632e636f6d2f7265736f757263652f61727469636c65732f756e6465727374616e64696e672d7265737466756c2d7374796c652f7a682f7265736f75726365732f31332e706e67)

圖3:一個基於REST的架構的過程檢視

使用者代理處在三個並行互動(a、b和c)的中間。使用者代理的客戶端聯結器快取無法滿足請求,因此它根據每個資源識別符號的屬性和客戶端聯結器的配置,將每個請求路由到資源的來源。請求(a)被髮送到一個本地代理,代理隨後訪問一個通過DNS查詢發現的快取閘道器,該閘道器將這個請求轉發到一個能夠滿足該請求的來源伺服器,伺服器的內部資源由一個封裝過的物件請求代理(object request broker)架構來定義。請求(b)直接傳送到一個來源伺服器,它能夠通過自己的快取來滿足這個請求。請求(c)被髮送到一個代理,它能夠直接訪問WAIS(一種與Web架構分離的資訊服務),並將WAIS的響應翻譯為一種通用的聯結器介面能夠識別的格式。每一個元件只知道與它們自己的客戶端或伺服器聯結器的互動;整個過程拓撲是我們的檢視的產物。

通過比較圖2和圖3,讀者不難發現這兩張圖中的架構是高度一致的。對於HTTP/1.1協議為何要設計成這個樣子,讀者想必已經有所領悟。

在論文的第六章中,Fielding對於到2000年為止在Web基礎架構協議的設計和開發方面的一些經驗教訓進行了深入的分析。其中,“HTTP不是RPC”、“HTTP不是一種傳輸協議”兩部分值得讀者反覆閱讀。時至13年之後的今日,對於HTTP協議的誤解仍然廣泛存在。

以上簡要介紹了Fielding博士論文中的內容。為了幫助讀者仔細閱讀Fielding的博士論文,筆者整理了一套Fielding博士論文的導讀,將在本專欄後續文章中載出。

REST詳解

REST究竟是什麼?因為REST的內涵非常豐富,所以很難用一兩句話解釋清楚這個問題。

首先,REST是Web自身的架構風格。REST也是Web之所以取得成功的技術架構方面因素的總結。REST是世界上最成功的分散式應用架構風格(成功案例:Web,還不夠嗎?)。它是為 執行在網際網路環境 的 分散式 超媒體系統量身定製的。網際網路環境與企業內網環境有非常大的差別,最主要的差別是兩個方面:

  • 可伸縮性需求無法控制:併發訪問量可能會暴漲,也可能會暴跌。
  • 安全性需求無法控制:無法控制客戶端發來的請求的格式,很可能會是惡意的請求。

而所謂的“超媒體系統”,即,使用了超文字的系統。可以把“超媒體”理解為超文字+媒體內容。

REST是HTTP/1.1協議等Web規範的設計指導原則,HTTP/1.1協議正是為實現REST風格的架構而設計的。新的Web規範,其設計必須符合REST的要求,否則整個Web的體系架構會因為引入嚴重矛盾而崩潰。這句話不是危言聳聽,做個類比,假如蘇州市政府同意在市區著名園林的附近大型土木,建造大量具有後現代風格的摩天大樓,那麼不久之後世界聞名的蘇州園林美景將不復存在。

上述這些關於“REST是什麼”的描述,可以總結為一句話:REST是所有Web應用都應該遵守的架構設計指導原則。當然,REST並不是法律,違反了REST的指導原則,仍然能夠實現應用的功能。但是違反了REST的指導原則,會付出很多代價,特別是對於大流量的網站而言。

要深入理解REST,需要理解REST的五個關鍵詞:

  • 資源(Resource)
  • 資源的表述(Representation)
  • 狀態轉移(State Transfer)
  • 統一介面(Uniform Interface)
  • 超文字驅動(Hypertext Driven)

什麼是資源?

資源是一種看待伺服器的方式,即,將伺服器看作是由很多離散的資源組成。每個資源是伺服器上一個可命名的抽象概念。因為資源是一個抽象的概念,所以它不僅僅能代表伺服器檔案系統中的一個檔案、資料庫中的一張表等等具體的東西,可以將資源設計的要多抽象有多抽象,只要想象力允許而且客戶端應用開發者能夠理解。與物件導向設計類似,資源是以名詞為核心來組織的,首先關注的是名詞。一個資源可以由一個或多個URI來標識。URI既是資源的名稱,也是資源在Web上的地址。對某個資源感興趣的客戶端應用,可以通過資源的URI與其進行互動。

什麼是資源的表述?

資源的表述是一段對於資源在某個特定時刻的狀態的描述。可以在客戶端-伺服器端之間轉移(交換)。資源的表述可以有多種格式,例如HTML/XML/JSON/純文字/圖片/視訊/音訊等等。資源的表述格式可以通過協商機制來確定。請求-響應方向的表述通常使用不同的格式。

什麼是狀態轉移?

狀態轉移(state transfer)與狀態機中的狀態遷移(state transition)的含義是不同的。狀態轉移說的是:在客戶端和伺服器端之間轉移(transfer)代表資源狀態的表述。通過轉移和操作資源的表述,來間接實現操作資源的目的。

什麼是統一介面?

REST要求,必須通過統一的介面來對資源執行各種操作。對於每個資源只能執行一組有限的操作。以HTTP/1.1協議為例,HTTP/1.1協議定義了一個操作資源的統一介面,主要包括以下內容:

  • 7個HTTP方法:GET/POST/PUT/DELETE/PATCH/HEAD/OPTIONS
  • HTTP頭資訊(可自定義)
  • HTTP響應狀態程式碼(可自定義)
  • 一套標準的內容協商機制
  • 一套標準的快取機制
  • 一套標準的客戶端身份認證機制

REST還要求,對於資源執行的操作,其操作語義必須由HTTP訊息體之前的部分完全表達,不能將操作語義封裝在HTTP訊息體內部。這樣做是為了提高互動的可見性,以便於通訊鏈的中間元件實現快取、安全審計等等功能。

什麼是超文字驅動?

“超文字驅動”又名“將超媒體作為應用狀態的引擎”(Hypermedia As The Engine Of Application State,來自Fielding博士論文中的一句話,縮寫為HATEOAS)。將Web應用看作是一個由很多狀態(應用狀態)組成的有限狀態機。資源之間通過超連結相互關聯,超連結既代表資源之間的關係,也代表可執行的狀態遷移。在超媒體之中不僅僅包含資料,還包含了狀態遷移的語義。以超媒體作為引擎,驅動Web應用的狀態遷移。通過超媒體暴露出伺服器所提供的資源,伺服器提供了哪些資源是在執行時通過解析超媒體發現的,而不是事先定義的。從面向服務的角度看,超媒體定義了伺服器所提供服務的協議。客戶端應該依賴的是超媒體的狀態遷移語義,而不應該對於是否存在某個URI或URI的某種特殊構造方式作出假設。一切都有可能變化,只有超媒體的狀態遷移語義能夠長期保持穩定。

一旦讀者理解了上述REST的五個關鍵詞,就很容易理解REST風格的架構所具有的6個的主要特徵:

  • 面向資源(Resource Oriented)
  • 可定址(Addressability)
  • 連通性(Connectedness)
  • 無狀態(Statelessness)
  • 統一介面(Uniform Interface)
  • 超文字驅動(Hypertext Driven)

這6個特徵是REST架構設計優秀程度的判斷標準。其中,面向資源是REST最明顯的特徵,即,REST架構設計是以資源抽象為核心展開的。可定址說的是:每一個資源在Web之上都有自己的地址。連通性說的是:應該儘量避免設計孤立的資源,除了設計資源本身,還需要設計資源之間的關聯關係,並且通過超連結將資源關聯起來。無狀態、統一介面是REST的兩種架構約束,超文字驅動是REST的一個關鍵詞,在前面都已經解釋過,就不再贅述了。

從架構風格的抽象高度來看,常見的分散式應用架構風格有三種:

  • 分散式物件(Distributed Objects,簡稱DO):架構例項有CORBA/RMI/EJB/DCOM/.NET Remoting等等
  • 遠端過程呼叫(Remote Procedure Call,簡稱RPC):架構例項有SOAP/XML-RPC/Hessian/Flash AMF/DWR等等
  • 表述性狀態轉移(Representational State Transfer,簡稱REST):架構例項有HTTP/WebDAV

DO和RPC這兩種架構風格在企業應用中非常普遍,而REST則是Web應用的架構風格,它們之間有非常大的差別。

REST與DO的差別在於:

  • REST支援抽象(即建模)的工具是資源,DO支援抽象的工具是物件。在不同的程式語言中,物件的定義有很大差別,所以DO風格的架構通常都是與某種程式語言繫結的。跨語言互動即使能實現,實現起來也會非常複雜。而REST中的資源,則完全中立於開發平臺和程式語言,可以使用任何程式語言來實現。
  • DO中沒有統一介面的概念。不同的API,介面設計風格可以完全不同。DO也不支援操作語義對於中間元件的可見性。
  • DO中沒有使用超文字,響應的內容中只包含物件本身。REST使用了超文字,可以實現更大粒度的互動,互動的效率比DO更高。
  • REST支援資料流和管道,DO不支援資料流和管道。
  • DO風格通常會帶來客戶端與伺服器端的緊耦合。在三種架構風格之中,DO風格的耦合度是最大的,而REST的風格耦合度是最小的。REST鬆耦合的源泉來自於統一介面+超文字驅動。

REST與RPC的差別在於:

  • REST支援抽象的工具是資源,RPC支援抽象的工具是過程。REST風格的架構建模是以名詞為核心的,RPC風格的架構建模是以動詞為核心的。簡單類比一下,REST是物件導向程式設計,RPC則是程式導向程式設計。
  • RPC中沒有統一介面的概念。不同的API,介面設計風格可以完全不同。RPC也不支援操作語義對於中間元件的可見性。
  • RPC中沒有使用超文字,響應的內容中只包含訊息本身。REST使用了超文字,可以實現更大粒度的互動,互動的效率比RPC更高。
  • REST支援資料流和管道,RPC不支援資料流和管道。
  • 因為使用了平臺中立的訊息,RPC風格的耦合度比DO風格要小一些,但是RPC風格也常常會帶來客戶端與伺服器端的緊耦合。支援統一介面+超文字驅動的REST風格,可以達到最小的耦合度。

比較了三種架構風格之間的差別之後,從面向實用的角度來看,REST架構風格可以為Web開發者帶來三方面的利益:

  • 簡單性

採用REST架構風格,對於開發、測試、運維人員來說,都會更簡單。可以充分利用大量HTTP伺服器端和客戶端開發庫、Web功能測試/效能測試工具、HTTP快取、HTTP代理伺服器、防火牆。這些開發庫和基礎設施早已成為了日常用品,不需要什麼火箭科技(例如神奇昂貴的應用伺服器、中介軟體)就能解決大多數可伸縮性方面的問題。

  • 可伸縮性

充分利用好通訊鏈各個位置的HTTP快取元件,可以帶來更好的可伸縮性。其實很多時候,在Web前端做效能優化,產生的效果不亞於僅僅在伺服器端做效能優化,但是HTTP協議層面的快取常常被一些資深的架構師完全忽略掉。

  • 鬆耦合

統一介面+超文字驅動,帶來了最大限度的鬆耦合。允許伺服器端和客戶端程式在很大範圍內,相對獨立地進化。對於設計面向企業內網的API來說,鬆耦合並不是一個很重要的設計關注點。但是對於設計面向網際網路的API來說,鬆耦合變成了一個必選項,不僅在設計時應該關注,而且應該放在最優先位置。

有的讀者可能會問:“你說了這麼多,REST難道就沒有任何缺點了嗎?”當然不是,正如Fielding在博士論文中闡述的那樣,評價一種軟體架構的優劣,不能脫離開軟體的具體執行環境。永遠不存在適用於任何執行環境的、包治百病的銀彈式架構。筆者在前面強調過REST是一種為執行在網際網路環境中的Web應用量身定製的架構風格。REST在網際網路這個執行環境之中已經佔據了統治地位,然而,在企業內網執行環境之中,REST還會面臨DO、RPC的巨大挑戰。特別是一些對實時性要求很高的應用,REST的表現不如DO和RPC。所以需要針對具體的執行環境來具體問題具體分析。但是,REST可以帶來的上述三方面的利益即使在開發企業應用時,仍然是非常有價值的。所以REST在企業應用開發,特別是在SOA架構的開發中,已經得到了越來越大的重視。本專欄將有一篇文章專門介紹REST在企業級應用中與SOA的結合。

到了這裡,“REST究竟是什麼”這個問題筆者就解答完了。本文開頭那些說法是否正確,筆者還是笑而不語,讀者此時應該已經有了自己的判斷。在接下來的REST系列文章中,我將會為讀者澄清一些關於HTTP協議和REST的常見誤解。


相關文章