RxJS 入門指引和初步應用

發表於2017-02-26

RxJS是一個強大的Reactive程式設計庫,提供了強大的資料流組合與控制能力,但是其學習門檻一直很高,本次分享期望從一些特別的角度解讀它在業務中的使用,而不是從API角度去講解。

RxJS簡介

通常,對RxJS的解釋會是這麼一些東西,我們來分別看看它們的含義是什麼。

  • Reactive
  • Lodash for events
  • Observable
  • Stream-based

什麼是Reactive呢,一個比較直觀的對比是這樣的:

比如說,abc三個變數之間存在加法關係:

在傳統方式下,這是一種一次性的賦值過程,呼叫一次就結束了,後面b和c再改變,a也不會變了。

而在Reactive的理念中,我們定義的不是一次性賦值過程,而是可重複的賦值過程,或者說是變數之間的關係:

定義出這種關係之後,每次b或者c產生改變,這個表示式都會被重新計算。不同的庫或者語言的實現機制可能不同,寫法也不完全一樣,但理念是相通的,都是描述出資料之間的聯動關係。

在前端,我們通常有這麼一些方式來處理非同步的東西:

  • 回撥
  • 事件
  • Promise
  • Generator

其中,存在兩種處理問題的方式,因為需求也是兩種:

  • 分發
  • 流程

在處理分發的需求的時候,回撥、事件或者類似訂閱釋出這種模式是比較合適的;而在處理流程性質的需求時,Promise和Generator比較合適。

在前端,尤其互動很複雜的系統中,RxJS其實是要比Generator有優勢的,因為常見的每種客戶端開發都是基於事件程式設計的,對於事件的處理會非常多,而一旦系統中大量出現一個事件要修改檢視的多個部分(狀態樹的多個位置),分發關係就更多了。

RxJS的優勢在於結合了兩種模式,它的每個Observable上都能夠訂閱,而Observable之間的關係,則能夠體現流程(注意,RxJS裡面的流程的控制和處理,其直觀性略強於Promise,但弱於Generator)。

我們可以把一切輸入都當做資料流來處理,比如說:

  • 使用者操作
  • 網路響應
  • 定時器
  • Worker

RxJS提供了各種API來建立資料流:

  • 單值:of, empty, never
  • 多值:from
  • 定時:interval, timer
  • 從事件建立:fromEvent
  • 從Promise建立:fromPromise
  • 自定義建立:create

建立出來的資料流是一種可觀察的序列,可以被訂閱,也可以被用來做一些轉換操作,比如:

  • 改變資料形態:map, mapTo, pluck
  • 過濾一些值:filter, skip, first, last, take
  • 時間軸上的操作:delay, timeout, throttle, debounce, audit, bufferTime
  • 累加:reduce, scan
  • 異常處理:throw, catch, retry, finally
  • 條件執行:takeUntil, delayWhen, retryWhen, subscribeOn, ObserveOn
  • 轉接:switch

也可以對若干個資料流進行組合:

  • concat,保持原來的序列順序連線兩個資料流
  • merge,合併序列
  • race,預設條件為其中一個資料流完成
  • forkJoin,預設條件為所有資料流都完成
  • zip,取各來源資料流最後一個值合併為物件
  • combineLatest,取各來源資料流最後一個值合併為陣列

這時候回頭看,其實RxJS在事件處理的路上已經走得太遠了,從事件到流,它被稱為lodash for events,倒不如說是lodash for stream更貼切,它提供的這些操作符也確實可以跟lodash媲美。

資料流這個詞,很多時候,是從data-flow翻譯過來的,但flow跟stream是不一樣的,我的理解是:flow只關注一個大致方向,而stream是受到更嚴格約束的,它更像是在無形的管道里面流動。

那麼,資料的管道是什麼形狀的?

在RxJS中,存在這麼幾種東西:

  • Observable 可觀察序列,只出不進
  • Observer 觀察者,只進不出
  • Subject 可出可進的可觀察序列,可作為觀察者
    • ReplaySubject 帶回放
  • Subscription 訂閱關係

前三種東西,根據它們資料進出的可能性,可以通俗地理解他們的連線方式,這也就是所謂管道的“形狀”,一端密閉一端開頭,還是兩端開口,都可以用來輔助記憶。

上面提到的Subscription,則是訂閱之後形成的一個訂閱關係,可以用於取消訂閱。

下面,我們通過一些示例來大致瞭解一下RxJS所提供的能力,以及用它進行開發所需要的思路轉換。

示例一:簡單的訂閱

很多時候,我們會有一些顯示時間的場景,比如在頁面下新增評論,評論列表中顯示了它們分別是什麼時間建立的,為了含義更清晰,可能我們會引入moment這樣的庫,把這個時間轉換為與當前時間的距離:

這樣,顯示的時間就是:一分鐘內,昨天,上個月這樣的字樣。

但我們注意到,引入這個轉換是為了增強體驗,而如果某個使用者停留在當前檢視時間太長,它的這些資訊會變得不準確,比如說,使用者停留了一個小時,而它看到的資訊還顯示:5分鐘之前發表了評論,實際時間是一個小時零5分鐘以前的事了。

從這個角度看,我們做這個體驗增強的事情只做了一半,不準確的資訊是不能算作增強體驗的。

在沒有RxJS的情況下,我們可能會通過一個定時器來做這件事,比如在元件內部:

但元件並不一定只有一份例項,這樣,整個介面上可能就有很多定時器在同時跑,這是一種浪費。如果要做優化,可以把定時器做成一種服務,把業務上需要週期執行的東西放進去,當作定時任務來跑。

如果使用RxJS,可以很容易做到這件事:

示例二:對時間軸的操縱

RxJS一個很強大的特點是,它以流的方式來對待資料,因此,可以用一些操作符對整個流上所有的資料進行延時、取樣、調整密集度等等。

示例程式碼中,我們建立了四個流:

  • A是由定時器產生的,每秒一個值
  • B從A裡面過濾掉了一些
  • C在B的基礎上,對每兩個間距在3秒之內的值進行了處理,只留下後一個值
  • D把C的結果整體向後平移了2秒

所以結果大致如下:

示例三:我們來晚了

RxJS還提供了BehaviourSubject和ReplaySubject這樣的東西,用於記錄資料流上一些比較重要的資訊,讓那些“我們來晚了”的訂閱者們回放之前錯過的一切。

ReplaySubject可以指定保留的值的個數,超過的部分會被丟棄。

最近新版《射鵰英雄傳》比較火,我們來用程式碼描述其中一個場景。

郭靖和黃蓉一起背書,黃蓉記憶力很好,看了什麼,就全部記得;而郭靖屬魚的,記憶只有七秒,始終只記得背誦的最後三個字,兩人一起背誦《九陰真經》。

程式碼實現如下:

執行之後,我們就可以看到,黃蓉背出了所有字,郭靖只記得“補不足”三個字。

示例四:自動更新的狀態樹

熟悉Redux的人應該會對這樣一套理念不陌生:

從一個應用啟動之後,整個全域性狀態的變化,就等於初始的狀態疊加了之後所有action導致的狀態修改結果。

所以這就是一個典型的reduce操作。在RxJS裡面,有一個scan操作符可以用來表達這個含義,比如說,我們可以表達這樣一個東西:

只需往這個action$裡面推action,就能夠在state$上獲取出當前狀態。

在Redux裡面,會有一個東西叫combineReducer,在state比較大的時候,用不同的reducer修改state的不同的分支,然後合併。如果使用RxJS,也可以很容易表達出來:

藉助這樣的機制,我們實現了Redux類似的功能,社群裡面也有基於RxJS實現的Redux-Observable這樣的Redux中介軟體。

注意,我們這裡的程式碼中,並未使用dispatch action這樣的方式去嚴格模擬Redux。

再深入考慮,在比較複雜的場景下,reducer其實很複雜。比如說,檢視上發起一個操作,會需要修改檢視的好多地方,因此也就是要修改全域性狀態樹的不同位置。

在這樣的場景中,從檢視發起的某個action,要麼呼叫一個很複雜的reducer去到處改資料,要麼再次發起多個action,讓很多個reducer各自改自己的資料。

前者的問題是,程式碼耦合太嚴重;後者的問題是,整個流程太難追蹤,比如說,某一塊狀態,想要追蹤到自己是被從哪裡發起的修改所改變的,是非常困難的事情。

如果我們能夠把Observable上面的同步修改過程視為reducer,就可以從另外一些角度大幅簡化程式碼,並且讓聯動邏輯清晰化。例如,如果我們想描述一篇文章的編輯許可權:

這段程式碼的實質是什麼?其實本質上還是reducer,表達的是資料的合併與轉換過程,而且是同步的。我們可以把article和me的變更reduce到article$和me$裡,由它們派發隱式的action去推動editable計算新值。

更詳細探索的可以參見之前的這篇文章:複雜單頁應用的資料層設計

示例五:幸福人生

人生是什麼樣子的呢?

著名央視主持人白巖鬆曾經說過:

賺錢是為了買房,買房是為了賺錢。

這兩句話聽上去很悲哀,卻很符合社會現實。(不要在意是不是白巖鬆說的啦,不是他就是魯迅,要麼就是莎士比亞)

作為程式設計師,我們可以嘗試想想如何用程式碼把它表達出來。

如果用指令式程式設計的理念來描述這段邏輯,是不太好下手的,因為它看起來像個死迴圈,可是人生不就是一天一天的死迴圈嗎,這個複雜的世界,誰是自變數,誰是因變數?

死迴圈之所以很難用程式碼表達,是因為你不知道先定義哪個變數,如果變數的依賴關係形成了閉環,就總有一段定義不起來。

但是,在RxJS這麼一套東西中,我們可以很容易把這套關係描述出來。前面說過,基於RxJS程式設計,就好像是在組裝管道,依賴關係其實是定義在管道上,而不是在資料上。所以,不存在命令式的那些問題,只要管道能夠接起來,再放進去資料就可以了。所以,我們可以先定義管道之間的依賴關係,

首先,從這段話中尋找一些變數,得到如下結果:

然後,我們來探索它們各自的來源。

錢從哪裡來?
出租房子。
房子從哪裡來?
錢掙夠了就買。

聽上去還是死迴圈啊?

我們接著分析:

錢是隻有一個來源嗎?
不是,原始積累肯定不是房租,我們假定那是工資。所以,收入是有工資和房租兩個部分組成。
房子是隻有一個來源嗎?
對,我們不是貪官,房子都是用錢買的。

好,現在我們有四個變數了:

  • 工資
  • 房租

我們嘗試定義這些變數之間的關係:

  • 工資 := 定時取值的常量
  • 房租 := 定時取值的變數,與房子數量成正比
  • 錢 := 工資 + 房租
  • 房 := 錢.map(夠了就買)

調整這些變數的定義順序,凡是不依賴別人的,一律提到最前面實現。尷尬地發現,這四個變數裡,只有工資是一直不變的,先提前。

剩下的,都是依賴別人的,而且,沒有哪個東西是隻依賴已定義的變數,在存在業務上的迴圈依賴的時候,就會發生這樣的情況。在這種情況下,我們可以從中找出被依賴最少的變數,宣告一個Subject用於佔位,比如這裡的房子。

接下來再看,以上幾個變數中,有哪個可以跟著確定?是房租,所以,我們可以得到房租與房子數量的關係表示式,注意,以上的salary$、house$,表達的都是單次增加的值,不代表總的值,但是,算房租是要用總的房子數量來算的,所以,我們還需要先表達出總的房子數量:

然後,可以得到房租的表示式:

解釋一下上面這段程式碼:

  • 房租由房租週期的定時器觸發
  • 然後到房子數量中取最後一個值,也就是當前有多少套房
  • 然後,用房子數量乘以單套房的月租,假設是5

房租定義出來了之後,錢就可以被定義了:

注意,income$所代表的含義是,所有的單次收入,包含工資和房租。

到目前為止,我們還有一個東西沒有被定義,那就是房子。如何從收入轉化為房子呢?為了示例簡單,我們把它們的關係定義為:

一旦現金流夠買房,就去買。

所以,我們需要定義現金流與房子數量的關係:

這段邏輯的含義是:

  • 累積之前的現金流與本次收入
  • 假定房價100,先看看現金夠買幾套房,能買幾套買幾套
  • 重新計算買完之後的現金

總結一下,這麼一段程式碼,就表達清楚了我們所有的業務需求:

這段程式碼所表達出來的業務關係如圖:

注意:在這個例子中,house$的處理方式與眾不同,因為我們的業務邏輯是環形依賴,至少要有一個東西先從裡面拿出來佔位,後續再處理,否則沒有辦法定義整條鏈路。

小結

本篇通過一些簡單例子介紹了RxJS的使用場景,可以用這麼一句話來描述它:

其文簡,其意博,其理奧,其趣深

RxJS提供大量的操作符,用於處理不同的業務需求。對於同一個場景來說,可能實現方式會有很多種,需要在寫程式碼之前仔細斟酌。由於RxJS的抽象程度很高,所以,可以用很簡短程式碼表達很複雜的含義,這對開發人員的要求也會比較高,需要有比較強的歸納能力。

本文是入職螞蟻金服之後,第一次內部分享,科普為主,後面可能會逐步作一些深入的探討。

螞蟻的大部分業務系統前端不太適合用RxJS,大部分是中後臺CRUD系統,因為兩個原因:整體性、實時性的要求不高。

什麼是整體性?這是一種系統設計的理念,系統中的很多業務模組不是孤立的,比如說,從展示上,GUI與命令列的差異在於什麼?在於資料的冗餘展示。我們可以把同一份業務資料以不同形態展示在不同檢視上,甚至在PC端,由於螢幕大,可以允許同一份資料以不同形態同時展現,這時候,為了整體協調,對此資料的更新就會要產生很多分發和聯動關係。

什麼是實時性?這個其實有多個含義,一個比較重要的因素是服務端是否會主動向推送一些業務更新資訊,如果用得比較多,也會產生不少的分發關係。

在分發和聯動關係多的時候,RxJS才能更加體現出它比Generator、Promise的優勢。

相關文章