C++多程式併發框架FFLIB

發表於2012-08-08

三年來一直從事伺服器程式開發,一直都是忙忙碌碌,不久前結束了職業生涯的第一份工作,有了一個禮拜的休息時間,終於可以寫寫總結了。於是把以前的開原始碼做了整理和優化,這就是FFLIB。雖然這邊總結看起來像日記,有很多廢話,但是此文仍然是有很大針對性的。針對伺服器開發中常見的問題,如多執行緒併發、訊息轉發、非同步、效能優化、單元測試,提出自己的見解。

面對的問題

從事開發工程中,遇到過不少問題,很多時候由於時間緊迫,沒有使用優雅的方案。在跟業內的一些朋友交流過程中,我也意識到有些問題是大家都存在的。簡單列舉如下:

  • 多執行緒與併發
  • 非同步訊息/介面呼叫
  • 訊息的序列化與Reflection
  • 效能優化
  • 單元測試

多執行緒與併發

現在是多核時代,併發才能實現更高的吞吐量、更快的響應,但也是把雙刃劍。總結如下幾個用法:

  • 多執行緒+顯示鎖;介面是被多執行緒呼叫的,當被呼叫時,顯示加鎖,再操作實體資料。悲劇的是,工程師為了優化會設計多個鎖,以減少鎖的粒度,甚至有些地方使用了原子操作。這些都為領域邏輯增加了額外的設計負擔。最壞的情況是會出現死鎖。
  • 多執行緒+任務佇列;介面被多執行緒呼叫,但請求會被暫存到任務佇列,而任務佇列會被單執行緒不斷執行,典型生產者消費者模式。它的併發在於不同的介面可以使用不同的任務佇列。這也是我最常用的併發方式。

這是兩種最常見的多執行緒併發,它們有個天生的缺陷——Scalability。一個機器的效能總是有瓶頸的。兩個場景的邏輯雖然由多個執行緒實現了併發,但是運算量十分有可能是一臺機器無法承載的。如果是多程式併發,那麼可以分散式把其部署到其他機器(也可部署在一臺機器)。所以多程式併發比多執行緒併發更加Scalability。另外採用多程式後,每個程式單執行緒設計,這樣的程式更加Simplicity。多程式的其他優點如解耦、模組化、方便除錯、方便重用等就不贅言了。

非同步訊息/介面呼叫

提到分散式,就要說一下分散式的通訊技術。常用的方式如下:

  • 類RPC;包括WebService、RPC、ICE等,特點是遠端同步呼叫。遠端的介面和本地的介面非常相似。但是遊戲伺服器程式一般非常在意延遲和吞吐量,所以這些阻塞執行緒的同步遠端呼叫方式並不常用。但是我們必須意識到他的優點,就是非常利於呼叫和測試。
  • 全非同步訊息;當呼叫遠端介面的時候,非同步傳送請求訊息,介面響應後返回一個結果訊息,呼叫方的回撥函式處理結果訊息繼續邏輯操作。所以有些邏輯就會被切割成ServiceStart和ServiceCallback兩段。有時非同步會講領域邏輯變得支離破碎。另外訊息處理函式中一般會寫一坨的switch/case 處理不同的訊息。最大的問題在於單元測試,這種情況傳統單元測試根本束手無策。

訊息的序列化與Reflection

實現訊息的序列化和反序列化的方式有很多,常見的有Struct、json、Protobuff等都有很成功的應用。我個人傾向於使用輕量級的二進位制序列化,優點是比較透明和高效,一切在掌握之中。在FFLIB 中實現了bin_encoder_t 和 bin_decoder_t 輕量級的訊息序列化,幾十行程式碼而已。

效能優化

已經寫過關於效能方面的總結,參見:http://www.cnblogs.com/zhiranok/archive/2012/06/06/cpp_perf.html

有的網友提到profiler、cpuprofiler、callgrind等工具。這些工具我都使用過,說實話,對於我來說,我太認同它有很高的價值。第一他們只能用於開發測試階段,可以初步得到一些效能上參考資料。第二它們如何實現跟蹤人們無從得知。執行其會使程式變慢,不能反映真實資料。第三重要的是,開發測試階段效能和上線後的能一樣嗎?Impossible !

關於效能,原則就是資料說話,詳見博文,不在贅述。

單元測試

關於單元測試,前邊已經談論了一些。遊戲伺服器程式一般都比較龐大,但是不可思議的是,鄙人從來沒見有專案(c++ 後臺架構的)有完整單元測試的。由於存在著非同步和多執行緒,傳統的單元測試框架無法勝任,而開發支援非同步的測試框架又是不現實的。我們必須看到的是,傳統的單元測試框架已經取得了非常大的成功。據我瞭解,使用web 架構的遊戲後臺已經對於單元測試的使用已經非常成熟,取得了極其好的效果。所以我的思路是利用現有的單元測試框架,將非同步訊息、多執行緒的架構做出調整。

已經多次談論單元測試了。其實在開發FFLIB的思路很大程度來源於此,否則可能只是一個c++ 網路庫而已。我決定嘗試去解決這個問題的時候,把FFLIB 定位於框架。

先來看一段非常簡單的單元測試的程式碼 :

請允許我對這行程式碼做些解釋,對Add函式輸入引數,驗證返回值是否是預期的結果。這不就是單元測試的本質嗎?在想一下我們非同步傳送訊息的過程,如果每個輸入訊息約定一個結果訊息包,每次傳送請求時都繫結一個回撥函式接收和驗證結果訊息包。這樣的話就恰恰滿足了傳統單元測試的步驟了。最後還需解決一個問題,Assert是不能處理非同步的返回值的。幸運的是,future機制可以化非同步為同步。不瞭解future 模式的可以參考這裡:

http://blog.chinaunix.net/uid-23093301-id-190969.html

http://msdn.microsoft.com/zh-cn/library/dd764564.aspx#Y300

來看一下在FFLIB框架下遠端呼叫echo 服務的示例:

當需要呼叫遠端介面時,async_call(in, &lambda_t::callback); 非同步呼叫必須繫結一個回撥函式,回撥函式接收結果訊息,可以觸發後續操作。這樣的話,如果對echo 的遠端介面做單元測試,可以這樣做:

FFLIB 介紹

FFLIB 結構圖

C++多程式併發框架

如圖所示,Client 不會直接和Service 相連線,而是通過Broker 中間層完成了訊息傳遞。關於Broker 模式可以參見:http://blog.chinaunix.net/uid-23093301-id-90459.html

程式間通訊採用TPC,而不是多執行緒使用的共享記憶體方式。Service 一般是單執行緒架構的,通過啟動多程式實現相對於多執行緒的併發。由於Broker模式天生石分散式的,所以有很好的Scalability。

訊息時序圖

C++多程式併發框架

如何註冊服務和介面

來看一下Echo 服務的實現:

  • create_service_group 建立一個服務group,一個服務組可能有多個並行的例項
  • create_service 以特定的id 建立一個服務例項
  • reg 為該服務註冊介面
  • 介面的定義規範為void echo(echo_t::in_t& in_msg_, rpc_callcack_t<echo_t::out_t>& cb_),第一個引數為輸入的訊息struct,第二個引數為回撥函式的模板特例,模板引數為返回訊息的struct 型別。介面無需知道傳送訊息等細節,只需將結果callback 即可。
  • 註冊到Broker 後,所有Client都可獲取該服務

訊息定義的規範

我們約定每個介面(遠端或本地都應滿足)都包含一個輸入訊息和一個結果訊息。來看一下echo 服務的訊息定義:

  • 每個介面必須包含in_t訊息和out_t訊息,並且他們定義在介面名(如echo _t)的內部
  • 所有訊息都繼承於msg_i, 其封裝了二進位制的序列化、反序列化等。構造時賦予型別名作為訊息的名稱。
  • 每個訊息必須實現encode 和 decode 函式

這裡需要指出的是,FFLIB 中不需要為每個訊息定義對應的CMD。當介面如echo向Broker 註冊時,reg介面通過C++ 模板的型別推斷會自動將該msg name 註冊給Broker, Broker為每個msg name 分配唯一的msg_id。Msg_bus 中自動維護了msg_name 和msg_id 的對映。Msg_i 的定義如下:

關於效能

由於遠端介面的呼叫必須通過Broker, Broker會為每個介面自動生成效能統計資料,並每10分鐘輸出到perf.txt 檔案中。檔案格式為CSV,參見:http://www.cnblogs.com/zhiranok/archive/2012/06/06/cpp_perf.html

總結

FFLIB框架擁有如下的特點:

  • 使用多程式併發。Broker 把Client 和Service 的位置透明化
  • Service 的介面要註冊到Broker, 所有連線Broker的Client 都可以呼叫(publisher/ subscriber)
  • 遠端呼叫必須繫結回撥函式
  • 利用future 模式實現同步,從而支援單元測試
  • 訊息定義規範簡單直接高效
  • 所有service的介面效能監控資料自動生成,免費的午餐
  • Service 單執行緒話,更simplicity

原始碼:

Svn co http://ffown.googlecode.com/svn/trunk/

執行示例:

  • Cd example/broker && make && ./app_broker –l http://127.0.0.1:10241
  • Cd example/echo_server && make && ./app_echo_server
  • Cd example/echo_client && make && ./app_echo_client

相關文章