Mudo C++網路庫第五章學習筆記

self發表於2018-10-14

C++筆記

高效的多執行緒日誌

日誌(logging)有兩個意思:
- 診斷日誌(diagnostic log), 常用日誌庫提供日誌功能;
- 交易日誌(transaction log), 用於記錄狀態變更, 通過回放日誌可以逐步恢復每一次修改後的狀態;
日誌通常用於故障診斷和追蹤(trace), 也可用於效能分析;
日誌通常是分散式系統中事故調查時的唯一線索, 用來追尋蛛絲馬跡, 查出原凶;
- Log Everything All The Time;
關於程式, 日誌通常要記錄:
- 收到每條內部訊息的ID(還可以包括關鍵欄位、長度、hash等);
- 收到的每條外部訊息的全文;
- 發出每條訊息的全文, 每條訊息都有全域性唯一的id；
- 關鍵內部狀態的變更, 等等;
每條日誌都有時間戳, 這樣就能完整追蹤分散式系統中一個事件的來龍去脈;
一個日誌檔案可分為前端(frontend)和後端(backend)兩部分;
- 前端提供應用程式使用的介面(API), 並生成日誌訊息(log message);
- 後端則負責把日誌訊息寫到目的地(destination);
- 典型的多生產者-單消費者問題, 對生產者(前端)而言, 要儘量做到低延遲、低CPU開銷、無阻塞;
- 對消費者(後端)而言, 要做到足夠大的吞吐量, 並佔用較少資源;
對C++程式而言, 最好整個程式(包括主程式和程式庫)都使用相同的日誌庫, 日誌有一個整體的日誌輸出, 而且不要各個元件有各自的日誌輸出;
- 從這個意義上講, 日誌庫是個singleton模式(單例模式);
muduo沒有用標準庫中的iostream, 而是自己寫的LogStream class, 主要是出於效能原因;

功能需求

日誌訊息有多種級別(level): TRACE、DEBUG、INFO、ERROR、FATAL等;
日誌訊息可能有多個目的地(appender), 如檔案、socket、SMTP等;
日誌訊息的格式可配置(layout), 例如org.apache.log4j.PatternLayout;
可以設定執行時過濾器(filter), 控制不同元件的日誌訊息的級別和目的地;
質量保證(QA)測試環境的時候輸出DEBUG級別的日誌, 在生產環境輸出INFO級別的日誌;
只要呼叫muduo::Logger::setLogLevel()就能立即生效;
對於分散式系統中的服務程式而言, 日誌的目的第(destination)只有一個:本地檔案;
- 日誌檔案的滾動(rolling)是必需的, 這樣可以簡化日誌歸檔(archive)的實現;
rolling的條件通常有兩個: 檔案大小(例如每寫滿1GB就換下一個檔案)和時間(例如每天零點新建一個日誌檔案, 不論前一個檔案有沒有寫滿);
- 一般的日誌庫都會自動根據檔案大小和時間來主動滾動日誌檔案;
- 能主動rolling, 自然也就不必支援SIGUSR1了, 畢竟多執行緒程式處理signal很麻煩;
日誌庫的壓縮與歸檔(archive)不是日誌庫應該有的功能, 而應該交給專門的指令碼去做;
磁碟空間監控也不是日誌庫的必備功能;
muduo日誌庫: 其一是定期(預設3秒), 將緩衝區內的日誌訊息flush到磁碟;
- 其二是每條記憶體中的日誌訊息都帶有cookie(或者叫哨兵值/sentry), 其值為某個函式的地址, 這樣通過core dump檔案中查詢cookie就能找到尚未來得及寫入磁碟的訊息;
日誌訊息格式有幾個要點:
- 儘量每條日誌佔一行;
- 時間戳精確到微妙;
- 始終使用GMT時區(Z);
- 答應執行緒id;
- 列印日誌級別;
- 列印原始檔名和行號;

效能需求

日誌庫的高效性體現在幾個方面:
- 每秒寫上千萬條日誌的時候沒有明顯的效能損失;
- 能應對一個程式生產大量日誌資料的場景, 例如1GB/min;
- 不阻塞正常的執行流程;
- 在多程式程式中, 不造成爭用(contention);
- 磁碟頻寬約是110MB/S, 日誌庫應該能瞬時寫滿這個頻寬(不必持續太久);
- 假如每條日誌訊息的平均長度是110位元組, 這就意味著1秒要寫100萬條日誌;
muduo日誌庫實現了幾點優化措施:
- 時間戳字串中的日期和時間部分是快取的, 一秒內的多條日誌只需要重新格式化微妙部分;
- 日誌訊息的前4個欄位是定長的, 因此可以避免在執行期求字串長度(不會反覆呼叫strlen);
  - 因為編譯器認識memcpy()函式, 對於定長的記憶體複製, 會在編譯期把它的inline展開為高效的目的碼;
- 執行緒id是預先格式化為字串, 在輸出日誌訊息時只需要簡單拷貝幾個位元組;
- 每行日誌訊息的原始檔名部分採用了編譯期計算來獲得basename, 避免執行期strrchr()開銷;

多執行緒非同步日誌

多執行緒程式對日誌庫提出了新的需求:執行緒安全, 即多個程式可以併發寫日誌, 兩個執行緒的日誌訊息不會出現交織;
多執行緒的每個程式最好只寫一個日誌檔案;
- 用一個背景執行緒收集日誌訊息, 並寫入日誌檔案, 其他業務執行緒只管往這個日誌執行緒傳送日誌訊息, 這稱為非同步日誌;
- 非阻塞日誌;
我們需要一個佇列將日誌前端的資料傳送到後端(日誌執行緒)；
- muduo日誌庫採用的是雙緩衝(double buffering)技術;
- 基本思路是準備兩塊buffer：A和B, 前端負責往buffer A填資料(日誌訊息), 後端負責將buffer B的資料寫入檔案;
- 當buffer A寫滿之後, 交換A和B, 讓後端將buffer A的資料寫入檔案, 而前端則往buffer B填入新的日誌訊息, 如此往復;
- 為了及時將日誌訊息寫入檔案, 即便buffer A未滿, 日誌庫也會每3秒執行一次上述交換寫入操作;
對於非同步日誌來說, 這是典型的生產速度高於消費速度問題, 會造成資料在記憶體中的堆積, 嚴重時引發效能問題(可用記憶體不足)或程式崩潰(分配記憶體失敗);
- 直接丟棄掉多餘的日誌buffer, 以騰出記憶體, 這樣可以防止程式庫本身引起程式故障, 是一種自我保護措施;
- 也可以加入網路報警功能, 通知人工介入, 以儘快修復故障;
效能不能憑感覺說了算, 一定要有典型場景的測試資料做為支撐;
muduo庫的非同步日誌實現用了一個全域性鎖;
- java的ConcurrentHashMap那樣用多個桶子(bucket), 前端寫日誌的時候再按執行緒id雜湊到不同的bucket中, 以減少contention(後端實現比較複雜);
- Linux預設會把core dump寫到當前目錄, 而且檔名是固定的core;

Mudo C++網路庫第七章學習筆記
2018-10-24
C++筆記
Mudo C++網路庫第十一章學習筆記
2018-10-25
C++筆記
Mudo C++網路庫第六章學習筆記
2018-10-23
C++筆記
Mudo C++網路庫第八章學習筆記
2018-10-24
C++筆記
Mudo C++網路庫第十章學習筆記
2018-10-24
C++筆記
C/C++學習路線———學習筆記
2020-12-17
C++筆記
C++ 學習筆記之——STL 庫 queue
2018-12-15
C++筆記
網路流學習筆記
2024-08-13
筆記
【學習筆記】網路流
2022-07-11
筆記
C++學習筆記 — STL標準模板庫
2018-10-03
C++筆記
《C++ Primer》學習筆記（八）：標準 IO 庫
2020-02-05
C++筆記
學習筆記16：殘差網路
2024-06-04
筆記
C++學習筆記——003
2024-03-18
C++筆記
C++學習筆記——001
2024-03-16
C++筆記
OI學習筆記（C++）
2024-08-09
筆記C++
c++學習筆記（三）
2024-06-24
C++筆記
c++學習筆記（五）
2024-07-25
C++筆記
c++學習筆記（四）
2024-07-25
C++筆記
C++學習筆記——C++ 繼承
2020-11-19
C++筆記繼承
C++學習筆記-Cherno C++系列
2024-11-23
C++筆記
iOS學習筆記14 網路(三)WebView
2018-06-02
iOS筆記WebView
C/C++學習筆記：字串
2020-12-16
C++筆記字串
Mpmath庫-學習筆記
2024-07-02
筆記
【機器學習】搭建神經網路筆記
2018-12-25
機器學習神經網路筆記
比特幣學習筆記——————6、比特幣網路
2018-06-12
比特幣筆記
深度學習筆記------卷積神經網路
2020-02-09
深度學習筆記卷積神經網路
全連線神經網路學習筆記
2021-11-28
神經網路筆記
網路流最大流、最小割學習筆記
2021-01-21
筆記
卷積神經網路學習筆記——SENet
2021-01-23
卷積神經網路筆記SENet
深度學習卷積神經網路筆記
2020-12-19
深度學習卷積神經網路筆記
C++學習筆記（二）——函式
2020-10-17
C++筆記函式
c++學習筆記 — inline這玩意
2019-05-12
C++筆記inline
《Java核心技術》第五章繼承學習筆記
2021-01-05
Java繼承筆記
【機器學習】之第五章——神經網路
2022-11-27
機器學習神經網路
網路流練習筆記
2021-03-05
筆記
資料庫學習筆記
2018-10-18
資料庫筆記
Python學習筆記——turtle庫
2020-10-18
Python筆記
網路學習筆記（二）：TCP可靠傳輸原理
2019-03-18
筆記TCP

Mudo C++網路庫第五章學習筆記

高效的多執行緒日誌

功能需求

效能需求

多執行緒非同步日誌

相關文章