5 分鐘擼一個前端效能監控工具

發表於2018-07-18

編者按:本文作者是來自360奇舞團的前端開發工程師劉宇晨,同時也是W3C 效能工作組成員。跟著他一起學習一下前端效能監控吧~

用(上)戶(帝)說,這個頁面怎麼這麼慢,還有沒有人管了?!

為什麼監控

簡單而言,有三點原因:

  • 關注效能是工程師的本性 + 本分;
  • 頁面效能對使用者體驗而言十分關鍵。每次重構對頁面效能的提升,僅靠工程師開發裝置的測試資料是沒有說服力的,需要有大量的真實資料用於驗證;
  • 資源掛了、載入出現異常,不能總靠使用者投訴才後知後覺,需要主動報警。

一次效能重構,在千兆網速和萬元裝置的條件下,頁面載入時間的提升可能只有 0.1%,但是這樣的數(土)據(豪)不具備代表性。網路環境、硬體裝置千差萬別,對於中低端裝置而言,效能提升的主觀體驗更為明顯,對應的資料變化更具備代表性。

不少專案都會把資源上傳到 CDN。而 CDN 部分節點出現問題的時候,一般不能精準的告知“某某,你的 xx 資源掛了”,因此需要我們主動監控。

根據谷歌資料顯示,當頁面載入超過 10s 時,使用者會感到絕望,通常會離開當前頁面,並且很可能不再回來。

用什麼監控

關於前端效能指標,W3C 定義了強大的 Performance API,其中又包括了 High Resolution Time 、 Frame Timing 、 Navigation Timing 、 Performance Timeline 、Resource Timing 、 User Timing 等諸多具體標準。

本文主要涉及 Navigation Timing 以及 Resource Timing。截至到 2018 年中旬,各大主流瀏覽器均已完成了基礎實現。

5 分鐘擼一個前端效能監控工具

5 分鐘擼一個前端效能監控工具

Performance API 功能眾多,其中一項,就是將頁面自身以及頁面中各個資源的效能表現(時間細節)記錄了下來。而我們要做的就是查詢和使用。

讀者可以直接在瀏覽器控制檯中輸入 performance ,檢視相關 API。

接下來,我們將使用瀏覽器提供的 window.performance 物件(Performance API 的具體實現),來實現一個簡易的前端效能監控工具。

5 分鐘擼一個前端效能監控工具

第一行程式碼

將工具命名為 pMonitor,含義是 performance monitor。

監控哪些指標

既然是“5 分鐘實現一個 xxx”系列,那麼就要有取捨。因此,本文只挑選了最為重要的兩個指標進行監控:

  • 頁面載入時間
  • 資源請求時間

看了看時間,已經過去了 4 分鐘,小編表示情緒穩定,沒有一絲波動。5 分鐘擼一個前端效能監控工具

頁面載入

有關頁面載入的效能指標,可以在 Navigation Timing 中找到。Navigation Timing 包括了從請求頁面起,到頁面完成載入為止,各個環節的時間明細。

可以通過以下方式獲取 Navigation Timing 的具體內容:

getEntriesByType 是我們獲取效能資料的一種方式。performance 還提供了 getEntries 以及 getEntriesByName 等其他方式,由於“時間限制”,具體區別不在此贅述,各位看官可以移步到此:https://www.w3.org/TR/performance-timeline-2/#dom-performance。

返回結果是一個陣列,其中的元素結構如下所示:

關於各個欄位的時間含義,Navigation Timing Level 2 給出了詳細說明:

5 分鐘擼一個前端效能監控工具

不難看出,細節滿滿。因此,能夠計算的內容十分豐富,例如 DNS 查詢時間,TLS 握手時間等等。可以說,只有想不到,沒有做不到~

既然我們關注的是頁面載入,那自然要讀取 domComplete:

定義個方法,獲取 domComplete:

到此,我們獲得了準確的頁面載入時間。

資源載入

既然頁面有對應的 Navigation Timing,那靜態資源是不是也有對應的 Timing 呢?

答案是肯定的,其名為 Resource Timing。它包含了頁面中各個資源從傳送請求起,到完成載入為止,各個環節的時間細節,和 Navigation Timing 十分類似。

獲取資源載入時間的關鍵字為 ‘resource’, 具體方式如下:

不難聯想,返回結果通常是一個很長的陣列,因為包含了頁面上所有資源的載入資訊。

每條資訊的具體結構為:

以上為 2018 年 7 月 7 日,在 https://cn.bing.com 下搜尋 test 時,performance.getEntriesByType(“resource”) 返回的第二條結果。

我們關注的是資源載入的耗時情況,可以通過如下形式獲得:

同 Navigation Timing 相似,關於 startTime 、 fetchStart、connectStart 和 requestStart 的區別, Resource Timing Level 2 給出了詳細說明:

5 分鐘擼一個前端效能監控工具

並非所有的資源載入時間都需要關注,重點還是載入過慢的部分。

出於簡化考慮,定義 10s 為超時界限,那麼獲取超時資源的方法如下:

這樣一來,我們獲取了所有超時的資源列表。

簡單封裝一下:

上報資料

獲取資料之後,需要向服務端上報:

回過頭來初始化

資料上傳的 url、超時時間等細節,因專案而異,所以需要提供一個初始化的方法:

何時觸發

效能監控只是輔助功能,不應阻塞頁面載入,因此只有當頁面完成載入後,我們才進行資料獲取和上報(實際上,頁面載入完成前也獲取不到必要資訊):

彙總

到此為止,一個完整的前端效能監控工具就完成了~全部程式碼如下:

如何?是不是不復雜?甚至有點簡單~

呼叫

如果想追(吹)求(毛)極(求)致(疵)的話,在頁面載入時,監測工具不應該佔用主執行緒的 JavaScript 解析時間。因此,最好在頁面觸發 onload 事件後,採用非同步載入的方式:

跨域等請求問題

工具在資料上報時,沒有考慮跨域問題,也沒有處理 GET 和 POST 同時存在的情況。

5 分鐘還要什麼自行車!

如有需求,可以自行覆蓋 pMonitor.logPackage 方法,改為動態建立 <form/><iframe/> ,或者使用更為常見的圖片打點方式~

說好的報警呢?光有報沒有警?!

這個還是需要服務端配合的嘛[認真臉.jpg]。

既可以是每個專案對應不同的上報 url,也可以是統一的一套 url,專案分配唯一 id 作為區分。

當超時次數在規定時間內超過約定的閾值時,郵件/簡訊通知開發人員。

細粒度

現在僅僅針對超時資源進行了簡單統計,但是沒有上報具體的超時原因(DNS?TCP?request? response?),這就留給讀者去優化了,動手試試吧~

下一步

本文介紹了關於頁面載入方面的效能監控, 此外,JavaScript 程式碼的解析 + 執行,也是制約頁面首屏渲染快慢的重要因素(特別是單頁面應用)。下一話,小編將帶領大家  進一步探索 Performance Timeline Level 2, 實現更多對於 JavaScript 執行時的效能監控,敬請期待~

參考資料

  • https://w3c.github.io/navigation-timing
  • https://www.w3.org/TR/resource-timing-2
  • https://www.w3.org/TR/performance-timeline-2
  • https://developers.google.com/web/fundamentals/performance/rail

相關文章