5分鐘打造一個前端效能監控工具

Selfocus發表於2018-08-24

原文網址 : https://flycode.co/archives/241218

為什麼監控

用（上）戶（帝）說，這個頁面怎麼這麼慢，還有沒有人管了？！

簡單而言，有三點原因：

關注效能是工程師的本性 + 本分；
頁面效能對使用者體驗而言十分關鍵。每次重構對頁面效能的提升，僅靠工程師開發裝置的測試資料是沒有說服力的，需要有大量的真實資料用於驗證；
資源掛了、載入出現異常，不能總靠使用者投訴才後知後覺，需要主動報警。

一次效能重構，在千兆網速和萬元裝置的條件下，頁面載入時間的提升可能只有0.1%，但是這樣的數（土）據（豪）不具備代表性。網路環境、硬體裝置千差萬別，對於中低端裝置而言，效能提升的主觀體驗更為明顯，對應的資料變化更具備代表性。

不少專案都會把資源上傳到 CDN。而 CDN 部分節點出現問題的時候，一般不能精準的告知“某某，你的 xx 資源掛了”，因此需要我們主動監控。

根據谷歌資料顯示，當頁面載入超過 10s 時，使用者會感到絕望，通常會離開當前頁面，並且很可能不再回來。

用什麼監控

關於前端效能指標，W3C 定義了強大的 Performance API，其中又包括了 High Resolution Time 、 Frame Timing 、 Navigation Timing 、 Performance Timeline 、Resource Timing 、 User Timing 等諸多具體標準。

本文主要涉及 Navigation Timing 以及 Resource Timing。截至到 2018 年中旬，各大主流瀏覽器均已完成了基礎實現。

Performance API 功能眾多，其中一項，就是將頁面自身以及頁面中各個資源的效能表現（時間細節）記錄了下來。而我們要做的就是查詢和使用。

讀者可以直接在瀏覽器控制檯中輸入 performance ，檢視相關 API。

接下來，我們將使用瀏覽器提供的 window.performance 物件（Performance API 的具體實現），來實現一個簡易的前端效能監控工具。

5 分鐘擼一個前端效能監控工具

第一行程式碼

將工具命名為 pMonitor，含義是 performance monitor。

const pMonitor = {}

監控哪些指標

既然是“5 分鐘實現一個 xxx”系列，那麼就要有取捨。因此，本文只挑選了最為重要的兩個指標進行監控：

頁面載入時間
資源請求時間

頁面載入

有關頁面載入的效能指標，可以在 Navigation Timing 中找到。Navigation Timing 包括了從請求頁面起，到頁面完成載入為止，各個環節的時間明細。
可以通過以下方式獲取 Navigation Timing 的具體內容：
const navTimes = performance.getEntriesByType(`navigation`)

getEntriesByType 是我們獲取效能資料的一種方式。performance 還提供了 getEntries 以及 getEntriesByName 等其他方式，由於“時間限制”，具體區別不在此贅述，各位看官可以移步到此：www.w3.org/TR/performa…。

返回結果是一個陣列，其中的元素結構如下所示：
{
“connectEnd”: 64.15495765894057,
“connectStart”: 64.15495765894057,
“domainLookupEnd”: 64.15495765894057,
“domainLookupStart”: 64.15495765894057,
“domComplete”: 2002.5385066728431,
“domContentLoadedEventEnd”: 2001.7384263440083,
“domContentLoadedEventStart”: 2001.2386167400286,
“domInteractive”: 1988.638474368076,
“domLoading”: 271.75174283737226,
“duration”: 2002.9385468372606,
“entryType”: “navigation”,
“fetchStart”: 64.15495765894057,
“loadEventEnd”: 2002.9385468372606,
“loadEventStart”: 2002.7383663540235,
“name”: “document”,
“navigationStart”: 0,
“redirectCount”: 0,
“redirectEnd”: 0,
“redirectStart”: 0,
“requestStart”: 65.28225608537441,
“responseEnd”: 1988.283025689508,
“responseStart”: 271.75174283737226,
“startTime”: 0,
“type”: “navigate”,
“unloadEventEnd”: 0,
“unloadEventStart”: 0,
“workerStart”: 0.9636893776343863
}
關於各個欄位的時間含義，Navigation Timing Level 2 給出了詳細說明：

不難看出，細節滿滿。因此，能夠計算的內容十分豐富，例如 DNS 查詢時間，TLS 握手時間等等。可以說，只有想不到，沒有做不到～
既然我們關注的是頁面載入，那自然要讀取 domComplete:
const [{ domComplete }] = performance.getEntriesByType(`navigation`)
定義個方法，獲取 domComplete：
pMonitor.getLoadTime = () => {
const [{ domComplete }] = performance.getEntriesByType(`navigation`)
return domComplete
}
到此，我們獲得了準確的頁面載入時間。

資源載入

既然頁面有對應的 Navigation Timing，那靜態資源是不是也有對應的 Timing 呢？
答案是肯定的，其名為 Resource Timing。它包含了頁面中各個資源從傳送請求起，到完成載入為止，各個環節的時間細節，和 Navigation Timing 十分類似。
獲取資源載入時間的關鍵字為 `resource`, 具體方式如下：
performance.getEntriesByType(`resource`)

不難聯想，返回結果通常是一個很長的陣列，因為包含了頁面上所有資源的載入資訊。

每條資訊的具體結構為：
{
“connectEnd”: 462.95008929525244,
“connectStart”: 462.95008929525244,
“domainLookupEnd”: 462.95008929525244,
“domainLookupStart”: 462.95008929525244,
“duration”: 0.9620853673520173,
“entryType”: “resource”,
“fetchStart”: 462.95008929525244,
“initiatorType”: “img”,
“name”: “https://cn.bing.com/sa/simg/SharedSpriteDesktopRewards_022118.png”,
“nextHopProtocol”: “”,
“redirectEnd”: 0,
“redirectStart”: 0,
“requestStart”: 463.91217466260445,
“responseEnd”: 463.91217466260445,
“responseStart”: 463.91217466260445,
“startTime”: 462.95008929525244,
“workerStart”: 0
}

以上為 2018 年 7 月 7 日，在 cn.bing.com 下搜尋 test 時，performance.getEntriesByType(“resource”) 返回的第二條結果。

我們關注的是資源載入的耗時情況，可以通過如下形式獲得：
const [{ startTime, responseEnd }] = performance.getEntriesByType(`resource`)
const loadTime = responseEnd – startTime

同 Navigation Timing 相似，關於 startTime 、 fetchStart、connectStart 和 requestStart 的區別， Resource Timing Level 2 給出了詳細說明：

並非所有的資源載入時間都需要關注，重點還是載入過慢的部分。
出於簡化考慮，定義 10s 為超時界限，那麼獲取超時資源的方法如下：
const SEC = 1000
const TIMEOUT = 10 * SEC
const setTime = (limit = TIMEOUT) => time => time >= limit
const isTimeout = setTime()
const getLoadTime = ({ startTime, responseEnd }) => responseEnd – startTime
const getName = ({ name }) => name
const resourceTimes = performance.getEntriesByType(`resource`)
const getTimeoutRes = resourceTimes
.filter(item => isTimeout(getLoadTime(item)))
.map(getName)

這樣一來，我們獲取了所有超時的資源列表。

簡單封裝一下：const SEC = 1000

const TIMEOUT = 10 * SEC
const setTime = (limit = TIMEOUT) => time => time >= limit
const getLoadTime = ({ requestStart, responseEnd }) =>
responseEnd – requestStart
const getName = ({ name }) => name
pMonitor.getTimeoutRes = (limit = TIMEOUT) => {
const isTimeout = setTime(limit)
const resourceTimes = performance.getEntriesByType(`resource`)
return resourceTimes.filter(item => isTimeout(getLoadTime(item))).map(getName)
}

上報資料

獲取資料之後，需要向服務端上報：
// 生成表單資料
const convert2FormData = (data = {}) =>
Object.entries(data).reduce((last, [key, value]) => {
if (Array.isArray(value)) {
return value.reduce((lastResult, item) => {
lastResult.append(`${key}[]`, item)
return lastResult
}, last)
}
last.append(key, value)
return last
}, new FormData())
// 拼接 GET 時的url
const makeItStr = (data = {}) =>
Object.entries(data)
.map(([k, v]) => `${k}=${v}`)
.join(`&`)
// 上報資料
pMonitor.log = (url, data = {}, type = `POST`) => {
const method = type.toLowerCase()
const urlToUse = method === `get` ? `${url}?${makeItStr(data)}` : url
const body = method === `get` ? {} : { body: convert2FormData(data) }
const option = {
method,
…body
}
fetch(urlToUse, option).catch(e => console.log(e))
}

回過頭來初始化

資料上傳的 url、超時時間等細節，因專案而異，所以需要提供一個初始化的方法：
// 快取配置
let config = {}
/**
* @param {object} option
* @param {string} option.url 頁面載入資料的上報地址
* @param {string} option.timeoutUrl 頁面資源超時的上報地址
* @param {string=} [option.method=`POST`] 請求方式
* @param {number=} [option.timeout=10000]
*/
pMonitor.init = option => {
const { url, timeoutUrl, method = `POST`, timeout = 10000 } = option
config = {
url,
timeoutUrl,
method,
timeout
}
// 繫結事件用於觸發上報資料
pMonitor.bindEvent()
}

何時觸發

效能監控只是輔助功能，不應阻塞頁面載入，因此只有當頁面完成載入後，我們才進行資料獲取和上報（實際上，頁面載入完成前也獲取不到必要資訊）：
// 封裝一個上報兩項核心資料的方法
pMonitor.logPackage = () => {
const { url, timeoutUrl, method } = config
const domComplete = pMonitor.getLoadTime()
const timeoutRes = pMonitor.getTimeoutRes(config.timeout)
// 上報頁面載入時間
pMonitor.log(url, { domeComplete }, method)
if (timeoutRes.length) {
pMonitor.log(
timeoutUrl,
{
timeoutRes
},
method
)
}
}
// 事件繫結
pMonitor.bindEvent = () => {
const oldOnload = window.onload
window.onload = e => {
if (oldOnload && typeof oldOnload === `function`) {
oldOnload(e)
}
// 儘量不影響頁面主執行緒
if (window.requestIdleCallback) {
window.requestIdleCallback(pMonitor.logPackage)
} else {
setTimeout(pMonitor.logPackage)
}
}
}

彙總
到此為止，一個完整的前端效能監控工具就完成了～全部程式碼如下：
const base = {
log() {},
logPackage() {},
getLoadTime() {},
getTimeoutRes() {},
bindEvent() {},
init() {}
}

const pm = (function() {
// 向前相容
if (!window.performance) return base
const pMonitor = { …base }
let config = {}
const SEC = 1000
const TIMEOUT = 10 * SEC
const setTime = (limit = TIMEOUT) => time => time >= limit
const getLoadTime = ({ startTime, responseEnd }) => responseEnd – startTime
const getName = ({ name }) => name
// 生成表單資料
const convert2FormData = (data = {}) =>
Object.entries(data).reduce((last, [key, value]) => {
if (Array.isArray(value)) {
return value.reduce((lastResult, item) => {
lastResult.append(`${key}[]`, item)
return lastResult
}, last)
}
last.append(key, value)
return last
}, new FormData())
// 拼接 GET 時的url
const makeItStr = (data = {}) =>
Object.entries(data)
.map(([k, v]) => `${k}=${v}`)
.join(`&`)
pMonitor.getLoadTime = () => {
const [{ domComplete }] = performance.getEntriesByType(`navigation`)
return domComplete
}
pMonitor.getTimeoutRes = (limit = TIMEOUT) => {
const isTimeout = setTime(limit)
const resourceTimes = performance.getEntriesByType(`resource`)
return resourceTimes
.filter(item => isTimeout(getLoadTime(item)))
.map(getName)
}
// 上報資料
pMonitor.log = (url, data = {}, type = `POST`) => {
const method = type.toLowerCase()
const urlToUse = method === `get` ? `${url}?${makeItStr(data)}` : url
const body = method === `get` ? {} : { body: convert2FormData(data) }
const init = {
method,
…body
}
fetch(urlToUse, init).catch(e => console.log(e))
}
// 封裝一個上報兩項核心資料的方法
pMonitor.logPackage = () => {
const { url, timeoutUrl, method } = config
const domComplete = pMonitor.getLoadTime()
const timeoutRes = pMonitor.getTimeoutRes(config.timeout)
// 上報頁面載入時間
pMonitor.log(url, { domeComplete }, method)
if (timeoutRes.length) {
pMonitor.log(
timeoutUrl,
{
timeoutRes
},
method
)
}
}
// 事件繫結
pMonitor.bindEvent = () => {
const oldOnload = window.onload
window.onload = e => {
if (oldOnload && typeof oldOnload === `function`) {
oldOnload(e)
}
// 儘量不影響頁面主執行緒
if (window.requestIdleCallback) {
window.requestIdleCallback(pMonitor.logPackage)
} else {
setTimeout(pMonitor.logPackage)
}
}
}

/**
* @param {object} option
* @param {string} option.url 頁面載入資料的上報地址
* @param {string} option.timeoutUrl 頁面資源超時的上報地址
* @param {string=} [option.method=`POST`] 請求方式
* @param {number=} [option.timeout=10000]
*/
pMonitor.init = option => {
const { url, timeoutUrl, method = `POST`, timeout = 10000 } = option
config = {
url,
timeoutUrl,
method,
timeout
}
// 繫結事件用於觸發上報資料
pMonitor.bindEvent()
}

return pMonitor
})()

export default pm
如何？是不是不復雜？甚至有點簡單～

再次看了看時間，5 分鐘什麼的，還是不要在意這些細節了吧 orz

補充說明
呼叫
如果想追（吹）求（毛）極（求）致（疵）的話，在頁面載入時，監測工具不應該佔用主執行緒的 JavaScript 解析時間。因此，最好在頁面觸發 onload 事件後，採用非同步載入的方式：
// 在專案的入口檔案的底部
const log = async () => {
const pMonitor = await import(`/path/to/pMonitor.js`)
pMonitor.init({ url: `xxx`, timeoutUrl: `xxxx` })
pMonitor.logPackage()
// 可以進一步將 bindEvent 方法從原始碼中刪除
}
const oldOnload = window.onload
window.onload = e => {
if (oldOnload && typeof oldOnload === `string`) {
oldOnload(e)
}
// 儘量不影響頁面主執行緒
if (window.requestIdleCallback) {
window.requestIdleCallback(log)
} else {
setTimeout(log)
}
}

跨域等請求問題
工具在資料上報時，沒有考慮跨域問題，也沒有處理 GET 和 POST 同時存在的情況。

5 分鐘還要什麼自行車！

如有需求，可以自行覆蓋 pMonitor.logPackage 方法，改為動態建立 <form/> 和 <iframe/> ，或者使用更為常見的圖片打點方式～
說好的報警呢？光有報沒有警？！
這個還是需要服務端配合的嘛[認真臉.jpg]。
既可以是每個專案對應不同的上報 url，也可以是統一的一套 url，專案分配唯一 id 作為區分。
當超時次數在規定時間內超過約定的閾值時，郵件/簡訊通知開發人員。
細粒度
現在僅僅針對超時資源進行了簡單統計，但是沒有上報具體的超時原因（DNS？TCP？request？ response？），這就留給讀者去優化了，動手試試吧～

下一步

本文介紹了關於頁面載入方面的效能監控，此外，JavaScript 程式碼的解析 + 執行，也是制約頁面首屏渲染快慢的重要因素（特別是單頁面應用）。下一話，小編將帶領大家進一步探索 Performance Timeline Level 2，實現更多對於 JavaScript 執行時的效能監控，敬請期待～

5 分鐘擼一個前端效能監控工具
2018-07-18
前端
前端效能監控
2019-04-03
前端
10分鐘徹底搞懂前端頁面效能監控
2019-09-26
前端
打造前端監控系統
2021-03-08
前端
Performance --- 前端效能監控
2019-06-05
ORM前端
Linux 效能監控工具
2024-05-03
Linux
「前端那些事兒」④ 效能監控
2019-04-01
前端
深入理解前端效能監控
2019-04-08
前端
前端是如何監控效能的？
2024-12-11
前端
Centos效能監控工具——netdata配置
2023-03-31
CentOS
DIY一個前端監控平臺（上）
2019-03-27
前端
前端效能監控-window.performance（轉）
2018-05-23
前端ORM
簡單瞭解前端效能監控
2024-04-14
前端
前端監控(效能/資料/異常)
2020-04-05
前端
一口氣總結，25 個 Linux 效能監控工具，建議收藏
2021-11-13
Linux
Flutter效能監控工具（3）--- Observatory使用
2019-01-28
Flutter
ios 手機app效能監控工具
2024-08-13
iOSAPP
☕[JVM效能專題]（1）效能監控-命令列工具
2021-06-16
JVM命令列
做個前端錯誤監控
2018-10-25
前端
Flutter效能監控工具（1）--- Observatory簡介
2019-01-27
Flutter
效能監控工具之Grafana+Prometheus+Exporters
2021-06-12
GrafanaPrometheusExport
效能測試監控工具--Jmeter + Grafana + InfluxDB
2021-01-07
JMeterGrafanaUX
Windows 2003自帶效能監控工具的使用
2018-06-27
Windows
Jmeter系列（38）- 詳解效能監控工具 nmon
2020-07-07
JMeter
深入理解JVM：效能分析與監控工具
2020-12-29
JVM
php效能監控
2022-02-17
PHP
幾個常用的linux效能監控命令
2018-04-12
Linux
聊聊前端監控——錯誤監控篇
2020-09-02
前端
來！做一個分鐘級業務監控系統【實戰】
2019-07-21
redis效能監控工具redis-stat安裝初探
2018-05-29
Redis
OpManager--強大的網路效能監控工具
2023-12-13
最強效能監控工具之Grafana+Prometheus+Exporters
2023-03-30
GrafanaPrometheusExport
一種對雲主機進行效能監控的監控系統及其監控方法
2018-07-30
值得收藏！9個最佳SSD狀態監控及效能最佳化工具
2019-02-22
前端效能監控：你瞭解 Performance Timeline Level 2 嗎？
2019-04-13
前端ORM
zanePerfor 一款完整，高效能，高可用的前端效能監控系統，不要錯過
2018-11-08
前端
Android 效能監控系列一（原理篇）
2018-06-05
Android
磁碟IO效能監控
2018-06-27