前端異常監控實踐

劉卿發表於2018-03-02

原文網址 : https://juejin.im/post/5a98bb9f5188255570056d9c

前端

背景

之前寫了一篇年終總結的文章，有些朋友對我們在做的監控比較感興趣，特此寫一篇文章來梳理我們的整體的一套思路給大家參考。

前端異常監控系統的開發其實並不複雜，開源實現方案也頗多，技術實現成本並不難，痛點有但是並不是都不能解決，根據我們的情況總結了一下：

前端SDK，主要是使用者行為追蹤，錯誤攔截，上報策略，API設計。
上報的日誌實現實時查詢。
分級分層預警。
日誌分析策略。

前端SDK

使用者行為追蹤

捕獲使用者的操作路徑，根據操作路徑我們去還原使用者的使用場景，來幫助我們快速定位問題的所在。

操作路徑分為以下幾個點：

事件觸發。根據業務場景，只擷取了使用者的點選（click/change）和拉動滾動條。
瀏覽路徑。這塊分為2種情況，spa和多頁面應用，多頁面應用我們可以通過 referrer 來確認上一個頁面的url。spa的頁面我們是對路由進行函式進行監聽來做到。

當然這塊整體的資料我們會基於cookie和localstorage來存取資料。

異常

指令碼通過window.onerror以及攔截angular和vue的handleError來獲取。 ajax這塊除了ajax報錯資訊之外，也會根據業務層面的需求攔截返回的錯誤（栗子：我們請求返回除200外都是錯誤，所以整體都會上報）。

異常這塊其實坑還是蠻多的，不過市面上各位大大總結的夠好了，大家可以看看各位大大的總結。

作業系統

這塊就是整個系統的資訊，以及瀏覽器的資訊、ua等。

總結

sdk這塊其實2個難點，一個是使用者行為如何定義？另一個異常收集這塊會有蠻多的坑要踩。另一部分整體的上報策略，目前我們是對異常進行了分級，低階別的錯誤延遲並且合併上報，同一個點同一種錯誤去重上報。

日誌收集

所有日誌都打到nginx，並且nginx備份日誌，請求代理到後面的node服務，node服務清洗資料後進行入庫，這塊有一個要注意的點，如果node服務被打死，整個資料就斷掉了，所以這塊我們有一個定時任務從nginx備份的日誌裡清洗出由於服務掛掉沒有處理的請求。

為什麼沒有用到大家都比較愛使用的elk呢？答：通過調研目前我們的量級其實還沒有完全要上升到需要elk的層面，我們更傾向於一種可控的狀態。

預警

預警服務採用分級策略，按照組織架構，高階別的異常上來後，一段時間沒有處理，預警系統會觸發向上彙總的策略，直到部門負責人。

展示分析

目前這塊會相對薄弱一些，基本只分析了一個週期的專案情況。整個重心還是在錯誤的解決層面。

總結

前端sdk更偏重於前端的異常收集。整體的後端服務，其實是面向於所有的異常來做的，我們更傾向於給公司提供一套完善的日誌系統（ps：目前我們團隊的後端監控的資料也逐漸的上到該系統）。

最後希望感興趣的同學加入我們團隊email:liuqing@liluo.me（除前端外，我們也招python，爬蟲，大資料）, 也希望各位能給我們提些意見和建議，畢竟組內的同學們也是通過業餘時間來把整體的方案完善，並且開發完成，還有很多需要提升的地方。

前端異常監控
2018-07-21
前端
前端監控(效能/資料/異常)
2020-04-05
前端
web前端之異常/錯誤監控
2019-03-09
Web前端
前端異常日誌監控 – 使用Sentry
2018-09-12
前端
前端異常監控之 Sentry的部署和使用
2018-08-15
前端
關於前端指令碼異常監控的思考
2019-04-20
前端指令碼
搭建前端監控，如何採集異常資料？
2022-06-10
前端
SpringBoot+WebSocket實時監控異常
2021-10-15
Spring BootWeb
Flutter異常監控 - 伍 | 關於異常監控框架設計的思考
2023-01-11
Flutter框架
小程式異常監控收集
2019-03-04
異常監控和判斷
2024-07-30
「Eolink Apikit 教程」API 異常監控-建立 API 監控
2023-10-30
API
GMTC 大前端時代前端監控的最佳實踐
2018-06-29
前端
前端異常監控、上報及js壓縮程式碼定位
2018-08-03
前端JS
前端監控進階篇 — Sentry 監控 Next.js 專案實踐
2020-02-15
前端JS
Kubernetes監控實踐
2019-09-19
【TABLE】Oracle監控異常的表設計
2021-08-25
Oracle
Flutter異常監控 - 貳 | 框架Catcher原理分析
2022-12-31
Flutter框架
Flutter異常監控 - 壹 | 從Zone說起
2022-12-31
Flutter
Eolink Apikit 如何對所有 API 異常請求實時監控 ?
2023-11-07
API
前端監控實踐——FMP的智慧獲取演算法
2018-11-22
前端演算法
使用 sentry 除錯應用和監控異常
2019-08-02
除錯
Flutter異常監控 - 肆 | Rollbar原始碼賞析
2023-01-10
Flutter原始碼
前端監控穩定性資料分析實踐｜得物技術
2023-03-02
前端
前端監控穩定性資料分析實踐｜得物技術
2023-03-02
前端
寫了個監控 ElasticSearch 程式異常的指令碼！
2023-02-02
Elasticsearch指令碼
支援多種通道的 laravel 異常監控通知元件
2022-03-16
Laravel元件
Kubernetes監控實踐（2）：可行監控方案之Prometheus和Sensu
2019-09-27
Prometheus
異常測試實踐與梳理
2018-05-15
360容器平臺監控實踐
2018-12-14
prometheus監控golang服務實踐
2020-11-17
PrometheusGolang
使用Prometheus、Grafana監控Artifactory實踐
2021-05-21
PrometheusGrafana
yii-log-target - 監控系統異常且多渠道傳送異常資訊通知
2021-05-19
Python監控線上異常圖片地址自動告警
2020-11-09
Python
聊聊前端監控——錯誤監控篇
2020-09-02
前端
前端效能監控
2019-04-03
前端
T 沙龍移動實踐日總結 —— 蜂鳥團隊移動端異常監控體系建設
2018-08-30
異常體系與專案實踐
2023-05-19