作者|白璵
在電商時代,流量已成為企業核心競爭力,秒殺、搶購等活動成為必備營銷手段。自淘寶開啟雙十一活動,各大電商平臺以及品牌主的促銷活動更是如雨後春筍般不斷湧現。當需要向一個龐大群體提供服務時,可用性成為電商運營&網站運維的關鍵,面對電商大促帶來的流量浪湧,如何在應對散佈全球不同地區與國家的海量使用者以及流量激增的同時,保障業務穩定執行已成為企業必須解決的問題。以擁有千萬註冊使用者的某電商舉例,在大促活動期間,該企業將面對近千萬不同地區的使用者同時湧入,系統可用性將影響著大促的成功與否。
對電商網站而言,網站的載入緩慢或者不可用往往代表著前期的營銷造勢都付之一炬,這不僅僅是損失數千萬元訂單,更會對品牌口碑造成影響。在雙 11 這種電商大促場景下,由於流量的增加,網站一旦發生可用性問題,造成的社會影響也會成倍放大。
因此,針對雙 11 這類大促場景,不管是電商平臺還是自建站都會在前期進行壓測,通過壓測發現系統的效能瓶頸並做出對應的容量規劃。但是僅僅做壓測和擴容就夠了嗎?遠遠不夠,壓測這種場景更多的是從商家或平臺的視角評估網站的效能和容量,缺乏使用者視角的效能評估手段和方法。
這樣的網站優化不只是對 IaaS 層資源進行簡單擴容那麼簡單,而是需要對整個網站瀏覽路徑上的各環節進行優化調整。模擬全球不同地區使用者的使用,如果沒有模擬海量使用者且模擬真實使用者行為的測試工具,想預知這個複雜購物網站系統的效能、瓶頸或故障點位於何處,更像是一項不可能完成的任務。
我們以某著名大型電商網站的產品預售活動為例,我們希望在產品預約、搶購活動開始之前,對網站系統的效能進行測試,找到系統瓶頸,進而幫助系統優化,確保預約/搶購活動的順利進行。
本次測試為全球範圍的撥測測試,涉及到網站系統的店鋪頁、商品詳情頁、訂單頁。要對每個模組以及整個系統的效能進行測試。需要模擬大量全球不同地區的真實使用者同時操作,檢視頁面響應時間,確保系統在不同地區使用者瀏覽時響應及時,不會產生未知錯誤或者延遲影響網站使用者體驗。
我們藉助工具對相關效能與體驗指標進行收集與整合後,就要開始進行相關分析,我們以真實使用者的效能與體驗資料為核心,那麼分析流程應與真實使用者訪問流程大致為:終端—網路—應用—系統。在分析的過程中,我們需要確保擁有足夠的樣本量,以及自身對於不同指標對使用者體驗影響的權重評估。其中,我們著重關注終端、網路部分。
(1)全地域可用性摸底
在大促活動前,我們會針對自己面向的市場,選擇全國不同省份的重要城市不同運營商的真實使用者監測點,甚至是海外城市監測點,對網站的落地頁地址發起多輪網路撥測,從延時、丟包率、可用性等指標維度評估域名、 IP、API 效能情況,形成可用性整體報表,針對可用性較差地域或運營商會進行重點治理。
(2)核心路徑頁面使用者體驗評估
使用者體驗決定著促銷活動的效果,尤其是頁面的大概速度,更是直接決定著使用者的去留。有研究資料表明,如果網頁的開啟速度在 6-8 秒,大部分訪客會離開,開啟速度在 12 秒,99% 的使用者會離開。在大促前對使用者體驗的評估也是我們需要重點關注的地方。
針對於使用者體驗,我們前期會梳理出使用者的核心瀏覽路徑,在核心瀏覽路徑上的頁面會進行重點優化和治理。通過雲撥測的瀏覽任務,我們會獲得不同地域和運營商使用者訪問該頁面的首屏時間、100K 時間等核心的體驗指標。尤其針對整體首屏時間,要求核心瀏覽路徑的首屏時間必須符合相應要求。
(3)DNS 解析效果評估
DNS 解析是最容易被忽略的地方,前端時間 Facebook 的教訓還歷歷在目,所以針對 DNS 我們也會進行重點治理。通過遍佈全球的 1000+ 監測點,包括真實使用者監測,全天候 24 小時對目標域名發起網路請求,幫助使用者監測 DNS 服務對可用性和解析效能,同時 DNS 撥測支援指定遞迴、迭代不同查詢方式以及解析伺服器,通過靈活的撥測引數配置儘可能模擬真實使用者的訪問。
經過定時的撥測任務,阿里雲撥測可以生成不同地區的 DNS 解析用時的報表,同時針對每次撥測都清晰的列出 DNS 請求對詳情,包括 A 地址、DNS 用時、DNS 解析過程等,能給幫助使用者快速分析和定位 DNS 解析的問題。另外,通過配置 DNS 告警,針對於 DNS 的可用性問題和解析效能問題,也可以先於使用者感知並問問題的修復爭取時間,提高使用者的滿意度,降低經濟損失。
(4)CDN 質量監測
隨著網站的圖片、視訊內容越發豐富,為了解決不同地區、不同運營商訪問速度慢的問題,非常多電商網站都在使用 CDN 服務,提高網站載入速度,降低頻寬成本,增加內容可用性和冗餘。選取了目標使用者群體,如北美、歐洲、南美洲、東南亞等主要國家的 LastMile(真實網民)監測點,配置瀏覽器撥測任務,對大促網站進行撥測。
通過對撥測日誌進行分析,實時瞭解 CDN 部署後的展示效能為多少,是否有提升臺主機節點的效能情況,可用性是否穩定。目標客戶是否正確命中對應主機節點,或匹配度是否合理,CDN 節點與源站同步、對元素髮布是否提供到位並長期有效。並基於以上評估標準對 CDN 設定策略進行調整及優化。
每年雙 11 前夕,全鏈路壓測成為企業的必備選項,不斷地通過壓測發現問題進行迭代優化、全方位驗證業務的穩定性,而云撥測的出現,是對全鏈路壓測的完美補充,從使用者視角全面解析大促場景下的使用者體驗情況,讓使用者能夠擁有更加優質的購買體驗。並且隨著業務的發展不斷進化,持續發揮著不可替代的作用。
關於雲撥測
雲撥測作為面向業務的非侵入式雲原生監測產品,成為最佳的選擇。通過阿里雲遍佈全球的服務網路,模擬真實使用者行為,全天候持續監測網站及其網路、服務、API埠可用性與效能。實現頁面元素級、網路請求級、網路鏈路級細顆粒度問題定位。豐富的監測關聯項與分析模型,幫助企業及時發現與定位效能瓶頸與體驗暗點,壓降運營風險,提升服務體驗與效能。
(一)全球監測節點覆蓋
全球超過 20 萬 LM,500 餘個 IDC 終端監測節點,海內外 400+ 運營商以及數十萬量級註冊會員,確保監測規模滿足日益龐大的業務規模。
(二)無需嵌碼,開箱即用
零侵入式監測,只需輸入 URL 並進行簡單配置即可,無需研發支援。數分鐘即可獲得完整的網站效能資料分析報告。資源包&按量付費多種購買模式,滿足運維測試需求。
(三)面向業務,預置多種分析模型
監測週期精細至分鐘級別,7 大類 20 餘項監測關聯引數設定、支援多種主流協議,為站點和業務埠等提供 7×24 小時細顆粒度故障實時監測、告警及效能分析服務。以最終客戶視角,通過地域、運營商等多維度組合分析,下鑽分析單樣本詳情,利用豐富的指標體系與圖表型別,直觀定位問題、受影響範圍及其根因,壓降分析時間,提升運維效率。真正做到精細化監測。
(四)智慧告警,精準定位
針對首屏用時、整體效能、可用性實現實時告警,豐富的告警策略設定,與阿里雲告警中心深度整合,有效縮短MTTR。支援發現頁面元素級錯誤,問題歸因精準定位至單次網路請求過程,提升問題定位效率。
點選下方連結,瞭解更多詳情!
https://www.aliyun.com/activi...