將一個介面響應時間從2s優化到 200ms以內的一個案例

明明如月學長發表於2020-03-01

一、背景

在開發聯調階段發現一個介面的響應時間特別長,經常超時,囧…

本文講講是如何定位到效能瓶頸以及修改的思路,將該介面從 2 s 左右優化到 200ms 以內 。

二、步驟

2.1 定位

定位效能瓶頸有兩個思路,一個是通過工具去監控,一個是通過經驗去猜想。

2.1.1 工具監控

就工具而言,推薦使用 arthas ,用到的是 trace 命令

具體安裝步驟很簡單,大家自行研究。

我的使用步驟是,先最終待研究的函式的最外層:

trace com.xxx.service.impl.AServiceImpl refresh

其中耗時最多的子函式會被標紅色

Affect(class-cnt:2 , method-cnt:2) cost in 525 ms.
`---ts=2020-0X-0Y 13:33:18;thread_name=DubboServerHandler-127.0.0.1:20880-thread-36;id=24e;is_daemon=true;priority=5;TCCL=com.mmm.WWWClassLoader@4362d7df
    `---[1761.834357ms] com.xxx.service.impl.AServiceImpl$$EnhancerBySpringCGLIB$$e3cd7543:refresh()
        +---[0.017066ms] com.xxx.service.impl.AServiceImpl$$EnhancerBySpringCGLIB$$e3cd7543:$jacocoInit()
        `---[1761.00347ms] org.springframework.cglib.proxy.MethodInterceptor:intercept()
            `---[1757.647111ms] com.xxx.service.impl.AdServiceImpl:refresh()
                +---[0.006629ms] com.xxx.biz.yyy.service.impl.AServiceImpl:$jacocoInit()
                +---[0.004073ms] java.util.Collections:singletonList()
                +---[1709.203302ms] com.yyy.service.impl.AServiceImpl:refreshSomeThings()
                `---[48.135719ms] com.yzzzz.service.impl.AServiceImpl:createSurvey()

繼續再 trace 耗時最多的子函式。

trace com.yyy.service.impl.AServiceImpl refreshSomeThings

最終定位到最影響耗時的函式上,繼續往下跟。

最後發現造成效能瓶頸的函式是一個網路請求,單次請求大概 100多毫秒。

為了避免呼叫的資料量太大,專案中採用分批呼叫的方式,但是每個批次太小,導致請求次數過多。

假設請求 N 次(如 10次),每次請求 M毫秒(如 200ms),總耗時就是 N*M (2000)毫秒。

2.1.2 猜想

如果開發經驗足夠豐富,大致可以猜出哪些介面可能存在效能問題。

最常見的有:

  1. 慢 SQL 會是效能瓶頸,主要原因是沒有命中索引。
  2. 傳送遠端資料請求(RPC 遠端呼叫、HTTP 遠端呼叫)。
  3. I/O 操作等。

最常見的是在迴圈中執行 SQL或者網路請求。

然後審查一下自己的程式碼發現 SQL 查詢部分都可以命中索引,呼叫鏈路上有一個函式最終會呼叫 HTTP 請求,而且是在一個迴圈裡。

因此最有可能成為造成介面延時的是底層依賴的 HTTP 請求。

2.2 解決

既然 HTTP 請求是效能瓶頸,那麼要儘量減少請求,或者讓請求由序列改為多執行緒併發/並行

減少網路請求的次數,可以將多個請求合併成一個批量介面(或者增加批量請求的每個批次的大小)。

這裡的批次甚至可以使用動態配置,根據情況動態修改。

序列改為並行可以使用 CompletableFuture 來實現,具體參見:《Java 資料分批呼叫介面的正確姿勢》

最終一個介面從1 s - 2 s降低到了 200 ms 以內。

3、總結

很多人不願意學習 arthas ,如果不去學習不去了解,遇到可以用上的場景想不起來去用。

另外大家可以積累下開發過程中常見的效能瓶頸的原因,以便未來遇到效能瓶頸是可以快速排查和解決問題。

最後大家在開發階段或測試階段,多看錯誤日誌,多關注介面的響應時長等,儘早排除問題,儘早做優化。

希望本文對大家開發能夠有幫助。

如果我的文章對你有幫助,歡迎關注,點贊評論!!在這裡插入圖片描述

相關文章