記一次生產問題的排查，讓我領略了演算法的重要性

孤舟蓑翁發表於2022-05-03

原文網址 : https://www.cnblogs.com/wangpenghui522/p/16218816.html

前段時間，客戶反饋，有個PC端的功能頁面，一點開就卡死，通過檢視網路請求，發現有個部門組織架構樹的請求資料有點大，共有兩萬條資料,1.57M。剛開始我以為是表單中的部門選擇框渲染的時候，一次性渲染的dom節點過多，把頁面記憶體撐爆了。於是我把專案中使用的antd3的TreeSelect元件，升級到具有無限滾動載入功能的antd5版本，始終只渲染10條資料，按理說頁面卡死的問題應該就消失了。結果頁面操作幾次之後，頁面仍舊百分之百會崩掉，頁面卡死問題並未徹底解決。

於是我沉下心來，把出問題的頁面的邏輯從頭到尾看了一遍，發現有一處採用遞迴方式查詢某個部門id在不在部門樹之中的邏輯，可能存在效能問題。沒優化之前的寫法是這樣的：


const findTreeItem = (data, id) => {
  for (let i = 0,len=data.length; i < len; i++) {
    let item = data[i];
    if (item.id === id) {
      return true;
    } else {
      if (item.children) {
        if (findTreeItem(item.children, id)) {
          return true;
        }
      }
    }
  }
};
const isInclude = findTreeItem(treeData,deptId);

這種寫法的缺點是，當樹的層級很深時，可能會引起暴棧。讓我們分析一下這種遞迴演算法的空間複雜度。假設要判斷id="1-1-1-0"是否存在於treeData中

const treeData = [
  {
    id: "0",
    children: [
      {
        id: "1-0",
        children: [
          {
            id: "1-0-0",
            children: [
              {
                id: "1-0-0-0",
              },
              {
                id: "1-0-0-1",
              },
              {
                id: "1-0-0-2",
              },
              {
                id: "1-0-0-3",
              },
            ],
          },
          {
            id: "1-0-1",
          },
          {
            id: "1-0-2",
          },
        ],
      },
      { id: "1-1" },
    ],
  },
];

我們想知道，在遞迴呼叫的過程中，最大的記憶體佔用量。那就要對遞迴呼叫進行拆解，每一次遞迴函式呼叫自己，會佔用多少記憶體空間，從方法 findTreeItem(treeData,'1-1-1-0') 呼叫方法 findTreeItem(treeData[0].children,'1-1-1-0') 時，將建立findTreeItem(treeData[0].children,'1-1-1-0') 相對應的堆疊幀。該堆疊幀將保留在記憶體中，直到函式對findTreeItem(treeData[0].children,'1-1-1-0') 的呼叫終止。該堆疊幀負責儲存函式findTreeItem(treeData[0].children,'1-1-1-0') 的引數，函式findTreeItem(treeData[0].children,'1-1-1-0') 中的區域性變數以及呼叫方函式findTreeItem(treeData,'1-1-1-0')的返回地址。接著，當此函式 findTreeItem(treeData[0].children,'1-1-1-0') 呼叫函式 findTreeItem(treeData[0].children[0].children,'1-1-1-0') 時，也會生成findTreeItem(treeData[0].children[0].children,'1-1-1-0') 相對應的堆疊幀，並將其保留在記憶體中，直到對findTreeItem(treeData[0].children[0].children,'1-1-1-0') 的呼叫終止。呼叫 findTreeItem(treeData[0].children[0].children,'1-1-1-0') 時，堆疊框架的呼叫堆疊如下所示：

當呼叫到 findTreeItem(treeData[0].children[0].children[0].children,'1-1-1-0') ，執行完畢，返回對函式 findTreeItem(treeData[0].children[0].children,'1-1-1-0') 的呼叫時，由於不再需要findTreeItem(treeData[0].children[0].children,'1-1-1-0') 相對應的堆疊幀，js引擎將從記憶體中刪除該堆疊幀。函式 findTreeItem(treeData[0].children,'1-1-1-0')和函式 findTreeItem(treeData,'1-1-1-0') 的堆疊幀也是如此。

　　通過分析可以看出遞迴演算法的空間複雜度與所生成的最大遞迴樹的深度成正比。如果遞迴演算法的每個函式呼叫都佔用 O(m) 空間，並且遞迴樹的最大深度為 n，則遞迴演算法的空間複雜度將為 O(n·m)。

從performance屬性可以知道，一個頁面可以使用的記憶體量級是30M左右，假如2萬多條資料佔用1.5M左右記憶體空間，最理想的情況下，能支撐的遞迴深度也就20級左右，實際上要減去儲存程式碼佔用的空間，儲存基本型別資料和引用型別引用地址，儲存引用型別佔用的空間，三下五除二，留給遞迴方法使用的空間就所剩無幾了。無怪乎會造成頁面卡死。

於是對上面的查詢方法進行了一番優化，將深度遍歷優先改成廣度遍歷優先，頁面出現卡死的問題徹底解決。

findTreeItem(tree, curKey, keyField, childField, node = null) {
  const stack = [];
  for (const item of tree) {
    if (item) {
      stack.push(item);
      while (stack.length) {
        // 重點是這裡--邊查詢邊釋放記憶體空間
        const temp = stack.pop();

        if (temp[keyField] === curKey) {
          node = temp;
          break;
        }

        const children = temp[childField] || [];
        for (let i = children.length - 1; i >= 0; i--) {
          stack.push(children[i]);
        }
      }
    }
  }
  return node;
}

當資料量比較小的時候，好的演算法與差的演算法，沒有致命的差別。當資料量比較大的時候，演算法的優劣，有天壤之別。所以平日在寫資料處理邏輯的時候，要對資料處理的演算法，保持一定的敏感度。之前對好的演算法的優勢，僅僅停留在概念和理論上，實際感受不太深切。就好比讀了好多書，卻依然過不好這一生。以為對書中的道理，看過一遍，知道了就等於懂了。實際上真正要用到的時候，大概率想不起來。因為沒有特別深刻的感性認知。這次遭遇到生產問題的毒打之後，讓我感受到了好的演算法與壞的演算法，質的差別，演算法還是要重視起來。

記一次SparkStreaming不產生新的batchJob的問題排查
2018-07-19
SparkBAT
記一次生產頻繁發生FullGC問題
2023-03-16
GC
記一次生產環境大面積404問題！
2021-03-29
一次生產環境OOM排查
2024-03-01
OOM
一次生產環境CPU佔用高的排查
2023-02-10
記一次排查CPU高的問題
2021-11-05
一個排查了大半天兒的問題，差點又讓 MyBatis 背鍋
2020-05-18
MyBatis
排查Java的記憶體問題
2018-03-13
Java記憶體
記一次oom問題排查
2022-01-23
OOM
記錄一次問題排查
2021-08-02
一次生產 CPU 100% 排查優化實踐
2018-12-17
優化
從工作中的一個問題看演算法的重要性
2020-03-31
演算法
記一次 Laravel MethodNotAllowedHttpException 問題排查
2019-05-17
LaravelHTTPException
一次生產 CPU 100% 排查最佳化實踐
2018-12-18
記一次棧溢位異常問題的排查
2024-04-16
我在組內的Java問題排查分享
2021-12-01
Java
再一次生產 CPU 高負載排查實踐
2019-06-18
負載
記一次OOM問題排查過程
2019-11-22
OOM
記一次線上FGC問題排查
2023-01-31
GC
記一次線上崩潰問題的排查過程
2021-11-10
記一次生產事故：30萬單就這樣沒了！
2020-09-24
線上問題排查：記一次 Redis Cluster Pipeline 導致的死鎖問題
2023-12-04
Redis
記錄一次生產釋出事件——(簡單的非空驗證也能引發大問題)
2019-06-12
事件
記一次協助排查許可權問題的經歷
2021-09-09
線上問題排查，一不小心踩到阿里的 arthas坑了
2020-10-27
阿里
不要再問我跨域的問題了
2018-07-16
跨域
雖然是我遇到的一個棘手的生產問題，但是我寫出來之後，就是你的了。
2023-01-09
一次容器MySQL的效能問題排查
2021-12-01
MySql
一場由fork引發的超時，讓我們重新探討了Redis的抖動問題
2020-12-23
Redis
排查一個潛在的記憶體訪問問題 — 用 C 寫程式碼的日常
2019-05-14
記憶體
請教一個讓我這個菜雞不解的問題
2021-05-19
記一次 Kafka 重啟失敗問題排查
2020-03-16
Kafka
記一次線上websocket返回400問題排查
2022-04-09
Web
記一次生產資料庫“意外”重啟的經歷
2018-12-07
資料庫
記一次生產事故磁碟被佔滿
2020-02-10
炸了！一口氣問了我18個JVM問題！
2020-11-13
JVM
一次生產的 JVM 優化案例
2019-03-09
JVM優化
記一次安卓手機水印顯示問題的排查歷程
2019-02-26
安卓

記一次生產問題的排查，讓我領略了演算法的重要性

相關文章