一次XGBoost效能優化-超執行緒影響運算速度

自由早晚亂餘生發表於2022-05-29

原文網址 : https://www.cnblogs.com/operationhome/p/16324011.html

優化執行緒

一、問題背景

一個朋友在使用 XGBoost 框架進行機器學習編碼，他們的一個demo, 在筆記本的虛擬機器(4核)執行的時候，只要8s, 但是在一個64核128G 的物理機上面的虛擬機器去跑的時候，發現時間需要更長。

筆記本執行：

二、問題定位和解決

首先看到負載是比較高的，記憶體佔用比較少。因為是計算型的，所以這種狀態是正常的。

一開始我覺得是GIL 鎖，後面詢問是使用了 XGBoost 框架，想去官網看看能不能找到相關內容

XGBoost 多執行緒支援文件的一段話提醒了我：

我們可以在具有更多核心的機器上執行相同的程式碼。例如大型的 Amazon Web Services EC2 具有 32 個核心。我們可以調整上面的程式碼來計算具有 1 到 32 個核心的模型所需的訓練時間。結果如下圖。

XGBoost 在 1 到 32 個核心上訓練模型所需的時間

值得注意的是，在多於 16 個執行緒（大約 7 秒）的情況下，我們沒有看到太多進步。我想其原因是 Amazon 僅在硬體中提供 16 個核心，而另外的 16 個核心是通過超執行緒提供額外。結果表明，如果您的計算機具有超執行緒能力，則可能需要將 num_threads 設定為等於計算機中物理 CPU 核心的數量。

示例： https://github.com/dmlc/xgboost/blob/master/demo/guide-python/sklearn_parallel.py

我們通過示例將 n_job 的值調整為 cpu 核心的一半，

n_jobs=multiprocessing.cpu_count()//2

發現解決了問題

C++ 效能優化篇二《影響優化的計算機行為》
2020-11-26
C++優化計算機
javascript執行緒及與執行緒有關的效能優化
2019-01-05
JavaScript執行緒優化
Java 執行緒與同步的效能優化
2020-07-19
Java執行緒優化
效能優化小冊 - 提高網頁響應速度：優化你的 CDN 效能
2020-05-21
優化網頁
Java 效能調優：最佳化 GC 執行緒設定
2024-09-17
JavaGC執行緒
前端優化系列 – 初始化的效能影響分析
2019-02-27
前端優化
前端優化系列 - 初始化的效能影響分析
2018-03-26
前端優化
CSS3實現動畫不會影響主執行緒，JS實現動畫會影響主執行緒
2020-10-03
CSSS3動畫執行緒JS
分支對程式碼效能的影響和優化
2022-03-26
優化
Json序列化與反序列化導致多執行緒執行速度和單執行緒執行速度一致問題
2022-05-11
JSON執行緒
java效能調優記錄（執行緒阻塞）
2019-01-17
Java執行緒
Android 效能最佳化之執行緒
2021-09-09
Android執行緒
Oracle優化案例-統計資訊對執行計劃的影響（十三）
2018-12-22
Oracle優化
Oracle 效能優化-expdp備份速度優化02
2020-02-13
Oracle優化
Oracle 效能優化-expdp備份速度優化03
2021-09-01
Oracle優化
js程式碼優化提高執行效能
2020-12-23
JS優化
影響BlueHost雲主機的執行速度有哪些？
2019-08-01
執行緒池運用不當的一次線上事故
2020-06-12
執行緒
Cookbook：優化 Vue 元件的執行時效能
2018-11-23
優化Vue元件
記一次 spinor flash 讀速度優化
2020-05-10
優化
常用高併發網路執行緒模型效能優化實現-體驗百萬級高併發執行緒模型設計
2020-10-16
執行緒模型優化
Java多執行緒程式設計—鎖優化
2018-10-24
Java執行緒程式設計優化
理解JVM（六）：執行緒安全和鎖優化
2018-06-27
JVM執行緒優化
最影響SQL執行速度的坑，你中招了嗎？
2020-03-16
SQL
記一次效能優化的心酸歷程【Flask+Gunicorn+pytorch+多程式+執行緒池，一頓操作猛如虎】
2021-11-13
優化FlaskPyTorch執行緒
web-worker 獨立執行緒，效能最佳化
2024-09-05
Web執行緒
python 操作 PostgreSQL 資料庫，執行緒並行修改 5w 條資料，效能優化
2019-12-31
PythonSQL資料庫執行緒並行優化
一次 Flutter WebView 效能優化
2020-01-16
FlutterWebView優化
? 記一次前端效能優化
2019-05-10
前端優化
Apache ShardingSphere 5.1.0 執行引擎效能優化揭祕
2022-03-24
Apache優化
Oracle優化案例-select中to_clob對效能的影響（二十一）
2019-08-19
Oracle優化
Java 多執行緒基礎（十一）執行緒優先順序和守護執行緒
2020-06-24
Java執行緒
從一次效能優化看https的效能
2019-03-24
優化HTTP
IO多路複用和多執行緒會影響Redis分散式鎖嗎？
2023-03-18
執行緒Redis分散式
【效能優化實踐】優化打包策略提升頁面載入速度
2018-05-05
優化
【java】【多執行緒】睡眠/守護/加入/禮讓執行緒，執行緒優先順序（4）
2018-04-15
Java執行緒
Redis單執行緒，為什麼速度快
2024-04-28
Redis執行緒
常用高併發網路執行緒模型設計及mongodb執行緒模型優化實踐
2020-10-23
執行緒模型MongoDB優化

一次XGBoost效能優化-超執行緒影響運算速度

一、問題背景

二、問題定位和解決

相關文章