Faiss使用多執行緒出現的效能問題

DWVictor發表於2021-08-31

原文網址 : https://www.cnblogs.com/DWVictor/p/15210985.html

AI執行緒

Faiss使用多執行緒出現的效能問題

faiss在增加CPU的情況下，反而出現效率低下的問題。

從理論上看，作為一個CPU/GPU計算型的應用，更多的核意味著更大的計算吞吐能力，效能只會越來越好才是。

在實際過程中，通過taskset命令分配更多的核給faiss只會帶來更長響應時間以及更大的響應時間偏差（variation）。

faiss的主要流程：建庫（train)、校驗（sanity check）、搜尋。

由於建庫是一次性操作，就不考慮建庫帶來的影響。對校驗分析，也沒有發現需要耗時太多的時間，那麼主要問題就在搜尋上面。

對於”核心越多，效能越差”的奇怪表現，搜尋階段又分兩個部分，一個是quantizer，一個是search_preassigned。考慮應該跟執行緒的計算有關，於是將nprobe值和batch設定強置為1，從演算法上保證search_preassigned只能用單核單執行緒。結果發現多核cpu依然滿載。

那麼直接用perf top命令檢視系統呼叫棧。發現在多核、單執行緒的模式下佔比最高的居然是libgomp，而真正的benchmark(6-IVFPQ)只佔了很少的CPU資源。

這就是核心的問題了：

Faiss的多核心是通過openMP實現的。
預設OMP_NUM_THREADS等於所有可用的CPU數，即OpenMP預設將會在啟動與核心數相同的執行緒數作為執行緒池。
預設情況下，openmp假定所有的呼叫都是計算密集型的。為了減少執行緒啟動/喚醒過程需要上下文開銷，系統必須時刻保證每一個執行緒都是alive狀態。換句話說，要讓執行緒活著，OpenMP會讓執行緒池的每個執行緒做大量的無意義計算佔據時間片而不是wait掛起。
quantizer 的過程中系統啟動了omp執行緒池，理論上在修改後的search_preassigned開始後，執行緒池已經沒有任何意義。但在放任不管的情況下，系統的每個核心的CPU使用率都會被空白計算佔據，理論上100%。主執行緒結束之前執行緒池不會自己銷燬。
這個時候如果位於主執行緒上的search_preassigned函式需要執行，那就不得不與OMP執行緒池搶佔CPU time。這就是核心越多效能越差的原因。而放大這個影響的原因是我們的測試程式經過了變態級別的優化之後導致OMP的執行緒維護開銷遠遠大於任務的CPU開銷（微秒級響應，少於0.1個最小上下文）。這個測試事實上成為了某種程度“系統排程時延”測量。這個結果恰恰反應了預期。

剩下的就是解這個問題了，那隻要在合適的時候讓執行緒池銷燬所有執行緒就迎刃而解了。OpenMP的實現是基於編譯器的，發現沒有辦法可以直接實現目的，只有兩個對應的環境變數可以緩解：

GOMP_SPINCOUNT= omp執行緒經過了n個spin lock之後便被掛起。自然，n值越小就越早的掛起執行緒。
OMP_WAIT_POLICY=PASSIVE 通過使用wait方法掛起 omp執行緒。對應的ACTIVE 意味著執行緒池中的執行緒始終處於活動狀態——消耗大量的CPU。

看上去效果還是不錯的。

PS：並沒有對所有情況進行測試，現在的結果指向是由於faiss依賴的openblat庫中額外的omp執行緒池出現了問題導致主執行緒效能受到影響。理論上多執行緒也會如此，只是概率上導致看上去效能不是線性下降。

然後OMP_WAIT_POLICY的問題，主要是對在openmp下使用OpenBLAS的BLAS實現的時候起作用，此外，如果用了MKL庫，一定條件下的MKL同樣也會觸發。

然後在faiss建立索引（train），也可能會出現這種情況，使用最新的faiss1.6.5及以後建立索引，CPU佔用率明顯有下降。

參考：http://www.litrin.net/2020/03/26/faiss的多執行緒效率問題/

https://www.cnblogs.com/yhzhou/p/10568728.html

https://www.cnblogs.com/yangyangcv/archive/2012/03/23/2413335.html

多執行緒引起的效能問題分析
2020-11-25
執行緒
Spring中多執行緒的使用及問題
2022-04-25
Spring執行緒
iOS多執行緒全套：執行緒生命週期，多執行緒的四種解決方案，執行緒安全問題，GCD的使用，NSOperation的使用
2019-03-03
iOS執行緒GC
多執行緒相關問題
2018-05-16
執行緒
多執行緒問題解釋
2020-03-06
執行緒
Java多執行緒中執行緒安全與鎖問題
2018-11-27
Java執行緒
Java多執行緒面試高配問題---多執行緒（3）🧵
2024-03-21
Java執行緒面試
多執行緒之8鎖問題
2020-05-02
執行緒
05.java多執行緒問題
2018-12-24
Java執行緒
使用多執行緒提高rest服務效能
2019-03-01
執行緒REST
Java多執行緒-執行緒池的使用
2021-01-17
Java執行緒
多執行緒的安全性問題（三）
2020-10-02
執行緒
多執行緒的出現是要解決什麼問題的? 本質什麼?
2024-04-22
執行緒
多執行緒，你覺得你安全了？（執行緒安全問題）
2020-12-24
執行緒
java多執行緒之執行緒的基本使用
2020-11-08
Java執行緒
HashMap多執行緒併發問題分析
2018-06-21
HashMap執行緒
子執行緒使用父執行緒RequestScope作用域Bean問題的探究
2018-06-04
執行緒Bean
BATJ都愛問的多執行緒面試題
2018-11-02
BAT執行緒面試題
多執行緒日誌和截圖的問題
2020-08-03
執行緒
多執行緒的安全問題及解決方案
2020-07-18
執行緒
SpringMVC中出現的執行緒安全問題分析
2018-08-27
SpringMVC執行緒
使用委託開啟多執行緒(多執行緒深入)
2018-09-16
執行緒
多執行緒的libcurl的使用
2022-01-17
執行緒
多執行緒併發安全問題詳解
2019-03-24
執行緒
40 個 Java 多執行緒問題總結
2018-08-17
Java執行緒
Java多執行緒和併發問題集
2018-06-24
Java執行緒
5分鐘搞懂多執行緒安全問題
2020-08-04
執行緒
如何解決多執行緒併發問題
2019-04-26
執行緒
java使用多執行緒
2024-09-12
Java執行緒
深入淺出Java多執行緒(十二)：執行緒池
2024-03-13
Java執行緒
有個關於多執行緒的識別問題
2020-05-08
執行緒
解決POI多執行緒匯出時資料錯亂問題
2022-02-22
執行緒
Java多執行緒的實現
2019-01-19
Java執行緒
Java多執行緒之—Synchronized方式和CAS方式實現執行緒安全效能對比
2018-09-18
Java執行緒synchronized
Java多執行緒的使用（二）
2021-09-09
Java執行緒
企圖使用c++執行緒解決nodejs單執行緒問題
2024-06-25
C++執行緒NodeJS
Java之實現多執行緒的方式三：實現Callable介面（結合執行緒池使用）
2018-05-23
Java執行緒
多執行緒面試題
2024-04-29
執行緒面試題

Faiss使用多執行緒出現的效能問題

相關文章