開源大模型佔GPU視訊記憶體計算方法

锅总的程序人生發表於2024-09-08

原文網址 : https://www.cnblogs.com/zer0Black/p/18403655

執行大模型GPU佔用計算公式：

\(M=\frac{(P * 4B)}{32 / Q} * 1/2\)

M : 以GB標識的GPU記憶體
P : 模型中的引數數量，例如一個7B模型有70億引數
4B : 4個位元組，表示用於每個引數的位元組
32 : 4個位元組中有32位
Q : 應該用於載入模型的位數，例如16位、8位、4位
1.2 : 表示在GPU記憶體中載入其他內容的20%開銷

常用大模型記憶體佔用

大小（billion）	模型位數	視訊記憶體佔用（GB）
1.5B	4	0.9
1.5B	8	1.8
1.5B	16	3.6
7B	4	4.2
7B	8	8.4
7B	16	16.8
9B	4	5.4
9B	8	10.8
9B	16	21.6
40B	4	24
40B	8	48
40B	16	96
70B	4	42
70B	8	84
70B	16	168

量化大模型的標準寫法

經常看到量化大模型後面帶著q2_k 、ft16 、 q5_k_s 、q8_0 等寫法。這類寫法代表著大模型的量化後的指標，釋義如下：

傳統量化

包括q4_0、q4_1、q8_0等方法。

如q4_0。代表模型位數=4，0表示保留0位小數。即資料會被量化到0-255之間的整數

K值量化

如q2_k、q5_k_s 等方法。實際上就是不同層用不同精度量化，以比傳統量化更智慧的方式分配bit。解壓縮方式與傳統量化類似,同樣快速

ubuntu解決GPU視訊記憶體佔用問題
2019-03-27
UbuntuGPU記憶體
node計算記憶體佔用
2020-06-10
記憶體
淺談深度學習:如何計算模型以及中間變數的視訊記憶體佔用大小
2021-02-28
深度學習模型變數記憶體
MySQL記憶體佔用計算公式
2019-02-12
MySql記憶體公式
資源記憶體佔用
2024-10-18
記憶體
PostgreSQLGPU加速(HeteroDBpg_strom)(GPU計算,GPU-DIO-NvmeSSD,列存,GPU記憶體快取)
2018-07-28
SQLGPU記憶體快取
[20191115]oracle例項佔用記憶體計算.txt
2019-11-15
Oracle記憶體
A6000單機多卡大模型訓練踩坑記錄（CUDA環境、多GPU卡住且視訊記憶體100%）
2024-03-22
大模型GPU記憶體
優愛騰三大視訊APP技術對比--記憶體佔用
2019-03-17
APP記憶體
寫個方法近似計算指定陣列或物件佔用記憶體的大小
2024-12-04
陣列物件記憶體
開源視覺大模型
2024-09-13
視覺大模型
win10如何查詢哪些應用記憶體佔用大 win10如何檢視軟體記憶體佔用
2020-11-28
Win10記憶體
英偉達 RTX 4090/4080/4070 GPU型號、視訊記憶體、功耗曝光
2022-05-19
GPU記憶體
如何檢視MySQL資料庫佔多大記憶體，佔用太多記憶體怎麼辦？
2022-01-12
MySql資料庫記憶體
檢視LINUX程式記憶體佔用情況
2018-08-12
Linux記憶體
巨省視訊記憶體的重計算技巧在TF、Keras中的正確開啟方式
2020-05-09
記憶體Keras
win10開機記憶體佔用60%怎麼辦解決開機執行記憶體佔用率過高的方法
2021-02-22
Win10記憶體
pytorch，訓練模型時記憶體佔用不斷上升
2024-10-28
PyTorch模型記憶體
記憶體模型
2024-11-20
記憶體模型
聊聊記憶體模型與記憶體序
2022-06-16
記憶體模型
如何讓手遊記憶體佔用更小？從記憶體消耗iOS實時統計開始
2019-12-19
記憶體iOS
Linux/Centos檢視程式佔用記憶體大小的幾種方法總結
2018-03-15
LinuxCentOS記憶體
Win10系統GPU共享記憶體怎麼關閉？Win10系統GPU共享記憶體的關閉方法
2020-06-22
Win10GPU記憶體
檢視PHP-FPM的記憶體佔用、程序個數等資訊
2024-05-07
PHP記憶體
Java記憶體模型FAQ（一）什麼是記憶體模型
2021-12-02
Java記憶體模型
Win10記憶體佔用過多怎麼辦 win10清理記憶體佔用的方法
2022-04-16
Win10記憶體
電腦記憶體佔用過高怎麼辦電腦記憶體佔用過高解決方法
2020-12-29
記憶體
怎樣計算Bitmap的記憶體佔用和Bitmap載入優化
2019-03-02
記憶體優化
Android中一張圖片佔據的記憶體大小是如何計算
2018-10-15
Android記憶體
Oneflow 基於重計算的動態圖視訊記憶體最佳化實踐
2023-04-12
記憶體
英偉達 RTX 4050 移動 GPU 或將配備 6GB 視訊記憶體
2022-11-21
GPU記憶體
Java記憶體模型
2024-10-06
Java記憶體模型
Java 記憶體模型
2024-10-02
Java記憶體模型
JVM記憶體模型
2024-08-05
JVM記憶體模型
ffmpeg記憶體模型
2024-07-21
記憶體模型
Java記憶體區域和記憶體模型
2019-04-08
Java記憶體模型
計算機記憶體管理介紹
2019-04-09
計算機記憶體
深入理解併發程式設計藝術之計算機記憶體模型
2023-10-30
程式設計計算機記憶體模型