m4 mac mini本地部署ComfyUI,測試Flux-dev-GGUF的workflow模型10步出圖,測試AI繪圖效能,基於MPS(fp16),優點是能耗小和靜音

刘悦的技术博客發表於2024-12-08

m4 mac mini已經發布了一段時間，針對這個產品，更多的是關於價效比的討論，如果拋開各種補貼不論，價位上和以前釋出的mini其實差別不大，真要論價效比，各種windows系統的mini主機的價格其實是吊打蘋果的。

本次我們針對m4 mac mini的AI效能做個測試，使用目前泛用性最廣的AI工作流軟體:ComfyUI框架，基於MPS(fp16)模式進行測試。

Mac Os 本地部署ComfyUI

首先確保本機已經安裝好了基於arm架構的Python3.11，之所以使用Python3.11，是因為這個版本效能有一定的最佳化，又不會像最新的3.13由於版本過新，引發依賴裝不上的問題。

Mac版本Python3.11安裝包的下載地址:

https://python.org

隨後克隆官方專案:

git clone https://github.com/comfyanonymous/ComfyUI.git

接著安裝 MPS 版本的 torch

pip3 install --pre torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/nightly/cpu

然後安裝依賴：

pip3 install -r requirements.txt

依賴安裝完畢後，需要升級一下SSL證書：

bash /Applications/Python*/Install\ Certificates.command

接著安裝 ComfyUI 的 Manager 專案，用來安裝各種節點：

cd custom_nodes  
git clone https://github.com/ltdrdata/ComfyUI-Manager.git

至此ComfyUI專案就部署好了。

Flux-dev-GGUF模型下載

下載需要的flux-dev模型，由於官方的模型體積太大(23G)，這裡我們下載GGUF的量化版本:

https://pan.quark.cn/s/2907b57697fe

模型名稱分別是:flux1-dev-Q4_1.gguf和t5-v1_1-xxl-encoder-Q5_K_M.gguf，將其分別放到models的UNET目錄和clip目錄。

隨後，回到專案的根目錄，輸入命令，啟動ComfyUI服務：

python3 main.py --force-fp16

這裡強制使用fp16精度用來提升效能。

程式返回:

liuyue@mini ComfyUI % python3 main.py --force-fp16  
[START] Security scan  
[DONE] Security scan  
## ComfyUI-Manager: installing dependencies done.  
** ComfyUI startup time: 2024-12-08 23:04:08.464703  
** Platform: Darwin  
** Python version: 3.11.9 (v3.11.9:de54cf5be3, Apr  2 2024, 07:12:50) [Clang 13.0.0 (clang-1300.0.29.30)]  
** Python executable: /Library/Frameworks/Python.framework/Versions/3.11/bin/python3  
** ComfyUI Path: /Volumes/ssd/work/ComfyUI  
** Log path: /Volumes/ssd/work/ComfyUI/comfyui.log  
  
Prestartup times for custom nodes:  
   0.7 seconds: /Volumes/ssd/work/ComfyUI/custom_nodes/ComfyUI-Manager  
  
Total VRAM 24576 MB, total RAM 24576 MB  
pytorch version: 2.5.1  
Forcing FP16.  
Set vram state to: SHARED  
Device: mps  
Using sub quadratic optimization for cross attention, if you have memory or speed issues try using: --use-split-cross-attention  
[Prompt Server] web root: /Volumes/ssd/work/ComfyUI/web  
### Loading: ComfyUI-Manager (V2.51.9)  
### ComfyUI Revision: 2859 [b4526d3f] | Released on '2024-11-24'  
[ComfyUI-Manager] default cache updated: https://raw.githubusercontent.com/ltdrdata/ComfyUI-Manager/main/alter-list.json  
[ComfyUI-Manager] default cache updated: https://raw.githubusercontent.com/ltdrdata/ComfyUI-Manager/main/model-list.json  
[ComfyUI-Manager] default cache updated: https://raw.githubusercontent.com/ltdrdata/ComfyUI-Manager/main/github-stats.json  
[ComfyUI-Manager] default cache updated: https://raw.githubusercontent.com/ltdrdata/ComfyUI-Manager/main/custom-node-list.json  
Torch version 2.5.1 has not been tested with coremltools. You may run into unexpected errors. Torch 2.4.0 is the most recent version that has been tested.  
[ComfyUI-Manager] default cache updated: https://raw.githubusercontent.com/ltdrdata/ComfyUI-Manager/main/extension-node-map.json  
  
Import times for custom nodes:  
   0.0 seconds: /Volumes/ssd/work/ComfyUI/custom_nodes/websocket_image_save.py  
   0.0 seconds: /Volumes/ssd/work/ComfyUI/custom_nodes/ComfyUI-GGUF  
   0.1 seconds: /Volumes/ssd/work/ComfyUI/custom_nodes/ComfyUI-Manager  
   2.2 seconds: /Volumes/ssd/work/ComfyUI/custom_nodes/ComfyUI-MLX  
  
Starting server  
  
To see the GUI go to: http://127.0.0.1:8188

代表部署成功，訪問：http://127.0.0.1:8188

測試Flux-dev-GGUF工作流

下載基於GGUF的工作流：

https://promptingpixels.com/flux-gguf/

匯入工作流後，輸入提示詞:

a super sexy gal holding a sign that says "ComfyUI Mac"

意思是性感女子舉著一個牌子，上面寫著 ComfyUI Mac

此時，可以直接執行工作流，程式返回：

ggml_sd_loader:  
 13                            144  
 0                              50  
 14                             25  
Requested to load FluxClipModel_  
Loading 1 new model  
loaded completely 0.0 323.94775390625 True  
Requested to load FluxClipModel_  
Loading 1 new model  
  
ggml_sd_loader:  
 1                             476  
 3                             304  
model weight dtype torch.bfloat16, manual cast: None  
model_type FLUX  
Requested to load Flux  
Loading 1 new model  
loaded completely 0.0 7181.8848876953125 True  
 20%|██████████████████▌                                                                          | 2/10 [01:04<04:18, 32.27s/it]

每秒的迭代穩定在30次左右，一張圖大概需要3-5分鐘左右。

筆者的 m4 mac mini 的配置是丐版升級到24G記憶體，在出圖的過程中，透過活動監視器可知，記憶體沒有被佔滿：

可以看到，只使用了21G的記憶體，有網友使用純丐版16G記憶體的mini進行測試，16g記憶體實際刨除系統佔用，空閒最多也就10g，超出的部分只能跑SSD的虛擬記憶體，導致GPU跑不滿，所以丐版16G記憶體是有可能導致出圖的效率降低。

最後是10步迭代的出圖效果：

可以看到，精度沒有下降太多，主要問題還是出圖速度太慢。

結語

m4 mac mini的AI生態還有很大的提升空間，建議AI從業者慎重購買，如果一定要買，也需要避開16G記憶體的版本，因為如果模型體積過大，16G記憶體中真正能使用的其實只有10G記憶體，有可能會導致模型推理效率降低，當然，我們也不能忽視m4 mac mini推理模型的優點，那就是能耗小相對省電，並且使用時的聲音很小，不像N卡裝置動不動就山呼海嘯。

基於 AI 大模型的精準測試分享
2024-04-23
AI大模型
python 讀圖片效能測試
2019-03-06
Python
基於LINUX的MySql二進位制本地安裝和部署實施測試
2022-04-15
LinuxMySql
基於jmeter的效能全流程測試
2024-03-19
JMeter
測試圖
2018-05-15
【效能調優】效能測試、分析與調優基礎
2020-12-24
效能測試調優應該注意哪些要點，一般效能測試調優的步驟-Alltesting|澤眾雲測試
2022-06-16
介面測試和效能測試的區別
2020-11-27
效能測試之測試分析與調優
2021-11-12
Web效能測試種類與全面測試模型
2020-04-07
Web模型
微軟小語言模型Phi-3-mini測試體驗
2024-04-25
微軟模型
Rust效能分析之測試及火焰圖，附(lru,lfu,arc)測試
2024-06-18
Rust
測量、基線和效能優化之三：基於測量、基線和變化的效能優化
2018-10-12
優化
MYSQL 效能測試方法 - 基準測試（benchmarking）
2024-11-06
MySql
關於效能測試的這點事，值得收藏~
2019-08-12
測量、基線和效能優化之三：基於測量、基線和變化的效能優化v
2018-10-12
優化
用「圖靈測試」檢驗AI尤其是大語言模型，真的科學嗎？
2024-08-30
圖靈AI模型
手繪圖解：一次點選事件的面試題(基於RunLoop)
2019-03-02
繪圖圖解事件面試題OOP
軟體效能測試的優勢
2022-10-23
“粘土風格”輕鬆拿捏，基於函式計算部署 ComfyUI實現AI生圖
2024-06-05
函式UIAI
軟體效能測試和可靠性測試
2020-12-18
眼圖測試（硬體測試訊號完整性測試）
2020-11-10
PR效能測試軟體適用於哪些測試
2022-06-13
測試C#GDI+雙緩衝高效繪圖--BufferedGraphicsContext
2024-05-28
C#繪圖Context
效能測試瓶頸調優
2021-09-01
基於TPC-C基準的Python ORM的效能測試
2020-07-27
PythonORM
你不知道的JavaScript——效能測試和調優
2019-01-14
JavaScript
Jmeter介面測試+效能測試
2024-04-16
JMeter
ComfyUI 基礎教程（一） —— 本地安裝部署
2024-09-05
UI
什麼是測試左移和測試右移
2024-09-25
軟體測試培訓分享：效能測試的目的是什麼
2021-10-26
4大軟體測試策略的特點和區別（單元測試、整合測試、確認測試和系統測試）
2024-03-14
功能測試、自動化測試、效能測試的區別
2024-03-06
小白測試系列:介面測試與效能測試的區別
2020-07-31
OmniGraffle 7 Pro for mac(思維導圖/流程圖)中文測試版
2021-12-12
Mac流程圖
postgresql:pgbench基準效能測試
2020-12-08
SQL
效能測試實踐 | PerfDog 助力微信小遊戲 / 小程式效能調優
2020-07-20
遊戲
效能測試實踐 | PerfDog助力微信小遊戲/小程式效能調優
2020-07-20
遊戲

m4 mac mini本地部署ComfyUI,測試Flux-dev-GGUF的workflow模型10步出圖,測試AI繪圖效能,基於MPS(fp16),優點是能耗小和靜音

Mac Os 本地部署ComfyUI

Flux-dev-GGUF模型下載

測試Flux-dev-GGUF工作流

結語

相關文章