AI工程師的筆記本環境配置

老潘的部落格發表於2022-05-21

原文網址 : https://www.cnblogs.com/bigoldpan/p/16296220.html

AI工程師筆記

還是愛折騰...

前一陣子買了個新的膝上型電腦，幻13-3050TI-1T版本，全能本，CPU是8核心16執行緒的標壓版AMD銳龍9-5900HS，顯示卡是NVIDIA-3050TI，重量和macbook差不多，都是1.4kg，便攜、可以改變形態。

大概長這樣：

幻13

可以變換3種形態（莫名有種興奮感），可能也有人問我為啥不買macbook，沒買的原因有兩點：

macbook不支援nvidia顯示卡，這個無解，沒辦法本地跑AI程式碼，只能遠端伺服器
macbook用膩了，有一點審美疲勞，新版的macbook pro也太厚了，感覺不方便攜帶，主要也貴...

於是有了一臺和macbook接近大小、差不多重量的帶獨顯的全能筆記本，日常簡單開發、除錯除錯足夠用了。CPU是R9-5900HS、顯示卡是3050TI-4G，CPU的編譯速度也還可以，GPU的話除了視訊記憶體有點小，30系列的特性都有了，可以盡情嘗試。

畢竟搞AI的，當然對GPU比較敏感，這個3050TI是基於GA107核心，有2560個CUDA Core，80個Tensor Core，基本是夠玩了。計算能力8.6，目前（這句話寫的時候還是最新，但是立馬老黃3月份推出了H100）最新的特性該有的都有了：

FP32、FP16、BF16和INT8精度的支援
第三代Tensor Core等等

附一個GA102的白皮書，感興趣的可以翻翻。

有了筆記本，接下來就是配置開發環境了。

之前不想用Windows本主要是習慣了Linux的操作環境，而Mac和Linux操作起來相差不大，而用windows就會種種不習慣。

所以一開始的方案就是win10+ubuntu雙系統：

Ubuntu + win10/win11 雙系統方案

這也是大部分程式設計師的配置，開發當然必須是ubuntu了，windows娛樂，ubuntu工作。

這裡我先是在win10下安裝了ubuntu，之後在win10+ubuntu雙系統的前提下，將win10升級成了win11。整個升級過程很順滑，升級後沒有任何改動（引導沒有被破壞、ubuntu系統未被破壞）升級完重啟後，可以正常使用ubuntu，此時雙系統升級為win11+ubuntu。

而裝Ubuntu也是老生常談的話題了，基本都是：

下載好Ubuntu映象，拿個U盤製作U盤映象
Win10系統內劃分出一部分磁碟給Ubuntu使用
重啟bios設定啟動方式為U盤然後安裝

我安裝的是20.04版本的Ubuntu。

大概就是這麼個流程，網上的資料很多很多，隨便一搜就有了，有一點和之前安裝16.04不一樣，NVIDIA的驅動安裝比想象中要順利很多，四年前那會也在一個筆記本上裝Ubuntu吃了不少苦頭：ubuntu16.04下安裝NVIDIA（cuda）-gtx965m相關步驟以及問題，這次的NVIDIA驅動沒有很多坑，安裝正常邏輯安裝就行，也不需要禁用什麼什麼的。

進入新的Ubuntu系統，基本步驟大體也都一樣：

先切換源，注意源的版本一定和你的ubuntu版本一致（不一致會導致你的各種軟體不相容，也就是unmet會很多，這個我一開始沒有注意，折騰了很久），去找清華或者阿里源：

然後把/etc/apt中的source.list替換成國內源之後：

sudo apt-get update
sudo apt-get upgrade
sudo apt-get install build-essential

安裝Ubuntu的必要元件之後，接下來就是要升級核心（Ubuntu-20.04預設是5.10的核心）。至於為啥要升級核心，是因為我這個是幻13是比較新的筆記本，有些功能舊版的核心不支援（比如翻轉螢幕、比如鍵盤燈、指紋解鎖啥的），於是乎先升級核心。

升級核心有一些坑，我參照了ROG幻13安裝ubuntu20.04，解決各種驅動問題這篇文章，也確實幫了我大忙，大概就是，如果你從官方kernel中去下載更新，可能會因為官方kernel中的libc6版本不相容導致sudo apt-get update有時候會出錯，會報各種問題，需要下載合適版本的kernel才行。

對核心有疑問的可以看看這篇文章，總之升級核心需要謹慎一些，另外使用最新版本的Ubuntu系統，會自帶最新的核心。

接下來說說WSL2。

win11+wsl2+docker

WSL（Windows Subsystem for Linux）是我在調研win11相關資料時候看到的新名詞，之前只是聽說過，但沒有實際使用過，現在有windows跑Ubuntu的需求，突然想到可以試試看。

wsl的功能就是可以讓你在windows上使用linux系統。可以讓我這種習慣命令列的人在windows下開發也不難受。畢竟如果直接在ubuntu下開發，摸魚和聊天確實比較折騰，我還是想實現類似於macos上開發的效果，娛樂工作兩不誤，開發體驗也不割裂。

因為mac和nvidia水火不容，對於我這種搞深度學習極度依賴nvidia顯示卡的人來說用mac只能遠端連線伺服器來開發，在網路不好的情況下就比較難受了。

貌似WSL2也比VMware虛擬機器效能強一些（懂得小夥伴可以說下），也可以直接在windows中執行Ubuntu映象，然後vscode連線開發，效率直接翻倍，這點直接抓住了我的心。

目前wsl的最新版是wsl2，wsl和wsl2的區別挺大，男人的第六感讓我用新不用舊，於是選擇使用wsl2，其實還有一個原因是wsl2下的linux核心可以呼叫cuda。

首先升級win11，再裝一個WSL專用驅動510.06_gameready_win11_win10-dch_64bit_international，然後直接在win終端輸入：

wsl --set-default-version 2

此時就預設使用WSl2了。

如果著急看WSL2能不能用可以直接在WIN跑下這個：

docker run --gpus all nvcr.io/nvidia/k8s/cuda-sample:nbody nbody -gpu -benchmark               
---
result:
---
GPU Device 0: "Ampere" with compute capability 8.6

> Compute 8.6 CUDA device: [NVIDIA GeForce RTX 3050 Ti Laptop GPU]
20480 bodies, total time for 10 iterations: 40.139 ms
= 104.495 billion interactions per second
= 2089.903 single-precision GFLOP/s at 20 flops per interaction

輸出正常的話，就證明WSL-NVIDIA驅動和你的顯示卡都能正確檢測到。

安裝Ubuntu

接下來安裝Ubuntu試試，一般網上都是建議在Microsoft Store中搜尋安裝，不過如果直接在WIN11的商店中搜尋Ubuntu，會給你直接安裝到C盤，這點很煩，我也是一不小心就將Ubuntu映象搞到了C盤，無奈只能先刪掉，然後將WSL2中的docker繫結解綁，然後移到其他盤中（這裡我移動到了D盤）：

wsl --export docker-desktop-data D:\Docker\wsl\docker-desktop-data\docker-desktop-data.tar
wsl --unregister docker-desktop-data
wsl --import docker-desktop-data D:\Docker\wsl\docker-desktop-data\ D:\Docker\wsl\docker-desktop-data\docker-desktop-data.tar --version 2

docker映象地址移到其他盤後，就可以放開手搞映象了！

基於wsl2的docker映象

既然都是映象，為啥不直接找一個帶有cuda環境的映象呢，直接在docker官網或者NVIDIA-docker就可以搜到：nvidia/cuda:11.4.3-cudnn8-devel-ubuntu20.04，然後docker拉一下就行

於是，我在wsl2中登出掉了之前的Ubuntu映象，wsl --unregister Ubuntu，並且刪除之前的映象。然後docker pull nvidia/cuda:11.4.3-cudnn8-devel-ubuntu20.04拉取新的映象。

執行一下試試，執行docker run -it --gpus all 42a32a65aa9d /usr/bin/bash，注意要把--gpus all加上，不然會檢測不到顯示卡。

進入容器內部執行nvidia-smi：

root@304af4811a38:/# nvidia-smi
Sun Jan 30 10:37:28 2022
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 510.39.01    Driver Version: 511.23       CUDA Version: 11.6     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  NVIDIA GeForce ...  On   | 00000000:01:00.0 Off |                  N/A |
| N/A   51C    P8     8W /  N/A |      0MiB /  4096MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+

嗯，沒毛病。

測試CUDA

編譯https://github.com/NVIDIA/cuda-samples中的程式碼，然後跑個deviceQuery:

root@0b09ee5e9284:~/code/cuda-samples/bin/x86_64/linux/release# ./deviceQuery
./deviceQuery Starting...

 CUDA Device Query (Runtime API) version (CUDART static linking)

Detected 1 CUDA Capable device(s)

Device 0: "NVIDIA GeForce RTX 3050 Ti Laptop GPU"
  CUDA Driver Version / Runtime Version          11.6 / 11.4
  CUDA Capability Major/Minor version number:    8.6
  Total amount of global memory:                 4096 MBytes (4294443008 bytes)
  (020) Multiprocessors, (128) CUDA Cores/MP:    2560 CUDA Cores
  GPU Max Clock rate:                            1035 MHz (1.03 GHz)
  Memory Clock rate:                             5501 Mhz
  Memory Bus Width:                              128-bit
  L2 Cache Size:                                 2097152 bytes
  Maximum Texture Dimension Size (x,y,z)         1D=(131072), 2D=(131072, 65536), 3D=(16384, 16384, 16384)
  Maximum Layered 1D Texture Size, (num) layers  1D=(32768), 2048 layers
  Maximum Layered 2D Texture Size, (num) layers  2D=(32768, 32768), 2048 layers
  Total amount of constant memory:               65536 bytes
  Total amount of shared memory per block:       49152 bytes
  Total shared memory per multiprocessor:        102400 bytes
  Total number of registers available per block: 65536
  Warp size:                                     32
  Maximum number of threads per multiprocessor:  1536
  Maximum number of threads per block:           1024
  Max dimension size of a thread block (x,y,z): (1024, 1024, 64)
  Max dimension size of a grid size    (x,y,z): (2147483647, 65535, 65535)
  Maximum memory pitch:                          2147483647 bytes
  Texture alignment:                             512 bytes
  Concurrent copy and kernel execution:          Yes with 1 copy engine(s)
  Run time limit on kernels:                     Yes
  Integrated GPU sharing Host Memory:            No
  Support host page-locked memory mapping:       Yes
  Alignment requirement for Surfaces:            Yes
  Device has ECC support:                        Disabled
  Device supports Unified Addressing (UVA):      Yes
  Device supports Managed Memory:                Yes
  Device supports Compute Preemption:            Yes
  Supports Cooperative Kernel Launch:            Yes
  Supports MultiDevice Co-op Kernel Launch:      No
  Device PCI Domain ID / Bus ID / location ID:   0 / 1 / 0
  Compute Mode:
     < Default (multiple host threads can use ::cudaSetDevice() with device simultaneously) >

deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 11.6, CUDA Runtime Version = 11.4, NumDevs = 1
Result = PASS

可以正常檢測出卡，也可以正常執行。

再跑一個簡單的矩陣乘法：

root@0b09ee5e9284:~/code/cuda-samples/bin/x86_64/linux/release# ./matrixMul
[Matrix Multiply Using CUDA] - Starting...
GPU Device 0: "Ampere" with compute capability 8.6

MatrixA(320,320), MatrixB(640,320)
Computing result using CUDA Kernel...
done
Performance= 294.72 GFlop/s, Time= 0.445 msec, Size= 131072000 Ops, WorkgroupSize= 1024 threads/block
Checking computed result for correctness: Result = PASS

NOTE: The CUDA Samples are not meant for performance measurements. Results may vary when GPU Boost is enabled.

嗯，也沒毛病。

編譯tvm測試

簡單在WSL2下和在雙系統Ubuntu下進行編譯TVM測試，tvm版本用GITHUB上779dc51e1332f417fa4c304b595ce76891dfc33a這個commit進行測試，win端調整到rog的效能模式，Ubuntu系統沒有額外設定，cmake的設定相同，都使用ninja j8命令進行編譯。

WSL2和Ubuntu編譯TVM差30s，將近2%吧，相差不是很大。其實這個對比不是很標準哈，兩個系統的CPU最高頻率沒有統一，只是簡單測測吧~

搭配VSCODE

使用VSCODE開發已經是很稀鬆平常的事兒了，VSCODE有個remote-SSH外掛可以讓我們很方便地連線遠端伺服器進行開發，就和本地服務一樣。

同樣的，VSCODE中也有一個外掛直接可以連線WSL2下的docker，在windows下docekr run之後，就可以在win下的vscode中找到這個docker容器：

wsl2-docker容器

執行Attach Vscode之後就可以進入VSCODE的docker環境：

vscode的wsl2-docker環境

開發就和在Ubuntu下的VSCODE一模一樣，有root許可權，可以裝外掛，可以除錯程式碼，想幹啥就幹啥。

到目前為止WSL2在WIN11上的開發一切順利~

WIN11到底好不好用

剛拿到這個筆記本時是WIN10，也沒有升級WIN11的想法，不過因為在win10中使用WSL2比較麻煩，而WIN11自帶wsl2。於是乎就升級了一波WIN11。

整個升級過程比想象中順滑，在設定裡頭點點點就可以直接升級，下載更新、重啟一氣呵成，重啟後就是新系統了，之前的所有軟體都能用。

據說WIN11相比WIN10在CPU排程會差一點，打遊戲會比較影響。不過我感覺不出來，使用上比WIN10介面好看些，其他核心操作和WIN10相差不大，對於觸屏使用者更友好些。

令我比較驚喜的是WIN11自帶了類似MAC端付費應用Paste的核心功能，Win+V可以直接展示最近的剪下板隨便選擇貼上，圖片也是可以的。

WIN11自帶paste

遇到的問題

有一個比較坑的問題，本來win11+Ubuntu20.04雙系統用的好好的，突然有一天華碩讓升級bios（從407->408），當時沒有什麼想法就直接升級了。升級完直接傻眼，發現進不去ubuntu系統了，而win11系統沒啥問題。

以為是引導的問題，修改了半天grub引導，通過u盤ubuntu安裝器fix-boot後也不行，試了種種方式都進不去，差點就要重灌了。

最後偶然在reddit上查了下貌似是408版本不相容ubuntu-20.04，直接降級bios就好了。

相關問題連結：

https://www.reddit.com/r/FlowX13/comments/sskb3q/updating_bios_seems_to_have_broken_my_ubuntu/

華碩bios下載官網：

https://www.asus.com/supportonly/ROG Flow X13 GV301/HelpDesk_BIOS/!

使用lldb

用clang編譯後的檔案想要在VSCODE中debug，需要下一個codeLLDB，然後json中配置：

{
    "type": "lldb",
    "request": "launch",
    "name": "lldb launch",
    "program": "/path/to/a.out",
},

就可以了~

3080擴充塢

因為幻13可以通過專用的PCIE擴充口連線自己的擴充塢顯示卡，傳輸速率比雷電4要快不少，外接顯示卡幾乎可以無損。於是在日亞上淘了個3080的顯示卡塢，7300+800的稅，等了一個月終於到了。

幻13和顯示卡塢

首先這不是真正的桌面版RTX3080。這是rtx3070桌面版ga104核心的滿血版。多了一些cuda核心而已。因為功耗限制，實際上比桌面版3070還要慢，也就是略弱於桌面端3070。不過我買這個主要是看重其16G的視訊記憶體，真的很適合煉丹啊~

筆記本3080顯示卡

看大石頭的評測，這個3080顯示卡塢在和幻13極限雙烤開增強模式，GPU可以跑到150w溫度82度，CPU可以跑到45W溫度95度，說實話這溫度有點高，如果自己平時使用的話還是建議調低點，畢竟這玩意兒比較嬌貴。

3080顯示卡塢z

有一點肯定要清楚，這顯示卡的效能和功耗是成正比的，不管是桌面級、筆記本還是嵌入式的顯示卡，都是功耗越強效能越強。

另外，在WIN11端切換3080顯示卡之後，重啟成Ubuntu直接就識別為3080了，爽。

幻13完全體

桌面配置

藉著這次嘮叨，順便說下我們們不常見的螢幕掛燈，一開始想到用掛燈的場景是墨水屏，因為墨水屏不會發光，在白天還好，但是晚上就沒法用了，雖然可以使用檯燈照著，但是光不均勻或者說照不全，比如這樣：

僅靠檯燈照射的桌面環境

上面就是僅使用檯燈的樣子，上面的螢幕掛燈還沒有開，這樣辦公太難受了。

如果開了螢幕掛燈的話：

僅開螢幕燈的桌面環境

可以看到墨水屏被照亮了很多...另外桌面也照亮了，檯燈關了也無所謂，只有掛燈，看書沒有任何問題。

這個燈是明基的Screenbar Halo，話說都配這麼貴的墨水屏顯示器了，不差一個掛燈了，之前用的小米的，感覺亮度有點不夠，索性就配了個比較好的掛燈了。相比小米肯定高階很多哈，亮度提升了不少，最高亮度需要大電流的輸出才行（1A有點勉強，1.5A-2A差不多），之前的小米就不用（因為沒有那麼亮），我掛了個充電寶就沒任何問題了。

不過說實話貌似螢幕掛燈不是這麼用的，人家是為了給你個環境光，照亮桌面，可以看書又不佔地方，關鍵的是這個燈是非對稱的（我們也不懂），就是不會照到普通的螢幕上給你反光（普通的螢幕是會發光的，和我這個墨水屏還不一樣），但其實我是想讓這個掛燈照到我的螢幕上的（因為墨水屏不發光嘛），但是我正常使用掛燈（明基這個）就照不到螢幕，這個確實不錯，畢竟螢幕掛燈本應該不照螢幕以防反光。然後我只能強行調整一下掛燈的方向，讓它儘量照我的螢幕，感覺有點為難人家。

我也拿普通螢幕試了試：

平常情況下的螢幕掛燈

無論是上面的還是下面的螢幕都不反光，看的很清楚，簡直太棒了~看程式碼打遊戲啥的沒有任何問題，感覺普通螢幕，使用掛燈，讓周圍環境光充足起來，這樣眼睛就不會太容易疲勞了。

畢竟算是生產力了，螢幕掛燈用了就不會回去了。

這篇就講這麼多吧，下一篇就還是大家熟悉的技術文了~

參考資料

撩我吧

如果你與我志同道合於此，老潘很願意與你交流！
如果你喜歡老潘的內容，歡迎關注和支援~
如果有問題想要聯絡我，可加公眾號直接私信，點這裡！

Windows 終端環境配置筆記
2024-11-28
Windows筆記
筆記：環境 - Mac配置Host域名對映
2019-02-13
筆記Mac
Xamarin 學習筆記 - 配置環境(Windows & iOS)
2018-07-11
筆記WindowsiOS
Dubbo | Dubbo快速上手筆記 - 環境與配置
2021-09-02
筆記
環境專業，環境中高階工程師職稱
2022-02-23
工程師
PHP環境LAMP/LNMP安裝與配置筆記
2021-09-09
PHPLAMPLNMP筆記
前端工程（vue）多環境配置方案
2019-04-04
前端Vue
Webpack4 學習筆記八開發環境和生產環境配置
2019-01-25
Web筆記開發環境
tensorflow學習筆記1——mac開發環境配置
2019-02-16
筆記Mac開發環境
學習筆記-kali中配置python編寫環境
2020-12-23
筆記Python
atom for mac配置c/c++開發環境筆記
2020-12-06
MacC++開發環境筆記
XXPAY環境部署筆記
2020-01-23
筆記
記一次LNMP環境配置過程，以及Linux命令筆記
2020-11-04
LNMPLinux筆記
筆記, 配置阿里雲 Cumulo(ClojureScript) 臨時開發環境
2019-02-16
筆記阿里開發環境
MSP432安裝與環境配置(ccs) 學習筆記
2020-10-11
筆記
app自動化測試環境配置：adb環境配置、monkey環境配置、appium環境配置大全
2020-06-28
APP
java學習日記-java環境的配置
2019-04-09
Java
MacOS Monterey 配置 PHP 環境記錄
2022-06-28
MacPHP
GO語言學習筆記之mac環境go語言配置
2024-09-09
Go筆記Mac
架構師需要懂的環境配置標準化
2021-08-03
架構
Python筆記開發環境搭建
2018-10-24
Python筆記開發環境
Laravel 開發環境搭建-筆記
2018-08-27
Laravel開發環境筆記
webpack學習筆記(mac環境）
2018-05-16
Web筆記Mac
筆記一：前期 docker 環境搭建
2019-10-10
筆記Docker
學習筆記：MQTT環境搭建
2020-11-18
筆記MQQT
Android環境搭建學習筆記
2020-12-12
Android筆記
環境配置
2024-07-12
PyTorch深度學習入門筆記（一）PyTorch環境配置及安裝
2022-02-12
PyTorch深度學習筆記
部署ES + Kibana 到生產環境的筆記
2019-02-12
筆記
配置開發環境、生成環境、測試環境
2024-06-01
開發環境
Linux筆記01：概述以及環境搭建
2020-09-25
Linux筆記
《Kafka筆記》2、環境搭建、Topic管理
2020-10-19
Kafka筆記
Java開發環境安裝筆記
2024-08-11
Java開發環境筆記
ApacheCordovaforios環境配置
2018-05-07
ApacheiOS
Linux環境配置
2018-06-30
Linux
vue – 環境配置
2018-06-04
Vue
JAV A環境配置
2023-05-18
Flutter環境配置
2020-01-30
Flutter