恆源雲(Gpushare)_JupyterLab/TensorBoard使用問題?技巧大放送4!

恆源雲發表於2022-04-02

文章來源 | 恆源雲社群

原文地址 | 【小技巧-工具篇】


1、JupyterLab/TensorBoard 如何使用?

可參考JupyterLab文件、TensorBoard文件。

2、JupyterLab打不開或者響應慢怎麼辦?

如果遇到JupyterLab頁面響應特別緩慢或者打不開的情況,可登入例項後通過以下命令來重啟JupyterLab

supervisorctl restart jupyterlab

不建議通過JupyterLab頁面直接執行較消耗資源的程式,因為該程式很可能會導致JupyterLab無響應或者執行緩慢問題,可通過tmux工具放置在例項後臺執行。

3、tensorboard打不開或者響應慢怎麼辦?

如果遇到tensorboard頁面響應特別緩慢或者打不開的情況,可登入例項後通過以下命令來重啟tensorboard

supervisorctl restart tensorboard

4、自定義映象如何安裝jupyterlab?

自定義映象登入例項後,執行如下命令,即可完成安裝jupyterlab,安裝完成後,可通過控制檯開啟jupyterlab頁面

curl -OL "https://download.gpushare.com/download/custom_install"
chmod u+x ./custom_install
./custom_install jupyterlab

5、自定義映象如何安裝tensorboard?

自定義映象登入例項後,執行如下命令,即可完成安裝tensorboard,安裝完成後,可通過控制檯開啟tensorboard頁面

curl -OL "https://download.gpushare.com/download/custom_install"
chmod u+x ./custom_install
./custom_install tensorboard

6、JupyterLab 要輸入密碼怎麼辦?

通過終端執行 jupyter server list 命令可以得到 JupyterLab 的登陸 Token。

如下可以從執行結果內獲得 Token 為 3fq593blw4afqjtqgdp3ldk5。

root@I15b96311d0280127d:~# jupyter server list
Currently running servers:
http://0.0.0.0:8888/?token=3fq593blw4afqjtqgdp3ldk5 :: /

7、TensorFlow 訓練報 ptxas fatal 錯誤

當在 RTX 3000 系列顯示卡上使用 TensorFlow 2.4 For CUDA 11.0 時,訓練會出現下列警告。

W tensorflow/stream_executor/gpu/asm_compiler.cc:235] Your CUDA software stack is old. We fallback to the NVIDIA driver for some compilation. Update your CUDA version to get the best performance. The ptxas error was: ptxas fatal : Value 'sm_86' is not defined for option 'gpu-name'

原因是該版本的 PTX compiler 不支援 8.6 compute capability。此報錯為警告,不影響正常訓練。

該警告可以通過 os.environ[‘TF_CPP_MIN_LOG_LEVEL’] = “2” 關閉。

此問題雖然不影響訓練但效能上會降低,推薦建立 TensorFlow 2.5 For CUDA 11.2 的映象,不會存在此問題。

相關文章