文章來源 | 恆源雲社群
原文地址 | 【小技巧-工具篇】
1、JupyterLab/TensorBoard 如何使用?
可參考JupyterLab文件、TensorBoard文件。
2、JupyterLab打不開或者響應慢怎麼辦?
如果遇到JupyterLab頁面響應特別緩慢或者打不開的情況,可登入例項後通過以下命令來重啟JupyterLab
supervisorctl restart jupyterlab
不建議通過JupyterLab頁面直接執行較消耗資源的程式,因為該程式很可能會導致JupyterLab無響應或者執行緩慢問題,可通過tmux工具放置在例項後臺執行。
3、tensorboard打不開或者響應慢怎麼辦?
如果遇到tensorboard頁面響應特別緩慢或者打不開的情況,可登入例項後通過以下命令來重啟tensorboard
supervisorctl restart tensorboard
4、自定義映象如何安裝jupyterlab?
自定義映象登入例項後,執行如下命令,即可完成安裝jupyterlab,安裝完成後,可通過控制檯開啟jupyterlab頁面
curl -OL "https://download.gpushare.com/download/custom_install"
chmod u+x ./custom_install
./custom_install jupyterlab
5、自定義映象如何安裝tensorboard?
自定義映象登入例項後,執行如下命令,即可完成安裝tensorboard,安裝完成後,可通過控制檯開啟tensorboard頁面
curl -OL "https://download.gpushare.com/download/custom_install"
chmod u+x ./custom_install
./custom_install tensorboard
6、JupyterLab 要輸入密碼怎麼辦?
通過終端執行 jupyter server list 命令可以得到 JupyterLab 的登陸 Token。
如下可以從執行結果內獲得 Token 為 3fq593blw4afqjtqgdp3ldk5。
root@I15b96311d0280127d:~# jupyter server list
Currently running servers:
http://0.0.0.0:8888/?token=3fq593blw4afqjtqgdp3ldk5 :: /
7、TensorFlow 訓練報 ptxas fatal 錯誤
當在 RTX 3000 系列顯示卡上使用 TensorFlow 2.4 For CUDA 11.0 時,訓練會出現下列警告。
W tensorflow/stream_executor/gpu/asm_compiler.cc:235] Your CUDA software stack is old. We fallback to the NVIDIA driver for some compilation. Update your CUDA version to get the best performance. The ptxas error was: ptxas fatal : Value 'sm_86' is not defined for option 'gpu-name'
原因是該版本的 PTX compiler 不支援 8.6 compute capability。此報錯為警告,不影響正常訓練。
該警告可以通過 os.environ[‘TF_CPP_MIN_LOG_LEVEL’] = “2” 關閉。
此問題雖然不影響訓練但效能上會降低,推薦建立 TensorFlow 2.5 For CUDA 11.2 的映象,不會存在此問題。