使用VSCode設定Python作為資料科學開發的10個步驟 - Gong Na

banq發表於2020-06-21

當我開始第一個專業資料科學專案時,使用了許多工具:用於模型訓練的Jupyter Notebook,用於結構化Python指令碼的PyCharm(免費社群版本),用於python軟體包管理的Anaconda Prompt,用於遠端SSH連線的MobaXterm,用於原始資料的Excel評論等等。每天,我總是在不同的窗戶之間跳來跳去。

幸運的是,我找到了一個支援上述所有功能的工具,最重要的是,它是免費的:VSCode。

如果您遇到與上述相同的問題,或者您是 資料科學領域的初學者,則本指南可以幫助您建立自己的有效資料科學工作區並有一個良好的起點。

完成10個設定步驟後,在VSCode的單個視窗中,您將能夠:

  • 可使用Anaconda
  • 可編寫結構化且可讀的python指令碼
  • 可使用Jupyter Notebook
  • 管理python軟體包和conda虛擬環境
  • 通過具有非常友好的使用者介面的SSH在遠端伺服器(例如GPU節點)上工作
  • 檢視和編輯不同型別的檔案(例如.txt,.csv,.xlsx,.png,.md,.yml,Dockerfile…)
  • 使用Git版本控制
  • 對將來的專案擴充套件保持靈活性,例如新增基於Docker的部署

十個步驟:

步驟1:安裝Anaconda 

步驟2:(可選)在Anaconda提示符下建立Virtualenv 

步驟3:開啟VSCode 

步驟4:從VSCode開啟專案資料夾

步驟5:在VSCode中安裝Python擴充套件

步驟6:在VSCode中啟用Virtualenv 

步驟7:為“ conda”和“ python”配置VSCode終端

步驟8:在VSCode中啟用Jupyter Notebook 

步驟9:通過SSH從VSCode連線到遠端伺服器

步驟10:在VSCode中進行Git推送

步驟1:安裝Anaconda

安裝最新版本在這裡,如果你要使用VSCode整合終端,我強烈建議你安裝的版本≥4.6。成功安裝後,您還安裝了Jupyter Notebook,Python和一些常用的python軟體包,以用於資料科學。現在,您可以在開始選單中找到Anaconda Navigator,Anaconda提示,Jupyter Notebook圖示。

步驟2 :(可選)在Anaconda Prompt中建立虛擬環境

為了避免不同專案之間的相互干擾,最好在隔離的虛擬環境中進行開發。如果您真的想在預設環境中進行開發,則base可以跳過此步驟。

步驟3:開啟VSCode

選項1:開啟Anaconda Navigator>從主頁啟動VSCode。

選項2:您也可以從網站安裝VSCode 。這樣,您可以獲得快捷方式,然後從桌面或工作列快速啟動VSCode。根據我的經驗,這種方法比方法1更快。

步驟4:從VSCode開啟專案資料夾

在您喜歡的任何位置建立一個新的專案資料夾作為您的根目錄。開啟VSCode>單擊左上角的檔案 >單擊開啟資料夾 >單擊目標資料夾名稱。現在,您可以將所有專案檔案和指令碼放在此處。

步驟5:在VSCode中安裝Python擴充套件

VSCode是支援多種語言的原始碼編輯器。為了啟用Python,我們需要安裝Python擴充套件。

單擊左側欄中的擴充套件圖示>搜尋Python >單擊安裝。現在,您可以簡單地使用.py副檔名建立標準的python指令碼。

步驟6:在VSCode中啟用Python環境

在VSCode中,按ctrl+shift+p,一個命令皮膚將在頂部中間彈出。單擊Python:選擇“直譯器Interpreter ”>,只需輸入Python的安裝路徑:如C:\install\Python\Python38-32\python.exe,如果安裝了Anaconda,可從其目錄中選擇:

python Interpreter將顯示在狀態列的左下方。

步驟7:將VSCode終端配置為“ conda”和“ python”

通過單擊選單欄的“終端”或快捷方式ctrl+shift+`,終端將在下方打​​開。

如果您想像我一樣在Windows上使用Linux命令,那麼Powershell是您的理想選擇。(conda很難啟用,可點選標題見原文)

步驟8:在VSCode中啟用Jupyter Notebook

需要將Python的Scripts目錄加入windows的環境變數path中,在cmd下執行:

pip install jupyter 
#或conda 
install -c conda-forge jupyter

建立新的jupyter筆記本檔案:按下ctrl+shif+p>搜尋“ Create New Blank Jupyter Notebook” >單擊它> .ipynb使用untitled名稱儲存建立的檔案。

幾秒鐘後,右上方的Jupyter Server將自動設定為local.

其餘兩個步驟比較通用,可點選標題見原文,下面附加遠端連線開發:

設定VS通過SSH從Windows到Linux系統進行遠端開發

為什麼我們需要遠端開發:

  • 對於軟體開發人員,他們通常在本地開發新功能,然後在遠端伺服器上進行測試。
  • 對於資料科學家而言,他們需要額外的計算資源(例如遠端GPU節點)來支援大資料處理。
  • 對於DevOps工程師來說,他們的主要任務之一是在不同的伺服器上部署不同的產品,這需要頻繁的遠端配置。

先決條件:

在本地Windows和遠端Linux系統上都安裝了OpenSSH。在這裡為Windows安裝和這裡的Linux版本。

  • 步驟1:在VS Code中安裝Remote-SSH擴充套件:啟動VS Code->單擊左側欄中的擴充套件圖示-> 在搜尋框中搜尋Remote-SSH- >安裝,左下方狀態列最前面看到一個小的遠端連線圖示
  • 步驟2:在PowerShell中驗證SSH連線:在PowerShell中執行ssh username@hostname來驗證SSH連線。
  • 步驟3:在VS Code中啟用遠端連線:單擊左下角的遠端連線圖示->選擇“ 遠端SSH:開啟配置檔案…”。
  • 步驟4:生成SSH金鑰對:在VS Code Powershell終端中,執行以ssh-keygen命令,您的金鑰對儲存在預設的隱藏~/.ssh目錄中
  • 步驟5:將公鑰複製到遠端伺服器:通過VS Code或任何其他帶有密碼的終端登入到遠端伺服器。檢查authorized_keys檔案是否在~/.ssh目錄下。

 

相關文章