Python資料分析入門(一):搭建環境

松鼠愛出餅乾發表於2021-03-29

Python版本:

本課程用到的Python版本都是3.x。要有一定的Python基礎,知道列表、字串、函式等的用法。

Anaconda:

Anaconda(水蟒)是一個捆綁了Python、conda、其他相關依賴包的一個軟體。包含了180多個可學計算包及其依賴。Anaconda3是整合了Python3的環境,Anaconda2是整合了Python2的環境。Anaconda預設整合的包,是屬於內建的Python的包。並且支援絕大部分作業系統(比如:Windows、Mac、Linux等)。下載地址如下:https://www.anaconda.com/distribution/(如果官網下載太慢,可以在清華大學開源軟體站中下載:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/)。根據自己的作業系統,下載相應的版本,因為Anaconda內建了許多的包,所以安裝過程需要耗費相當長的時間,大家在安裝的時候需要耐心等待。在安裝完成後,會有以下幾個模組:Anaconda prompt、Anaconda Navigator、Spyder、jupyter notebook,以下分別做一些介紹。

Anaconda prompt:

Anaconda prompt是專門用來操作anaconda的終端。如果你安裝完Anaconda後沒有在環境變數的PATH中新增相關的環境變數,那麼以後你想在終端使用anaconda相關的命令,則必須要在Anaconda prompt中完成。

Python資料分析入門第一課,教你如何搭建環境

 

Anaconda Navigator:

這個相當於是一個導航皮膚,上面組織了Anaconda相關的軟體。

Spyder:

一個專門開發Python的軟體,熟悉MATLAB的同學會比較有親切感,但在後期的學習過程中,我們將不會使用這個工具寫程式碼,因為還有更好的可替代的工具。

Python資料分析入門第一課,教你如何搭建環境

 

jupyter notebook:

一個Python編輯環境,可以實時的檢視程式碼的執行效果。

Python資料分析入門第一課,教你如何搭建環境

 

使用jupyter notebook的姿勢:

  1. 先開啟Anaconda Prompt,然後進入到專案所在的目錄。
  2. 輸入命令jupyter notebook開啟jupyter notebook瀏覽器。

conda基本使用:

conda伴隨著Anaconda安裝而自動安裝的。conda可以跟virtualenv一樣管理不同的環境,也可以跟pip一樣管理某個環境下的包。以下來看看兩個功能的用法。

環境管理:

conda能跟virtualenv一樣管理不同的Python環境,不同的環境之間是互相隔離,互不影響的。為什麼需要建立不同的環境呢?原因是有時候專案比較多,但是專案依賴的包不一樣,比如A專案用的是Python2開發的,而B專案用的是Python3開發的,那麼我們在同一臺電腦上就需要兩套不同的環境來支撐他們執行了。建立環境的基本命令如下:

shell
# conda create --name [環境名稱] 比如以下:
conda create --name da-env

 

這樣將建立一個叫做da-env的環境,這個環境的python直譯器根據anaconda來,如果anaconda為3.7,那麼將預設使用3.7的環境,如果anaconda內建的是2.7,那麼將預設使用2.7的環境。然後你就可以使用conda install numpy的方式來安裝包了,並且這樣安裝進來的包,只會安裝在當前環境中。有的同學可能有想問,如果想要裝一個Python2.7的環境,anaconda中沒有內建Python2.7,那麼該怎麼實現呢?。實際上,我們只需要在安裝的時候指定python的版本,如果這個版本現在不存在,那麼anaconda會自動的給我們下載。所以安裝Python2.7的環境,使用以下程式碼即可實現:

conda create --name xxx python=2.7

 

以下再列出conda管理環境的其他命令:

建立的時候指定需要安裝的包:

 conda create --name xxx numpy pandas

 

建立的時候既需要指定包,也需要指定python環境:

 conda create --name xxx python=3.6 numpy pandas

 

進入到某個環境

 windows: activate xxx mac/linux: source activate xxx

 

退出環境:

 deactivate

 

列出當前所有的環境:

 conda env list

 

移除某個環境:

 conda remove --name xxx --all

 

環境下的包匯出和匯入:

匯出:conda env export > environment.yml。

匯入:conda env create --name xxx -f environment.yml。

包管理:

conda也可以用來管理包。比如我們建立完一個新的環境後,想要在這個環境中安裝包(比如numpy),那麼可以通過以下程式碼來實現:

python
activate xxx
conda install numpy

 

以下再介紹一些包管理常用的命令:

在不進入某個環境下直接給這個環境安裝包:

conda install [包名] -n [環境名]

 

列出該環境下所有的包:

 conda list

 

解除安裝某個包:

 conda remove [包名]

 

設定安裝包的源:

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ 
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/ 
conda config --set show_channel_urls yes

 

相關文章