Anaconda使用總結

發表於2016-08-31

Python易用,但用好卻不易,其中比較頭疼的就是包管理和Python不同版本的問題,特別是當你使用Windows的時候。為了解決這些問題,有不少發行版的Python,比如WinPython、Anaconda等,這些發行版將python和許多常用的package打包,方便pythoners直接使用,此外,還有virtualenv、pyenv等工具管理虛擬環境。

個人嘗試了很多類似的發行版,最終選擇了Anaconda,因為其強大而方便的包管理與環境管理的功能。該文主要介紹下Anaconda,對Anaconda的理解,並簡要總結下相關的操作。

Anaconda概述

Anaconda是一個用於科學計算的Python發行版,支援 Linux, Mac, Windows系統,提供了包管理與環境管理的功能,可以很方便地解決多版本python並存、切換以及各種第三方包安裝問題。Anaconda利用工具/命令conda來進行package和environment的管理,並且已經包含了Python和相關的配套工具。

這裡先解釋下conda、anaconda這些概念的差別。conda可以理解為一個工具,也是一個可執行命令,其核心功能是包管理環境管理。包管理與pip的使用類似,環境管理則允許使用者方便地安裝不同版本的python並可以快速切換。Anaconda則是一個打包的集合,裡面預裝好了conda、某個版本的python、眾多packages、科學計算工具等等,所以也稱為Python的一種發行版。其實還有Miniconda,顧名思義,它只包含最基本的內容——python與conda,以及相關的必須依賴項,對於空間要求嚴格的使用者,Miniconda是一種選擇。

進入下文之前,說明一下conda的設計理念——conda將幾乎所有的工具、第三方包都當做package對待,甚至包括python和conda自身!因此,conda打破了包管理與環境管理的約束,能非常方便地安裝各種版本python、各種package並方便地切換。

Anaconda的安裝

Anaconda的下載頁參見官網下載,Linux、Mac、Windows均支援。

安裝時,會發現有兩個不同版本的Anaconda,分別對應Python 2.7和Python 3.5,兩個版本其實除了這點區別外其他都一樣。後面我們會看到,安裝哪個版本並不本質,因為通過環境管理,我們可以很方便地切換執行時的Python版本。(由於我常用的Python是2.7和3.4,因此傾向於直接安裝Python 2.7對應的Anaconda)

下載後直接按照說明安裝即可。這裡想提醒一點:儘量按照Anaconda預設的行為安裝——不使用root許可權,僅為個人安裝,安裝目錄設定在個人主目錄下(Windows就無所謂了)。這樣的好處是,同一臺機器上的不同使用者完全可以安裝、配置自己的Anaconda,不會互相影響。

對於Mac、Linux系統,Anaconda安裝好後,實際上就是在主目錄下多了個資料夾(~/anaconda)而已,Windows會寫入登錄檔。安裝時,安裝程式會把bin目錄加入PATH(Linux/Mac寫入~/.bashrc,Windows新增到系統變數PATH),這些操作也完全可以自己完成。以Linux/Mac為例,安裝完成後設定PATH的操作是

配置好PATH後,可以通過which condaconda --version命令檢查是否正確。假如安裝的是Python 2.7對應的版本,執行python --versionpython -V可以得到Python 2.7.12 :: Anaconda 4.1.1 (64-bit),也說明該發行版預設的環境是Python 2.7。

Conda的環境管理

Conda的環境管理功能允許我們同時安裝若干不同版本的Python,並能自由切換。對於上述安裝過程,假設我們採用的是Python 2.7對應的安裝包,那麼Python 2.7就是預設的環境(預設名字是root,注意這個root不是超級管理員的意思)。

假設我們需要安裝Python 3.4,此時,我們需要做的操作如下:

使用者安裝的不同python環境都會被放在目錄~/anaconda/envs下,可以在命令中執行conda info -e檢視已安裝的環境,當前被啟用的環境會顯示有一個星號或者括號。

說明:有些使用者可能經常使用python 3.4環境,因此直接把~/anaconda/envs/python34下面的bin或者Scripts加入PATH,去除anaconda對應的那個bin目錄。這個辦法,怎麼說呢,也是可以的,但總覺得不是那麼elegant……

如果直接按上面說的這麼改PATH,你會發現conda命令又找不到了(當然找不到啦,因為conda在~/anaconda/bin裡呢),這時候怎麼辦呢?方法有二:1. 顯式地給出conda的絕對地址 2. 在python34環境中也安裝conda工具(推薦)。

Conda的包管理

Conda的包管理就比較好理解了,這部分功能與pip類似。

例如,如果需要安裝scipy:

conda的一些常用操作如下:

前面已經提到,conda將conda、python等都視為package,因此,完全可以使用conda來管理conda和python的版本,例如

補充:如果建立新的python環境,比如3.4,執行conda create -n python34 python=3.4之後,conda僅安裝python 3.4相關的必須項,如python, pip等,如果希望該環境像預設環境那樣,安裝anaconda集合包,只需要:

設定國內映象

如果需要安裝很多packages,你會發現conda下載的速度經常很慢,因為Anaconda.org的伺服器在國外。所幸的是,清華TUNA映象源有Anaconda倉庫的映象,我們將其加入conda的配置即可:

執行完上述命令後,會生成~/.condarc(Linux/Mac)或C:UsersUSER_NAME.condarc檔案,記錄著我們對conda的配置,直接手動建立、編輯該檔案是相同的效果。

Anaconda具有跨平臺、包管理、環境管理的特點,因此很適合快速在新的機器上部署Python環境。總結而言,整套安裝、配置流程如下:

  • 下載Anaconda、安裝
  • 配置PATH(bashrc或環境變數),更改TUNA映象源
  • 建立所需的不用版本的python環境
  • Just Try!

cheat-sheet 下載:
Conda cheat sheet


參考資料