0038-如何在CDH叢集安裝Anaconda&搭建Python私有源
溫馨提示:要看高清無碼套圖,請使用手機開啟並單擊圖片放大檢視。
1.文件編寫目的
Anaconda是一個用於科學計算的Python發行版,支援 Linux, Mac, Windows系統,提供了包管理與環境管理的功能,可以很方便地解決多版本python並存、切換以及各種第三方包安裝問題。
在企業叢集無外網環境下,通過搭建企業私有的Python源,可以使用pip工具方便的安裝,以解決Anaconda環境中沒有的依賴包的問題。
本文件講述如何在CDH叢集離線安裝Anaconda、搭建Python私有源及pip工具使用。
- 內容概述
1.如何在CDH叢集上安裝Anaconda
2.如何搭建python私有源
3.pip工具的使用
- 測試環境
1.作業系統:CentOS6.5
2.CM和CDH版本為5.12.1
3.採用root使用者操作
- 前置條件
1.CDH叢集執行正常
2.Apache服務正常執行
2.CDH叢集安裝Anaconda
使用Parcel包的方式在CDH叢集安裝Anaconda,下載地址:
https://repo.continuum.io/pkgs/misc/parcels/
根據自己作業系統版本選擇Parcel包,本文件是在CentOS6.5版本下操作
2.1部署Anaconda的Parcel包http訪問
1.下載Anaconda的Parcel包,下載地址如下
https://repo.continuum.io/pkgs/misc/parcels/Anaconda-4.2.0-el6.parcel
https://repo.continuum.io/pkgs/misc/parcels/Anaconda-4.2.0-el6.parcel.sha
https://repo.continuum.io/pkgs/misc/parcels/manifest.json
2.將上述3個檔案下載至HTTP所在伺服器的/var/www/html/anaconda4.2.0目錄下
[root@ip-172-31-6-148 html]# mkdir -p anaconda4.2.0/
[root@ip-172-31-6-148 html]# cd anaconda4.2.0/
[root@ip-172-31-6-148 anaconda4.2.0]# ll
total 541416
-rw-r--r-- 1 root root 554396033 Jun 19 17:47 Anaconda-4.2.0-el6.parcel
-rw-r--r-- 1 root root 41 Jul 7 19:43 Anaconda-4.2.0-el6.parcel.sha
-rw-r--r-- 1 root root 3890 Jul 7 19:43 manifest.json
[root@ip-172-31-6-148 anaconda4.2.0]#
3.驗證http是否正常訪問
2.2安裝Anaconda
1.配置Anaconda的parcels包訪問地址
2.點選下載、分配並啟用
2.3配置Anaconda環境變數
Anaconda預設安裝在/opt/cloudera/parcels/Anaconda目錄,在叢集所有節點配置Anaconda的環境變數,操作如下:
- 使用root使用者或有sudo許可權使用者編輯/etc/profile檔案,在檔案末尾增加如下配置
export ANACONDA_HOME=/opt/cloudera/parcels/Anaconda
export PATH=$ANACONDA_HOME/bin:$PATH
2.執行source命令,使環境變數立即生效
[root@ip-172-31-6-148 anaconda4.2.0]# source /etc/profile
3.驗證環境變數是否配置成功
[root@ip-172-31-6-148 anaconda4.2.0]# python
Python 2.7.12 |Anaconda 4.2.0 (64-bit)| (default, Jul 2 2016, 17:42:40)
[GCC 4.4.7 20120313 (Red Hat 4.4.7-1)] on linux2
Type "help", "copyright", "credits" or "license" for more information.
Anaconda is brought to you by Continuum Analytics.
Please check out: http://continuum.io/thanks and https://anaconda.org
>>>
3.搭建Pyton私有源
- 前置準備:
1.下載pip2pi安裝包,下載地址:
https://codeload.github.com/wolever/pip2pi/zip/master
2.下載Python原始碼依賴包(tar.gz/zip/whl等格式安裝包)
3.1安裝pip2pi工具
- 將下載的pip2pi原始碼包上傳至伺服器,並解壓
[root@ip-172-31-6-148 ~]# unzip master
2.使用Python命令安裝pip2pi
[root@ip-172-31-6-148 python]# cd pip2pi-master/
[root@ip-172-31-6-148 pip2pi-master]# ll
total 44
-rw-r--r-- 1 root root 2797 Mar 19 15:51 CHANGELOG.txt
drwxr-xr-x 2 root root 4096 Mar 19 15:51 libpip2pi
-rw-r--r-- 1 root root 1649 Mar 19 15:51 LICENSE.txt
-rw-r--r-- 1 root root 19 Mar 19 15:51 MANIFEST.in
-rw-r--r-- 1 root root 5080 Mar 19 15:51 README.rst
-rwxr-xr-x 1 root root 84 Mar 19 15:51 run-tests
-rw-r--r-- 1 root root 20 Mar 19 15:51 setup.cfg
-rw-r--r-- 1 root root 1422 Mar 19 15:51 setup.py
drwxr-xr-x 5 root root 4096 Mar 19 15:51 tests
-rw-r--r-- 1 root root 194 Mar 19 15:51 tox.ini
[root@ip-172-31-6-148 pip2pi-master]# python setup.py install
3.測試pip2pi和dir2pi命令是否安裝成功
3.2部署依賴包
- 在http伺服器的/var/www/html目錄下新建python-packages目錄
[root@ip-172-31-6-148 html]# mkdir python-packages
[root@ip-172-31-6-148 html]# pwd
/var/www/html
[root@ip-172-31-6-148 html]# ll
total 32
drwxr-xr-x 2 root root 4096 Sep 11 15:52 python-packages
[root@ip-172-31-6-148 html]#
2.將本地下載的Python依賴包上傳至伺服器的/var/www/html/python-packages目錄
[root@ip-172-31-6-148 python-packages]# ll
total 1780
-rw-r--r-- 1 root root 2421 Sep 24 2016 bit_array-0.1.0.tar.gz
-rw-r--r-- 1 root root 1254 Sep 12 07:18 enum-compat-0.0.2.tar.gz
-rw-r--r-- 1 root root 339017 Sep 12 07:27 pymongo-3.3.0-cp27-cp27mu-manylinux1_x86_64.whl
-rw-r--r-- 1 root root 368294 Sep 12 07:25 pymongo-3.5.1-cp27-cp27mu-manylinux1_x86_64.whl
-rw-r--r-- 1 root root 799601 Sep 12 07:04 Routes-1.12.3.tar.gz
-rw-r--r-- 1 root root 30409 Apr 23 2016 sasl-0.2.1.tar.gz
-rw-r--r-- 1 root root 29630 Apr 21 2016 six-1.10.0.tar.gz
-rw-r--r-- 1 root root 87832 Jan 14 2017 thrift-0.10.0.zip
-rw-r--r-- 1 root root 3885 Jun 9 2016 thrift_sasl-0.2.1.tar.gz
-rw-r--r-- 1 root root 140861 Dec 3 2016 ym-impyla-0.14.0.tar.gz
3.使用dir2pi命令建立包索引
[root@ip-172-31-6-148 python-packages]# dir2pi /var/www/html/python-packages/
[root@ip-172-31-6-148 python-packages]# ll
total 1784
-rw-r--r-- 1 root root 2421 Sep 24 2016 bit_array-0.1.0.tar.gz
-rw-r--r-- 1 root root 1254 Sep 12 07:18 enum-compat-0.0.2.tar.gz
-rw-r--r-- 1 root root 339017 Sep 12 07:27 pymongo-3.3.0-cp27-cp27mu-manylinux1_x86_64.whl
-rw-r--r-- 1 root root 368294 Sep 12 07:25 pymongo-3.5.1-cp27-cp27mu-manylinux1_x86_64.whl
-rw-r--r-- 1 root root 799601 Sep 12 07:04 Routes-1.12.3.tar.gz
-rw-r--r-- 1 root root 30409 Apr 23 2016 sasl-0.2.1.tar.gz
drwxr-xr-x 11 root root 4096 Sep 12 08:06 simple
-rw-r--r-- 1 root root 29630 Apr 21 2016 six-1.10.0.tar.gz
-rw-r--r-- 1 root root 87832 Jan 14 2017 thrift-0.10.0.zip
-rw-r--r-- 1 root root 3885 Jun 9 2016 thrift_sasl-0.2.1.tar.gz
-rw-r--r-- 1 root root 140861 Dec 3 2016 ym-impyla-0.14.0.tar.gz
[root@ip-172-31-6-148 python-packages]#
4.驗證Http是否正常訪問,訪問地址
http://ip-172-31-6-148.fayson.com/python-packages/simple/
至此Python的私有源伺服器搭建完成。
3.3配置pip命令使用私有源
1.在當前使用者的home目錄(即“~”)目錄,建立.pip目錄
[root@ip-172-31-6-148 ~]# mkdir -p .pip
[root@ip-172-31-6-148 ~]# pwd
/root
[root@ip-172-31-6-148 ~]#
2.在~/.pip目錄下新建pip.conf檔案,檔案內容如下
[root@ip-172-31-6-148 ~]# cd .pip/
[root@ip-172-31-6-148 .pip]# pwd
/root/.pip
[root@ip-172-31-6-148 .pip]# vim pip.conf
[global]
index-url = http://ip-172-31-6-148.fayson.com/python-packages/simple
[install]
trusted-host = ip-172-31-6-148.fayson.com
3.測試pip命令是否從私有源下載依賴包
[root@ip-172-31-6-148 .pip]# pip install bit-array
Collecting bit-array
Downloading http://ip-172-31-6-148.fayson.com/python-packages/simple/bit-array/bit-array-0.1.0.tar.gz
Building wheels for collected packages: bit-array
Running setup.py bdist_wheel for bit-array ... done
Stored in directory: /root/.cache/pip/wheels/7a/7f/04/3bdc776730b06ce5bedd46f9023d263a32f82941e1365a054f
Successfully built bit-array
Installing collected packages: bit-array
Successfully installed bit-array-0.1.0
[root@ip-172-31-6-148 .pip]#
可以看到上圖示註部分顯示從剛搭建好的源下載依賴包。
4.pip使用
1.指定版本安裝package
[root@ip-172-31-6-148 ~] pip install SomePackage # 最新版本
[root@ip-172-31-6-148 ~] pip install SomePackage==1.0.4 # 具體的版本
[root@ip-172-31-6-148 ~] pip install `SomePackage>=1.0.4` # 最低版本
2.批量安裝packages
建立文字檔案requirements.txt,內容如下
[root@ip-172-31-6-148 ~]# vim requirements.txt
six
bit_array
thrift==0.10.0
使用pip批量安裝
[root@ip-172-31-6-148 ~]# pip install -r requirements.txt
Collecting six (from -r requirements.txt (line 1))
Collecting bit_array (from -r requirements.txt (line 2))
Collecting thrift==0.10.0 (from -r requirements.txt (line 3))
Downloading http://ip-172-31-6-148.fayson.com/python-packages/simple/thrift/thrift-0.10.0.zip (87kB)
100% |████████████████████████████████| 92kB 58.1MB/s
Building wheels for collected packages: thrift
Running setup.py bdist_wheel for thrift ... done
Stored in directory: /root/.cache/pip/wheels/21/53/2d/121a953df877103ba4f2fe9041be0d28d6979438c6dd7b2b15
Successfully built thrift
Installing collected packages: six, bit-array, thrift
Successfully installed bit-array-0.1.0 six-1.10.0 thrift-0.10.0
[root@ip-172-31-6-148 ~]#
3.輸出當前python環境安裝的所有package及版本到指定檔案
[root@ip-172-31-6-148 ~]# pip freeze > requirements.txt
4.解除安裝package
[root@ip-172-31-6-148 ~]# pip uninstall six
5.列出當前Python環境安裝的所有package
[root@ip-172-31-6-148 ~]# pip list --format=columns
Package Version
---------------------------------- -----------------------
alabaster 0.7.9
anaconda-clean 1.0
anaconda-client 1.5.1
anaconda-navigator 1.3.1
argcomplete 1.0.0
astroid 1.4.7
astropy 1.2.1
Babel 2.3.4
backports-abc 0.4
6.檢視安裝的package詳細資訊
[root@ip-172-31-6-148 ~]# pip show six
Name: six
Version: 1.10.0
Summary: Python 2 and 3 compatibility utilities
Home-page: http://pypi.python.org/pypi/six/
Author: Benjamin Peterson
Author-email: benjamin@python.org
License: MIT
Location: /opt/cloudera/parcels/Anaconda-4.2.0/lib/python2.7/site-packages
Requires:
[root@ip-172-31-6-148 ~]#
5.備註
package下載方式
- 使用pip2pi工具進行批量下載
- 通過官網手動下載,官網下載地址:https://pypi.python.org/pypi
在本地安裝pip2pi工具,可以通過pip2tgz命令批量下載package
- 在本地建立requirements.txt檔案,內容如下
six
bit_array
thrift==0.10.0
由於pip2tgz是通過將引數傳遞給pip呼叫來完成包的下載,所以可以指定任何pip可以識別的引數格式。
2.使用pip2tgz命令進行批量下載
[root@ip-172-31-6-148 .pip]# pip2tgz /root/python/ -r /root/requirements.txt
注意:pip命令預設使用的是國外的源下載package,如果國外源不穩定則可以參考3.3章節配置國內源。
6.常見問題
- 搭建完Python私有源,pip安裝package時報錯
[root@ip-172-31-6-148 .pip]# pip install six
Collecting six
The repository located at ip-172-31-6-148.fayson.com is not a trusted or secure host and is being ignored. If this repository is available via HTTPS it is recommended to use HTTPS instead, otherwise you may silence this warning and allow it anyways with `--trusted-host ip-172-31-6-148.fayson.com`.
Could not find a version that satisfies the requirement six (from versions: )
No matching distribution found for six
[root@ip-172-31-6-148 .pip]#
解決方法:
在pip.conf檔案中增加如下配置:
trusted-host = ip-172-31-6-148.fayson.com
醉酒鞭名馬,少年多浮誇! 嶺南浣溪沙,嘔吐酒肆下!摯友不肯放,資料玩的花!
溫馨提示:要看高清無碼套圖,請使用手機開啟並單擊圖片放大檢視
相關文章
- cdh 叢集安裝
- CDH5 叢集安裝教程H5
- 大資料叢集搭建 – 2. CDH叢集安裝 – NTP,MYSQL,nginx安裝大資料MySqlNginx
- 大資料叢集搭建 – 1. CDH叢集安裝 – 環境準備大資料
- redis cluster 4.0.9 叢集安裝搭建Redis
- Hadoop叢集安裝-CDH5(5臺伺服器叢集)HadoopH5伺服器
- Hadoop叢集安裝-CDH5(3臺伺服器叢集)HadoopH5伺服器
- Cloudera Manager安裝 & 搭建CDH叢集Cloud
- 【redis叢集安裝】Redis
- zookeeper 叢集安裝
- kafka叢集安裝Kafka
- hbase叢集安裝
- StarRocks 叢集安裝
- Oracle 19c叢集安裝踩坑記錄-多私網Oracle
- ElasticSearch 6.6.0叢集安裝Elasticsearch
- TiDB叢集安裝TiDB
- Elasticsearch 叢集安裝部署Elasticsearch
- 【Zookeeper】zookeeper叢集安裝
- 記HBase叢集安裝
- Hadoop叢集安裝Hadoop
- CDH叢集機器,安裝多個CDH版,會出現命令找不到,如hadoop,hdfs等等Hadoop
- Hadoop叢集安裝配置Hadoop
- kubernetes叢集安裝
- elasticsearch叢集安裝(3臺)Elasticsearch
- Storm叢集安裝與部署ORM
- ZooKeeper叢集安裝和部署
- linux ZooKeeper叢集安裝Linux
- WAS叢集安裝配置過程
- Kubernetes 叢集安裝
- 大資料之CDH叢集搭建大資料
- WAS中介軟體垂直叢集安裝
- WAS中介軟體水平叢集安裝
- mongo副本集叢集安裝配置Go
- K8S叢集安裝K8S
- Hadoop 叢集安裝與配置Hadoop
- hadoop叢集安裝檔案Hadoop
- Flink(四)叢集安裝(二)
- Zookeeper介紹與叢集安裝