機器學習常用到python的自然語言處理框架NLTK,這個是機器學習的常用包,在使用過程中會遇到不少問題。我會和大家分享在這其中的一些經驗。
今天閒來說一下安裝,在安裝中出現的download錯誤。
>>> import nltk
>>> nltk.download()
NLTK Downloader
---------------------------------------------------------------------------
d) Download l) List c) Config h) Help q) Quit
---------------------------------------------------------------------------
Downloader> l
Packages:
Error connecting to server: [Errno -2] Name or service not known
經過推測,是伺服器無法連線下載伺服器地址導致的。
檢視一下nltk download配置
Downloader> c
Data Server:
- URL: <http://nltk.googlecode.com/svn/trunk/nltk_data/index.xml>
- 3 Package Collections Available
- 74 Individual Packages Available
Local Machine:
- Data directory: /home/wym/nltk_data
然後
> curl http://nltk.googlecode.com/svn/trunk/nltk_data/index.xml
報錯:curl: (6) Couldn't resolve host 'nltk.googlecode.com'
google的地址肯定是被牆掉了(唉,大家懂的)
解決辦法:
修改dns地址,
> vim /etc/resolv.conf
修改nameserver為: nameserver 8.8.8.8
問題解決