spaCy (1)安裝和測試程式碼的執行 windows環境

skylanwang發表於2020-12-13

首先,我一直想搞一個聊天機器人,這回終於開始學習並開始搞了,希望可以堅持下去搞出一個半成品或者成品

自然語言處理NLP挺火的,因為AI人工智慧的應用,和現在客服系統、反饋、問答、引導等等的需求很多,是必須要學習一下的。

庫用的spaCy(英['speɪsɪ]美[ˈspesi]),語言在學習階段使用英語模型和部分參雜中文做測試使用

先記錄和搞清幾個概念,術語

1,意圖 Intent  :使用者的目的,意圖,想要什麼的?例如 “訂一張電影票”,意圖就是“訂電影票”,或者“我要訂餐”、“你可以幫我訂餐嗎”,意圖就是“訂餐”

2,實體 Entities :意圖擁有命名為“實體”的後設資料。例如“訂一張電影票”,意圖是“訂票”,實體就是“電影”,實體可以是數量、次數或者體積。意圖可以有很多實體,例如,“給我定一個8碼的鞋子”。兩個實體:類目:鞋子,大小:8[碼]

3,話術 Utterances :同一個問題或意圖的不同表達形式。例如訂票可以很多說法,建議每個意圖最好匹配10個話術,最少5個,這不是嚴格限制

4,訓練機器人 :訓練本質上是構建模型,模型是基於一組預定義的意圖/實體的話術進行學習,再對新的話術進行分類以及提供一個置信度分數。使用話術訓練系統時,稱為監督學習。

5,置信度得分 :發現一個話術可能時什麼意圖時,模型得出一個置信度分數,表達機器學習模型對識別出使用者意圖的信心。

 

spyCy :開源高階自然語言處理庫,按照書上說的目前最快的,準確性也更高一些。 2017年的資料是,spaCy v2.x 準確性有92.6

好了下邊開始環境的配置安裝,本文和以後的都使用python3環境

首先建立好專案目錄後,使用dos視窗執行命令

1,安裝 vnev 虛擬環境

python -m venv venv

2,開啟虛擬環境

.\venv\Scripts\activate.bat

3,安裝 spaCy

pip install -U spacy

4,安裝 Jupyter Notebook [ 本步驟可以跳過省略,使用dos視窗或者其它編輯器進行程式碼編輯也可 ]

pip install jupyter

5,安裝模型,比較重要的一步,

說實話,模型檔案很大,一個英文模型就有438M,再加上中文模型398M,建議是下載tar.gz檔案,然後使用本地安裝, 其它配套的庫則會自動安裝

下載地址:https://github.com/explosion/spacy-models/releases,記得選擇好版本,我這裡只是測試,所以直接下載最新版本

下載完成後,拷貝到專案目錄,然後執行 pip install en_core_web_trf-3.0.0a0.tar.gz

就會開始安裝,並自動補充其它支撐庫,安裝完成後,即可開始測試

下邊是再Jupyter環境裡的測試(jupyter 每次需要手動啟動,在venv虛擬環境裡執行 jupyter notebook  就會自動開啟瀏覽器並開啟jupyter介面)

在介面右上角靠下一行,“New”那個選單裡選擇python3,就會再彈出一個模擬終端,下邊是執行測試程式碼的效果

 

好了, 以上是安裝配置spaCy的記錄和例子。後續會不斷補充

 

 

 

 

 

 

 

 

 

 

 

 

 

 

相關文章