如何編譯執行HanLP自然語言處理包

adnb34g發表於2019-03-06

master 分支

對於 master 分支,編譯方法如下 :

git clone   https://github.com/hankcs/HanLP.git

mvn install -DskipTests

 

· 由於目前一些 test 不夠規範,使用了硬編碼路徑下的資源,所以暫時跳過單元測試。

· 該方法不會將 src/main/resources 目錄下的任何資源(包括 hanlp.properties )打包進 jar ,如果需要打包資原始檔,請切換到 portable 分支。

portable 分支

git checkout portable

然後將需要的 data 放入 src/main/resources ,最後執行:

 

mvn install -DskipTests

執行 jar

目前 jar 包中有一些模組可以命令列執行,以感知機詞法分析器為例。由於這些模組一般需要載入外部 data ,所以需要在執行時指定 hanlp.properties 。執行時,一個典型的目錄結構如下:

 

· 此處只列出了重要的目錄。

· 一個良好的實踐是把 hanlp.properties 放到 resources 目錄下。

 

命令列需要指定 jar 包和 hanlp.properties 所在的目錄:

 

$ java -cp target/hanlp-1.6.0.jar:src/main/resources  com.hankcs.hanlp.model.perceptron.Main -test \

<<< ' 華安集團胡花蕊來到紐約藝術博物館參觀 '

[ 華安 /nz 集團 /n]/nt 胡花蕊 /nr 來到 /v [ 紐約 /ns 藝術 /n 博物館 /n]/ns 參觀 /v

 

· Windows 使用者請使用分號 java -cp target/hanlp-1.6.0.jar;src/main/resources


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31524777/viewspace-2637672/,如需轉載,請註明出處,否則將追究法律責任。

相關文章