ubuntu下pycharm呼叫Hanlp實踐分享

adnb34g發表於2018-12-14

原文網址 : http://blog.itpub.net/31524777/viewspace-2285215/

ubuntu下pycharm呼叫Hanlp 實踐分享

前幾天看了大快的舉辦的大資料論壇峰會的現場直播，驚喜的是 hanlp2.0版本釋出。Hanlp2.0版本將會支援任意多的語種，感覺還是挺好的！不過更多關於hanlp2.0的資訊，可能還需要過一段時間才能看到，只能等一下了！下面分享一篇大神的文章，是關於在ubuntu下使用pycharm呼叫hanlp的實驗。

以下為全文：

首先點選 File,選擇Settings，在Project 下點選Project Interpreter，並通過點選右邊的加號：

搜尋 JPype,根據python版本選擇你需要的JPype版本安裝。

之後 ,在https://github.com/hankcs/HanLP/releases

網站下載 hanlp.jar包、模型data包、配置檔案hanlp.properties，新建一個資料夾Hanlp，

把 hanlp.jar和hanlp.properties放進去；之後需要再新建一個資料夾 hanlp,並將data放進去；

修改 Hanlp下的路徑為當前data的路徑，由於我將data放在/home/javawork/hanlp下，因此：root=/home/javawork/hanlp/

接下來新建一個檔案 demo_hanlp.py,程式碼如下：

#! /usr/bin/env python2.7

#coding=utf-8

from jpype import *

# startJVM(getDefaultJVMPath(), "-Djava.class.path=home/javawork/Hanlp/hanlp-1.2.7.jar;home/javawork/Hanlp/", "-Xms1g", "-Xmx1g")

startJVM(getDefaultJVMPath(), "-Djava.class.path=/home/qinghua/javawork/Hanlp/hanlp-1.2.7.jar:/home/qinghua/javawork/Hanlp")

HanLP = JClass('com.hankcs.hanlp.HanLP')

# 中文分詞

print(HanLP.segment('你好，歡迎在Python中呼叫HanLP的API'))

testCases = [

"商品和服務",

"結婚的和尚未結婚的確實在干擾分詞啊",

"買水果然後來世博園最後去世博會"]

for sentence in testCases: print(HanLP.segment(sentence))

# 命名實體識別與詞性標註

NLPTokenizer = JClass('com.hankcs.hanlp.tokenizer.NLPTokenizer')

print(NLPTokenizer.segment('中國科學院計算技術研究所的宗成慶教授正在教授自然語言處理課程'))

# 關鍵詞提取

document = "水利部水資源司司長陳明忠9月29日在guo wu yuan 新聞辦舉行的新聞釋出會上透露，" \

"根據剛剛完成了水資源管理制度的考核，有部分省接近了紅線的指標，" \

"有部分省超過紅線的指標。對一些超過紅線的地方，陳明忠表示，對一些取用水專案進行區域的限批，" \

"嚴格地進行水資源論證和取水許可的批准。"

print(HanLP.extractKeyword(document, 2))

# 自動摘要

print(HanLP.extractSummary(document, 3))

# 依存句法分析

print(HanLP.parseDependency("徐先生還具體幫助他確定了把畫雄鷹、松鼠和麻雀作為主攻目標。"))

shutdownJVM()

需要注意的是 ubuntu的路徑分割符為”：”，而window 為” ; ”

另附 hanlp呼叫常見問題集：

github.com/hankcs/HanLP/issues?page=3&q=is%3Aissue+is%3Aopen

作者： imperfect00

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/31524777/viewspace-2285215/，如需轉載，請註明出處，否則將追究法律責任。

python呼叫hanlp進行命名實體識別
2019-07-15
PythonHanLP
Linux下跨語言呼叫C++實踐
2022-04-29
LinuxC++
PyCharm外掛開發實踐-PyGetterAndSetter
2021-10-01
PyCharm
python呼叫hanlp分詞包手記
2018-12-26
PythonHanLP分詞
自然語言處理工具python呼叫hanlp中文實體識別
2019-02-13
自然語言處理PythonHanLP
pycharm怎麼呼叫命令列
2021-09-11
PyCharm命令列
Ubuntu 下 Oh My Zsh 的最佳實踐「安裝及配置」
2018-06-13
Ubuntu
WKWebView實踐分享
2019-01-28
WebView
Ubuntu下安裝pycharm和Anaconda和Tensorflow的注意要點（自用）
2020-10-20
UbuntuPyCharm
Hanlp在ubuntu中的使用方法介紹
2018-12-10
HanLPUbuntu
Hanlp漢字轉拼音使用python呼叫詳解
2019-03-20
HanLPPython
Spring MVCD框架中呼叫HanLP分詞的方法
2019-07-10
SpringMVC框架HanLP分詞
GRPC 服務呼叫實踐（一）
2019-11-12
RPC
一下科技關於docker實踐分享摘錄
2018-11-20
Docker
分享如何在Ubuntu 16.04下CUDA8.0
2022-02-20
Ubuntu
python呼叫自然語言處理工具hanlp記錄
2018-10-31
Python自然語言處理HanLP
Ubuntu 22.04 + Pycharm + Flask 配置 Flask 專案
2024-08-03
UbuntuPyCharmFlask
Laravel 編碼實踐分享
2019-02-26
Laravel
Eclipse myeclipse下配置HanLP的教程
2019-05-24
EclipseHanLP
Ubuntu中安裝pycharm後修改hosts方法
2019-07-19
UbuntuPyCharm
雲上深度學習實踐分享——雲上MXNet實踐
2018-07-16
深度學習
pycharm最新code碼，分享給大家
2018-11-26
PyCharm
自然語言處理工具python呼叫hanlp的方法步驟
2019-07-17
自然語言處理PythonHanLP
Node 呼叫 dubbo 服務的探索及實踐
2019-03-24
淘寶API介面呼叫：案例分析與實踐
2024-01-27
API
python下載包（pycharm）
2024-03-26
PythonPyCharm
乾貨分享：容器 PaaS 新技術架構下的運維實踐
2018-11-22
架構運維
在Python中呼叫Java擴充套件包HanLP測試記錄
2018-12-12
PythonJava套件HanLP
Android元件化實踐專案分享
2019-03-06
Android元件化
rabbitmq 學習與實踐分享（3）
2019-04-15
MQ
rabbitmq 學習與實踐分享(2)
2019-04-14
MQ
大檔案上傳實踐分享
2024-03-27
Kubernetes+Promethues+Cloud Alert實踐分享
2019-08-06
Cloud
企業安全實踐經驗分享
2020-08-19
Istio最佳實踐系列：如何實現方法級呼叫跟蹤？
2021-04-15
呼叫鏈監控 CAT 之 URL埋點實踐
2019-04-16
乾貨分享：智慧工廠時代下大資料 + 智慧的深度實踐
2018-12-04
大資料
下載和安裝Pycharm
2020-12-21
PyCharm

ubuntu下pycharm呼叫Hanlp實踐分享

相關文章