python呼叫hanlp進行命名實體識別
本文分享自 6 丁一的貓 的部落格,主要是 python 呼叫 hanlp 進行命名實體識別的方法介紹。以下為分享的全文。
1 、 python 與 jdk 版本位數一致
2 、 pip install jpype1 ( python3.5 )
3 、類庫 hanlp.jar 包、模型 data 包、配置檔案 hanlp.properties 放在一個新建目錄
4 、修改 hanlp.properties 中 root 根目錄,找到 data
程式碼呼叫如下:
1| #coding:utf-8
2| '''
3| Created on 2017-11-21
4|
5| @author: 劉帥
6| '''
7|
8|
9| from jpype import *
10|
11| startJVM(getDefaultJVMPath(), "-Djava.class.path=D:\hanlp\hanlp-1.3.4.jar;D:\hanlp", "-Xms1g", "-Xmx1g") # 啟動 JVM , Linux 需替換分號 ; 為冒號 :
12| HanLP = JClass('com.hankcs.hanlp.HanLP')
13| # 中文分詞
14| print(HanLP.segment(' 你好,歡迎在 Python 中呼叫 HanLP 的 API'))
testCases = [
15| " 商品和服務 ",
16| " 結婚的和尚未結婚的確實在干擾分詞啊 ",
17| " 買水果然後來世博園最後去世博會 ",
18| " 中國的首都是北京 ",
19| " 歡迎新老師生前來就餐 ",
20| " 工信處女幹事每月經過下屬科室都要親口,交代 24 口,交換機等技術性器件的安裝工作 ",
21| " 隨著頁遊興起到現在的頁遊繁盛,依賴於存檔進行邏輯判斷的設計減少了,但這塊也不能完全忽略掉。 "]
22| for sentence in testCases: print(HanLP.segment(sentence))
23| # 命名實體識別與詞性標註
24| NLPTokenizer = JClass('com.hankcs.hanlp.tokenizer.NLPTokenizer')
25| print(NLPTokenizer.segment(' 中國科學院計算技術研究所的宗成慶教授正在教授自然語言處理課程 '))
26| # 關鍵詞提取
27| document = " 水利部水資源司司長陳明忠 9 月 29 日在新聞辦舉行的新聞釋出會上透露, " \
28| " 根據剛剛完成了水資源管理制度的考核,有部分省接近了紅線的指標, " \
29| " 有部分省超過紅線的指標。對一些超過紅線的地方,陳明忠表示,對一些取用水專案進行區域的限批, " \
30| " 嚴格地進行水資源論證和取水許可的批准。 "
31| print(HanLP.extractKeyword(document, 2))
32| # 自動摘要
33| print(HanLP.extractSummary(document, 3))
34| # 依存句法分析
35| print(HanLP.parseDependency(" 徐先生還具體幫助他確定了把畫雄.鷹、松鼠和麻雀作為主攻目標。 "))
36| shutdownJVM()
結果如下:
1| [ 你好 /vl, , /w, 歡迎 /v, 在 /p, Python/nx, 中 /f, 呼叫 /v, HanLP/nx, 的 /ude1, API/nx]
2| [ 商品 /n, 和 /cc, 服務 /vn]
3| [ 結婚 /vi, 的 /ude1, 和 /cc, 尚未 /d, 結婚 /vi, 的 /ude1, 確實 /ad, 在 /p, 干擾 /vn, 分詞 /n, 啊 /y]
4| [ 買 /v, 水果 /n, 然後 /c, 來 /vf, 世博園 /n, 最後 /f, 去 /vf, 世博會 /n]
5| [ 中國 /ns, 的 /ude1, 首都 /n, 是 /vshi, 北京 /ns]
6| [ 歡迎 /v, 新 /a, 老 /a, 師生 /n, 前來 /vi, 就餐 /vi]
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31524777/viewspace-2650503/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- HanLP-命名實體識別總結HanLP
- 自然語言處理工具python呼叫hanlp中文實體識別自然語言處理PythonHanLP
- 微調大型語言模型進行命名實體識別模型
- HanLP分詞命名實體提取詳解HanLP分詞
- BERT微調進行命名實體識別並將模型儲存為pb形式模型
- 中文電子病歷命名實體識別(CNER)研究進展
- 條件隨機場實現命名實體識別條件隨機場
- IJCAI 2018 利用跨語言知識改進稀缺資源語言命名實體識別AI
- Python自然語言處理實戰(4):詞性標註與命名實體識別Python自然語言處理詞性標註
- python示例 呼叫影象識別服務識別影象Python
- python呼叫hanlp分詞包手記PythonHanLP分詞
- python—呼叫API人臉識別PythonAPI
- python-進階教程-對切片進行命名Python
- 使用DeepKE訓練命名實體識別模型DEMO(官方DEMO)模型
- 「NLP-NER」如何使用BERT來做命名實體識別
- C#實現控制檯傳參呼叫YoloV5進行人體識別C#YOLO
- 【NLP學習其一】什麼是命名實體識別NER?
- ubuntu下pycharm呼叫Hanlp實踐分享UbuntuPyCharmHanLP
- Hanlp漢字轉拼音使用python呼叫詳解HanLPPython
- HanLP-地名識別除錯方法HanLP地名識別除錯
- HanLP中人名識別分析詳解HanLP
- python呼叫自然語言處理工具hanlp記錄Python自然語言處理HanLP
- HanLP中的人名識別分析詳解HanLP
- Hanlp實戰HMM-Viterbi角色標註中國人名識別HanLPHMMViterbi
- Hanlp-地名識別除錯方法詳解HanLP地名識別除錯
- 用飛槳做命名實體識別,手把手教你實現經典模型 BiGRU + CRF模型CRF
- 「NLP-NER」命名實體識別中最常用的兩種深度學習模型深度學習模型
- 【TensorFlow2.0】LeNet進行手寫體數字識別
- Python實現AI影像識別-身份證識別PythonAI
- C語言-識別符號命名C語言符號
- 自然語言處理工具python呼叫hanlp的方法步驟自然語言處理PythonHanLP
- 基於結構化感知機的詞性標註與命名實體識別框架詞性標註框架
- 一文詳解深度學習在命名實體識別(NER)中的應用深度學習
- 識別符號定義以及命名規則(駝峰命名法)符號
- 在Python中呼叫Java擴充套件包HanLP測試記錄PythonJava套件HanLP
- go——識別符號的命名規範Go符號
- Python呼叫百度OCR介面圖片識別轉文字Python
- 使用Tesseract進行圖片文字識別