HanLP-命名實體識別總結
人名識別
在 HanLP 中,基於角色標註識別了中國人名。首先系統利用隱馬爾可夫模型標註每個詞語的角色,之後利用最大模式匹配法對角色序列進行匹配,匹配上模式的即為人名。理論指導文章為:《基於角色標註的中國人名自動識別研究》 ,大家可以百度一下看看
地名識別
理論指導文章為:《基於層疊隱馬爾可夫模型的中文命名實體識別》
機構名識別
機構名的理論指導文章為:《基於角色標註的中文機構名識別》
命名實體識別 Demo
/*
* <summary></summary>
* <author>He Han</author>
* <email>hankcs.cn@gmail.com</email>
* <create-date>2014/12/7 19:25</create-date>
*
* <copyright file="DemoChineseNameRecoginiton.java" company=" 上海林原資訊科技有限公司 ">
* Copyright (c) 2003-2014+ 上海林原資訊科技有限公司 . All Right Reserved/
* This source is subject to the LinrunSpace License. Please contact 上海林原資訊科技有限公司 to get more information.
* </copyright>
*/
package com.hankcs.demo;
import com.hankcs.hanlp.HanLP;
import com.hankcs.hanlp.seg.Segment;
import com.hankcs.hanlp.seg.common.Term;
import java.util.LinkedList;
import java.util.List;
public class DemoNer {
// 例項化實體分詞器
public static Segment segment = HanLP.newSegment().enableNameRecognize(true).enablePlaceRecognize(true).enableOrganizationRecognize(true);
// 識別中文人名、中文地名、中文機構名
public static List<Term> recognizeNER(String text) {
List<Term> ner_li = new LinkedList<Term>();
List<Term> termList = segment.seg(text);
for(Term term: termList) {
String nature = term.nature != null ? term.nature.toString() : " 空 ";
if(nature.equals("nr")) {
ner_li.add(term);
}
else if(nature.equals("ns")) {
ner_li.add(term);
}
else if(nature.equals("nt")) {
ner_li.add(term);
}
}
return ner_li;
}
public static void main(String[] args)
{
// 人名識別示例
String[] test_person_case = new String[]{
" 簽約儀式前,秦光榮、李紀恆、仇和等一同會見了參加簽約的企業家。 ",
" 武大靖創世界紀錄奪冠,中國代表團平昌首金 ",
" 區長莊木弟新年致辭 ",
" 朱立倫:兩岸都希望共創雙贏 習朱歷史會晤在即 ",
" 陝西首富吳一堅被帶走 與令計劃妻子有交集 ",
" 據美國之音電臺網站 4 月 28 日報導, 8 歲的凱瑟琳·克羅爾(鳳甫娟)和很多華裔美國小朋友一樣,小小年紀就開始學小提琴了。她的媽媽是位虎媽麼? ",
" 凱瑟琳和露西(廬瑞媛),跟她們的哥哥們有一些不同。 ",
" 王國強、高峰、汪洋、張朝陽光著頭、韓寒、小四 ",
" 張浩和胡健康復員回家了 ",
" 王總和小麗結婚了 ",
" 編劇邵鈞林和稽道青說 ",
" 這裡有關天培的有關事蹟 ",
" 龔學平等領導說 , 鄧穎超生前杜絕超生 ",
" 藍翔給寧夏固原市彭陽縣紅河鎮黑牛溝村捐贈了挖掘機 ",
" 我在上海林原科技有限公司兼職工作, ",
" 我經常在臺川喜宴餐廳吃飯, ",
" 偶爾去開元地中海影城看電影。 ",
" 不用詞典,福哈生態工程有限公司是動態識別的結果。 "
};
for (String sentence : test_person_case)
{
List<Term> termList = recognizeNER(sentence);
System.out.println(sentence + "\t" + termList.toString());
}
}
}
【文章來源:整理自 的知乎專欄】
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31524777/viewspace-2652302/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- python呼叫hanlp進行命名實體識別PythonHanLP
- 條件隨機場實現命名實體識別條件隨機場
- HanLP-地名識別除錯方法HanLP地名識別除錯
- 使用DeepKE訓練命名實體識別模型DEMO(官方DEMO)模型
- 微調大型語言模型進行命名實體識別模型
- 「NLP-NER」如何使用BERT來做命名實體識別
- Hanlp-地名識別除錯方法詳解HanLP地名識別除錯
- 基於結構化感知機的詞性標註與命名實體識別框架詞性標註框架
- 【NLP學習其一】什麼是命名實體識別NER?
- 中文電子病歷命名實體識別(CNER)研究進展
- IJCAI 2018 利用跨語言知識改進稀缺資源語言命名實體識別AI
- Python自然語言處理實戰(4):詞性標註與命名實體識別Python自然語言處理詞性標註
- HanLP-基於HMM-Viterbi的人名識別原理介紹HanLPHMMViterbi
- 用飛槳做命名實體識別,手把手教你實現經典模型 BiGRU + CRF模型CRF
- 「NLP-NER」命名實體識別中最常用的兩種深度學習模型深度學習模型
- BERT微調進行命名實體識別並將模型儲存為pb形式模型
- C語言-識別符號命名C語言符號
- 一文詳解深度學習在命名實體識別(NER)中的應用深度學習
- 架構知識體系總結架構
- 自然語言處理工具HanLP-基於層疊HMM地名識別自然語言處理HanLPHMM地名識別
- 識別符號定義以及命名規則(駝峰命名法)符號
- go——識別符號的命名規範Go符號
- Redis知識體系總結(2021版)Redis
- Java知識體系總結(2021版)Java
- uniapp專案實踐總結(二十)URLScheme 協議知識總結APPScheme協議
- [Redis知識體系] 一文全面總結Redis知識體系Redis
- [MongoDB知識體系] 一文全面總結MongoDB知識體系MongoDB
- 識別符號的命名規則和規範符號
- C#程式碼識別符號命名規範C#符號
- XXE外部實體注入漏洞總結
- HanLP-實詞分詞器詳解HanLP分詞
- 文字識別(二)--字元識別技術總覽字元
- 知識方法總結
- 圖知識總結
- Docker知識總結Docker
- JQuery知識總結jQuery
- 常量知識總結
- golang知識總結Golang