漢語言處理包HanLP1.6.4釋出,優化新詞發現
HanLP 是由一系列模型與演算法組成的 Java 工具包,目標是普及自然語言處理在生產環境中的應用。HanLP 具備功能完善、效能高效、架構清晰、語料時新、可自定義的特點。 在提供豐富功能的同時,HanLP 內部模組堅持低耦合、模型堅持惰性載入、服務堅持靜態提供、詞典堅持明文釋出,使用非常方便,同時自帶一些語料處理工具,幫助使用者訓練自己的模型。
HanLP v1.6.4 更新內容:
優化 CorpusLoader、優化 MutableFeatureMap 的設計
優化新詞發現,使結果不含分隔符:#826
TextRank 提取關鍵詞提升演算法速度 @hlstudio
使用者詞典熱更新時支援.csv @patrick_lin
增強詞向量讀取時的健壯性:#821
根據百度漢語和線上辭海修正拼音詞典 @AnyListen
修訂停用詞詞典 @duohappy
修復詞法分析器禁用使用者詞典時發生的問題、修復詞法分析器 seg 介面與命名實體識別的配合問題:hankcs/pyhanlp#15 (comment) 、修正結構化感知機多執行緒平均的問題
微調人名識別模型、新增月份詞彙
資料包相容 data-for-1.6.2.zip md5=3ebb9e47ecff740f09c9ec7c21324661
獲取最新版的資料包,請fork並git clone一份倉庫中的最新data。
Portable 版同步升級到 v1.6.4
<dependency>
<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.6.4</version>
</dependency>
文章來源於網路
相關文章
- 漢語言處理包HanLPv1.6.0釋出,感知機詞法分析器HanLP詞法分析
- Pyhanlp自然語言處理中的新詞識別HanLP自然語言處理
- 文字相似度 HanPL漢語言處理
- [ gev ] Go 語言優雅處理 TCP “粘包”GoTCP
- 自然語言處理:分詞方法自然語言處理分詞
- 自然語言處理之jieba分詞自然語言處理Jieba分詞
- go語言處理TCP拆包/粘包GoTCP
- 自然語言處理NLP(6)——詞法分析自然語言處理詞法分析
- 《NLP漢語自然語言處理原理與實踐》學習四自然語言處理
- GO語言手動處理TCP粘包GoTCP
- R語言歸一化處理R語言
- 詞!自然語言處理之詞全解和Python實戰!自然語言處理Python
- 入門自然語言處理必看:圖解詞向量自然語言處理圖解
- NPL---自然語言處理單詞界定問題自然語言處理
- Hanlp自然語言處理中的詞典格式說明HanLP自然語言處理
- NLP自然語言處理中的hanlp分詞例項自然語言處理HanLP分詞
- 自然語言處理中的分詞問題總結自然語言處理分詞
- 精通Python自然語言處理 4 :詞性標註--單詞識別Python自然語言處理詞性標註
- 使用Mahout實現自然語言處理自然語言處理
- 開源自然語言處理工具包hanlp中CRF分詞實現詳解自然語言處理HanLPCRF分詞
- 史丹佛NLP團隊釋出最新自然語言處理Python庫自然語言處理Python
- 如何編譯執行HanLP自然語言處理包編譯HanLP自然語言處理
- hanlp自然語言處理包的基本使用--pythonHanLP自然語言處理Python
- 語言處理器
- Python 自然語言處理(基於jieba分詞和NLTK)Python自然語言處理Jieba分詞
- Python自然語言處理 1 語言處理與PythonPython自然語言處理
- 前端優化之高併發處理前端優化
- Java簡單實現漢語詞頻統計Java
- NLP漢語自然語言處理入門基礎知識自然語言處理
- 探索自然語言處理:語言模型的發展與應用自然語言處理模型
- uniGUI釋出時執行時包的處理GUI
- 漢語言處理工具pyhanlp的拼音轉換與字元正則化HanLP字元
- Python自然語言處理實戰(3):中文分詞技術Python自然語言處理中文分詞
- 05.序列模型 W2.自然語言處理與詞嵌入模型自然語言處理
- CSS 預處理語言的模組化實踐CSS
- CSS預處理語言的模組化實踐CSS
- 自然語言處理(NLP)自然語言處理
- 目前常用的自然語言處理開源專案/開發包大彙總自然語言處理