自然語言處理工具HanLP被收錄中國大資料產業發展的創新技術新書《資料之翼》

adnb34g發表於2018-12-24


12月20日由中國電子資訊產業發展研究院主辦的2018中國軟體大會上,大快搜尋獲評“2018中國大資料基礎軟體領域領軍企業”,併成功入選中國數字化轉型TOP100服務商。

 

圖:大快搜尋獲評 “2018中國大資料基礎軟體領域領軍企業”

在本屆 2018中國軟體大會上,不僅宣傳併成立了數字轉型促進會,還發布了由中國大資料產業生態聯盟副秘書長、《軟體和積體電路》雜誌社總編輯郭嘉凱編輯的新書——《資料之翼-引領中國大資料產業發展的創新技術》。在本書的第一章節收錄介紹了大快搜尋自主研發的Hanlp技術。

 

圖:資料之翼 -引領中國大資料產業發展的創新技術

Hanlp是由大快搜尋高階研究員何晗主導開發的完全開源的專案,具有精度高、速度快、記憶體省的特點。

2014年,還在攻讀日語本科的何晗(大快搜尋高階研究員)一定沒想到,機緣巧合研發的一款中文分詞器,在隨後幾年中幾經迭代,並在商用市場大放異彩。

而看似是 “無心插柳柳成蔭”的事情,卻凝聚著何晗對Hanlp工匠式的錘鍊。

Hanlp是由一系列模型與演算法組成的工具包,目標是普及自然語言處理(NLP)在生產環境中的應用。Hanlp具備功能完善、效能高效、架構清晰、語料時新、可自定義的特點:能夠提供詞法分析(中文分詞、詞性標註、命名實體識別)、句法分析、文字分類和情感分析等功能。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31524777/viewspace-2286165/,如需轉載,請註明出處,否則將追究法律責任。

相關文章