百度文心(ERNIE)如何學習海量資料中的知識

huaxia423發表於2020-10-23

  在2020世界人工智慧大會,百度文心(ERNIE)榮獲最高獎項SAIL獎(Super AI Leader,卓越人工智慧引領者)。

  文心(ERNIE)是依託百度深度學習平臺飛槳打造的語義理解技術與平臺,集先進的預訓練模型、全面的NLP演算法集、端到端開發套件和平臺化服務於一體,為企業和開發者提供一整套NLP定製與應用能力。

  ERNIE開創性地將大資料預訓練與多源豐富知識相結合,持續學習海量資料中的知識,將機器語義理解水平提升到一個新的高度。

  以中文模型為例,目前ERNIE已經學習了1500萬篇百科語料和詞語、實體知識,700萬個人類對話,3億的文章的因果結構關係,以及10億次的搜尋查詢與結果的對應關係,以及2000萬的語言邏輯關係知識。

  模型還在持續不斷地建模新的海量資料與知識,不斷地提升下游的應用效果。ERNIE在中英文的16個任務上已經超越了業界最好模型,全面適用於各類NLP應用場景。

  目前,EasyDL已預置了領先的預訓練模型ERNIE2.0,並配套了多種NLP經典演算法網路,支援了文字分類、短文字匹配和序列標註等典型文字處理任務。

  近日,文心(ERNIE)重磅釋出三項功能,新增定製多標籤文字分類、情感傾向分析、文字實體抽取模型等功能,同時資料管理能力也進一步增強,更好地滿足NLP領域開發者需求,開發者可透過百度AI開發平臺EasyDL進行使用。

  EasyDL是百度大腦面向企業開發者推出的零門檻AI開發平臺,基於百度自主研發的深度學習平臺飛槳,結合業界先進的工程服務技術打造,覆蓋視覺與自然語言處理兩大技術方向,支援一站式智慧標註、模型訓練、服務部署等全流程功能。

  針對開發者資料管理和資料標註過程中的痛點,EasyDL支援了更加靈活的資料格式,當前可支援zip、Excel、TXT三種檔案格式進行上傳。

  除了提供線上標註能力外,還提供智慧標註功能,大幅降低了開發者的標註成本,開發者可直接上傳未標註資料體驗該功能。

  目前EasyDL已經被廣泛應用在零售、網際網路、安全生產、工業質檢、教育、醫療、交通等20多個行業。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/30211218/viewspace-2728990/,如需轉載,請註明出處,否則將追究法律責任。

相關文章