百度文心(ERNIE)如何學習海量資料中的知識
在2020世界人工智慧大會,百度文心(ERNIE)榮獲最高獎項SAIL獎(Super AI Leader,卓越人工智慧引領者)。
文心(ERNIE)是依託百度深度學習平臺飛槳打造的語義理解技術與平臺,集先進的預訓練模型、全面的NLP演算法集、端到端開發套件和平臺化服務於一體,為企業和開發者提供一整套NLP定製與應用能力。
ERNIE開創性地將大資料預訓練與多源豐富知識相結合,持續學習海量資料中的知識,將機器語義理解水平提升到一個新的高度。
以中文模型為例,目前ERNIE已經學習了1500萬篇百科語料和詞語、實體知識,700萬個人類對話,3億的文章的因果結構關係,以及10億次的搜尋查詢與結果的對應關係,以及2000萬的語言邏輯關係知識。
模型還在持續不斷地建模新的海量資料與知識,不斷地提升下游的應用效果。ERNIE在中英文的16個任務上已經超越了業界最好模型,全面適用於各類NLP應用場景。
目前,EasyDL已預置了領先的預訓練模型ERNIE2.0,並配套了多種NLP經典演算法網路,支援了文字分類、短文字匹配和序列標註等典型文字處理任務。
近日,文心(ERNIE)重磅釋出三項功能,新增定製多標籤文字分類、情感傾向分析、文字實體抽取模型等功能,同時資料管理能力也進一步增強,更好地滿足NLP領域開發者需求,開發者可透過百度AI開發平臺EasyDL進行使用。
EasyDL是百度大腦面向企業開發者推出的零門檻AI開發平臺,基於百度自主研發的深度學習平臺飛槳,結合業界先進的工程服務技術打造,覆蓋視覺與自然語言處理兩大技術方向,支援一站式智慧標註、模型訓練、服務部署等全流程功能。
針對開發者資料管理和資料標註過程中的痛點,EasyDL支援了更加靈活的資料格式,當前可支援zip、Excel、TXT三種檔案格式進行上傳。
除了提供線上標註能力外,還提供智慧標註功能,大幅降低了開發者的標註成本,開發者可直接上傳未標註資料體驗該功能。
目前EasyDL已經被廣泛應用在零售、網際網路、安全生產、工業質檢、教育、醫療、交通等20多個行業。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/30211218/viewspace-2728990/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 如何學習伺服器的知識?伺服器
- 學習的學習之七—如何應用元知識
- 海量資料處理問題知識點複習手冊
- 如何更高效的系統學習大資料方面知識?大資料
- 大資料學習,涉及的知識點大資料
- 知識增強的預訓練語言模型系列之ERNIE:如何為預訓練語言模型注入知識模型
- JVM知識在離線資料中的運用JVM
- web知識學習Web
- 知識學習綜合
- 「四大模型」革新NLP技術應用,揭秘百度文心ERNIE最新開源預訓練模型大模型
- 學習大資料需要掌握的知識,需要學習的資料技術大資料
- SegmentFault 思否宣佈將接入百度「文心一言」,提升開發者獲取知識的效率
- 零基礎如何學好大資料?必備需要學習知識大資料
- 小白階段如何學習Web前端知識Web前端
- 資料庫MySQL需要學習基本知識資料庫MySql
- 如何系統的學習伺服器相關知識?伺服器
- 如何加速專業領域知識的學習?- Commoncog
- 需掌握的深度學習知識深度學習
- 如何高效學習 Kubernetes 知識圖譜?
- 知識圖譜學習
- JAVA學習知識集合Java
- 前端知識學習01前端
- 前端知識學習03前端
- MyBatis知識點學習MyBatis
- Java知識點學習Java
- 學習資料庫的基礎知識的書籍資料庫
- 學大資料需要掌握的知識,需要學習的資料技術大資料
- 資料中心學習體會
- 【海量資料學院】DBA的學習方法論系列—正確的學習方法
- mysql資料庫學習基礎知識整理MySql資料庫
- 最近需要學習有關shell的知識,蒐集的資料
- 零基礎該如何學習Web前端知識?Web前端
- Python學習-字串的基本知識Python字串
- 前端鑑權知識學習前端
- 碎片化學習前端知識前端
- Bootstrap 個人學習知識點boot
- jQuery 個人學習知識點jQuery
- 逆向爬蟲知識學習爬蟲