技術創新研究所宣佈推出全球規模居首的阿拉伯語自然語言處理模型NOOR
阿布扎比先進技術研究委員會旗下的全球研究中心和應用研究支柱部門技術創新研究所(TII)今天宣佈推出NOOR語言處理模型,這是迄今為止全球規模居首的阿拉伯語自然語言處理(NLP)模型。
TII的高階研究人員和人工智慧專家團隊與LightOn聯手,對這個阿拉伯語NLP模型進行了改進。LightOn是一家專為企業提供超大規模機器智慧的技術公司。NOOR模型能夠執行超出語言領域的任務,可提供覆蓋整個端到端處理管道的高質量資料,包括大規模資料抓取、過濾和管理。該模型可促進超大規模資料的分散式訓練和服務,基於該模型的應用具有高效推理能力,並可針對特定領域進行模型調整。
TII和ASPIRE執行長Ray O. Johnson博士表示:“這一進展將大幅提升我們的研究能力和資質,並提升阿布扎比和阿聯酋作為重要研究生態系統的地位。我們的專家團隊再次證明,阿布扎比和阿聯酋地區可以取得具有世界影響力的、突破性的研發成果。”
TII人工智慧跨學科中心部門主任Ebtesam Almazrouei博士表示:“在自然語言處理領域,大型語言模型不斷湧現。能推出這個擁有100億個引數的先進模型,我們感到很自豪。這是全球規模居首的阿拉伯語NLP模型。為訓練該模型,我們採集了一套獨一無二的大型阿拉伯語資料集。相關工作歷經數月時間,包括對各種來源資料的整理、剔除和過濾。在此特別感謝參與該專案的整個團隊,他們使NOOR成為世界各地學者和企業首選的阿拉伯語研究模型。”
TII數字科學研究中心和人工智慧跨學科中心部門首席研究員Mérouane Debbah教授在釋出會上表示:“透過NOOR,TII利用在大型語言模型方面的專有技術,擴大了現代標準阿拉伯語模型的範圍,以在新一代人工智慧研究中建立跨學科的先進專長。”
NOOR擁有超過300億字的獨特資料集,涵蓋網路資料、書籍、詩歌、新聞文章和技術資訊等來源,從而打造出全球規模居首的高質量跨領域阿拉伯語資料集,並大幅拓寬了該模型的適用範圍。
Ebtesam Almazrouei博士表示,NOOR模型基於流行的Transformer架構,僅包含解碼器,結構與GPT-3相似,其設計旨在處理生成類任務。經過升級的架構引入了機器學習領域的最新發展,包括更好的位置嵌入等改進。為確保NOOR大規模資料集的質量,TII團隊設計了一個基於機器學習技術的自動過濾管道。相關工具可以識別優質參考文字,並保障模型不受垃圾內容汙染。
NOOR利用先進的3D並行技術,在配備128個A100 GPU的高效能運算資源上進行了訓練,該過程採用分散式計算模式,能夠確保有效利用可用的硬體資源。
人工智慧跨學科中心部門主任指出,NOOR只是該部門努力為更廣泛的阿聯酋人工智慧戰略做出貢獻的第一步。
該模型以阿拉伯語中的“光”命名,以體現模型旨在啟迪人類智慧的宗旨。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70011595/viewspace-2886663/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 自然語言處理技術詳細概覽自然語言處理
- 自然語言處理中的語言模型預訓練方法自然語言處理模型
- 自然語言處理技術是怎麼進入新階段的?自然語言處理
- 探索自然語言處理:語言模型的發展與應用自然語言處理模型
- 自然語言處理(NLP)系列(一)——自然語言理解(NLU)自然語言處理
- 牛津大學xDeepMind自然語言處理 第13講 語言模型(3)自然語言處理模型
- Python自然語言處理實戰(3):中文分詞技術Python自然語言處理中文分詞
- HanLP 自然語言處理 for nodejsHanLP自然語言處理NodeJS
- 自然語言處理NLP(四)自然語言處理
- 自然語言處理(NLP)概述自然語言處理
- Pyhanlp自然語言處理中的新詞識別HanLP自然語言處理
- 從Word Embedding到Bert模型——自然語言處理預訓練技術發展史模型自然語言處理
- 自然語言處理的最佳實踐自然語言處理
- 從Word Embedding到Bert模型—自然語言處理中的預訓練技術發展史模型自然語言處理
- [譯] 自然語言處理真是有趣!自然語言處理
- 自然語言處理:分詞方法自然語言處理分詞
- 牛津大學xDeepMind自然語言處理 第9講(下)語音模型自然語言處理模型
- 中國語文(自然語言處理)作業自然語言處理
- 精通Python自然語言處理 2 :統計語言建模Python自然語言處理
- Facebook 自然語言處理新突破:新模型能力趕超人類 & 超難 NLP 新基準自然語言處理模型
- 自然語言處理與情緒智慧自然語言處理
- Pytorch系列:(六)自然語言處理NLPPyTorch自然語言處理
- 自然語言處理之jieba分詞自然語言處理Jieba分詞
- 人工智慧 (06) 自然語言處理人工智慧自然語言處理
- 自然語言處理NLP快速入門自然語言處理
- 配置Hanlp自然語言處理進階HanLP自然語言處理
- PTW宣佈在全球推出RESOLVE多語言遊戲客服解決方案遊戲
- 12 種自然語言處理的開源工具自然語言處理開源工具
- 有趣的自然語言處理資源集錦自然語言處理
- hanlp自然語言處理包的基本使用--pythonHanLP自然語言處理Python
- 人工智慧--自然語言處理簡介人工智慧自然語言處理
- 深度解析自然語言處理之篇章分析自然語言處理
- 自然語言處理(NLP)路線圖 - kdnuggets自然語言處理
- 自然語言處理NLP(6)——詞法分析自然語言處理詞法分析
- 自然語言處理怎麼最快入門?自然語言處理
- 精通Python自然語言處理 1 :字串操作Python自然語言處理字串
- 05.序列模型 W2.自然語言處理與詞嵌入模型自然語言處理
- Keras版Sequence2Sequence對對聯實戰——自然語言處理技術Keras自然語言處理