首批開源超300個頂尖模型:這幾家中國「AI主力軍」,合力打造了一個AI模型社群「魔搭」

機器之心發表於2022-11-04

「模型即服務(Model as a Service)代表了未來的行業趨勢,而魔搭 ModelScope 邁出了最重要的第一步。」

11 月 3 日,2022 雲棲大會杭州現場,全新的 AI 模型社群魔搭 ModelScope 橫空出世。

圖片

魔搭社群 ModelScope 由阿里達摩院聯手中國計算機學會(CCF)開源發展委員會共同推出,首批合作機構包括瀾舟科技、智譜 AI、深勢科技、哈工大訊飛聯合實驗室、中國科學技術大學等多家科研機構,首批開源模型超過 300 個,中文模型佔比超過 1/3,SOTA 模型超過 150 個,還有 10 多個前沿的大模型,覆蓋了計算機視覺、語音、語義、多模態等多個領域,覆蓋了 60 多個通用任務。這些優質的模型,從此面向行業免費開放。

為什麼要做這樣一件事?阿里巴巴集團副總裁、阿里達摩院副院長周靖人表示:「中文為母語的 AI 開發者人數眾多,但中文 AI 模型數量不多,難以滿足實際需求,而且也沒有鼓勵開發和使用中文 AI 模型的相關社群。因此,我們希望魔搭 ModelScope 的出現能夠填補這方面的空白。」

十多年來,AI 技術的高速發展有目共睹,但如何讓先進技術高效落地,始終是一大難題。

這是因為傳統的 AI 模型存在技術上的侷限性,1 個模型只針對 1 個任務,1000 個任務需要 1000 個模型,研發成本過高,無法實現規模化使用。

而預訓練模型的興起提供了一種新的可能。比如近年來誕生的 Transformer、BERT 等預訓練模型,這些模型透過上游統一的預訓練後,面對下游各種任務場景只需要微調就能實現較好的效果。很多預訓練模型也已經開源,所有開發者都能下載、安裝、使用。

開源並不是萬能的。對於普通開發者來說,從原始碼開始跑一個複雜的 AI 模型,過程較長,充滿未知數。除了模型程式碼,開發者同樣需要開源之後的模型使用服務,需要更加簡便易用。

魔搭社群 ModelScope 就在這樣的背景之下誕生了。

圖片

模型即服務:AI 開源 2.0 新正規化

踐行模型即服務(Model as a Service)的新理念,魔搭社群提供了眾多預訓練基礎模型,只需針對具體場景再稍作調優,就能快速投入使用。

官網地址:http://www.modelscope.cn/

圖片

相比於行業內已有的其他 AI 開源社群,魔搭具備三大特徵:易用性、本土化、開放相容。

首先,魔搭提供了集模型探索、環境安裝、推理驗證、訓練調優於一體的「一站式服務」。對於模型使用者來說,可以在魔搭平臺透過多維度的標籤,線上檢索並直接體驗模型。魔搭既支援本地環境快捷安裝,也支援雲端 NoteBook 免安裝,真正實現了「開箱即用」。

以「DCT-Net 人像卡通化模型」為例,開發者可在模型庫主頁快速瀏覽「模型介紹」,初步瞭解模型的架構和詳細引數,還能一鍵連結到關聯資料集或線上體驗視窗。「快速使用」版塊則提供了下載安裝、載入和推理的操作指南。

圖片

值得關注的是,針對模型的推理和調優,魔搭透過封裝的 Python SDK,實現了一行程式碼即可實現模型推理;此外透過簡單易用的呼叫介面、靈活的配置檔案設計,僅需十行程式碼就可以執行一個調優任務。

基於雲的算力支撐和技術支撐,魔搭提供了更佳的使用者體驗,使得 AI 模型的開發和使用更簡單。以往,要讓一個 AI 模型跑起來,從下載開原始碼到本地配置、環境部署,得到評測結果往往需要數天時間,現在只需要幾個小時甚至幾分鐘。

其次,魔搭更關注本土化需求,更懂中文 AI 領域研究。

語言是從感知智慧邁向認知智慧的關鍵,理解中文,才能在中文世界的任務場景中取得更佳效果。社群鼓勵中文 AI 模型的開發和使用,希望實現中文 AI 模型的豐富供給。

目前已經上架的超過 100 箇中文模型中,包括了一系列探索人工智慧前沿的中文大模型。比如阿里通義大模型系列、瀾舟科技的孟子系列模型、智譜 AI 的多語言預訓練模型、中文版 GPT-3、中文版 CLIP。

圖片

1 億引數量的中文 GPT-3 文字生成模型,在魔搭社群獲得了近兩千次下載。

魔搭社群堅持中立開放的原則,相容 TensorFlow、PyTorch、Caffe 等多種主流學習框架,且支援多種模型訓練與服務部署方式,提供更多自主可控的選擇。

社群組織架構為理事會領導。所有開發者均可共同參與社群建設,不限機構,不限型別,旨在推動 AI 的大規模使用,不以盈利為目標。

從這個維度去看,魔搭探索的是一種「AI 開源 2.0 新正規化」。

推動「模型即服務」邁出重要一步

如果你對雲服務行業有所涉獵,那麼 IAAS(Infrastructure-as-a-Service,基礎設施即服務),PAAS(Platform-as-a-Service,平臺即服務) 和 SaaS(Software-as-a-Service,軟體即服務) 這三個名詞的涵義便不難理解。

但對於當下的行業來說,模型即服務(Model as a Service)還算一個小眾概念。魔搭為什麼要選擇這樣一種運作模式?

達摩院副院長周靖人解釋說,AI 發展到今天,模型架構變得越來越複雜,引數量也越來越龐大。除了模型本身之外,研發、應用的過程還會涉及到大量的資料和相應的算力。只有少數研究者或者一些大型科技企業可以承擔高昂的投入,普通 AI 開發者要訓練好一個模型還是非常有難度的。況且,想要把各個領域的模型利用起來,也需要一定的技術背景和比較深入的領域 Know-How。今天,行業內還缺乏統一的框架,幫助開發者們迅速把這些模型呼叫起來。種種因素使得 AI 的產業化應用面臨著挑戰,AI 的潛力難以得到充分發揮。

基於對以上觀察的思考,魔搭社群背後的創始成員們決定採取模型即服務(Model as a Service)的理念 。「人工智慧發展到這個階段,當前的學界和業界形成了一個共識:模型本身已經成為重要的載體,更加需要的是圍繞模型本身搭建相關服務。我們預估,這在接下來會是整個業界發展的重要趨勢。」周靖人表示。

圖片

縱觀 AI 領域的技術進步歷程,其實並不是靠某個人或某家公司來實現持續推動的。一個不涉及商業利益的、開放式的平臺,才更能夠吸引頂尖的技術人才集聚,更快實現「技術的平民化」。

也就是說,不光是從技術上降低門檻,也要從經濟上要降低門檻。所以在搭建之初,魔搭就定下了原則:不考慮盈利,免費提供模型下載和二次開發的機會。

為此,魔搭此次開源開放了十多個大模型,尤其包括針對中文的大模型,希望能夠被開發者用起來,讓大家根據大模型去定製開發下游任務的小模型。

中國科學院院士、CCF 開源發展委員會主任王懷民指出,開源是 AI 發展的重要驅動力,魔搭 ModelScope 作為新型的 AI 開源社群,不僅將有力推動 AI 邁向廣泛的落地應用,還將助力中國從開源世界的參與者逐步成長為領導者。

在這個過程中,達摩院也成為了貢獻先行者。「我們把自己最好的模型都拿了出來,包括此前釋出的達摩院通義大模型系列,這些全部透過社群提供相應的開發以及下載。」

對於各方參與機構來說,開源自研大模型不是「輕而易舉」的事。如果想讓眾多優質模型放棄商業營收,進入到開源開放序列,就必須打破現有的利益格局,重塑共識。當然,要打造一箇中文模型社群,不僅需要達摩院等幾家機構的參與,更需要高校、科研機構、企業、個人等各種主體的貢獻,以推動行業發展為己任,共同建設中文 AI 的新生態。

「魔搭社群的推出,遠遠算不上一個里程碑,只是一個起點,未來需要各方共同努力。」周靖人總結道。

附:魔搭社群部分模型

達摩院作畫 AI(阿里通義文生圖大模型) ,支援中文輸入,體驗入口

https://decoder.modelscope.cn/


圖片

(也可手機掃碼體驗)


  • 阿里通義文字生成影片大模型

  • https://www.modelscope.cn/models/damo/cv_diffusion_text-to-video-synthesis/summary


  • 阿里通義底座模型之 M6-OFA,可處理 10 多項跨模態任務;

  • https://modelscope.cn/models/damo/ofa_image-caption_coco_large_en/summary


  • 阿里通義多模態大模型 mPLUG,首次在視覺問答榜單 VQA Leaderboard 上超越人類;

  • https://modelscope.cn/models/damo/mplug_visual-question-answering_coco_large_en/summary


  • 阿里通義 AliceMind-PLUG (270 億引數),中文理解和生成大模型,支援寫小說、寫技術文件、常識問答等功能。

  • https://modelscope.cn/models/damo/nlp_plug_text-generation_27B/summary


  • 中文版 GPT-3,支援 AI 生成程式碼、AI 寫作文、續寫小說

  • https://modelscope.cn/models/damo/nlp_gpt3_text-generation_13B/summary


  • 中文版 CLIP 模型(2 億圖文對),可用於圖文檢索和影像、文字的表徵提取

  • https://www.modelscope.cn/models/damo/multi-modal_clip-vit-large-patch14_336_zh/summary


  • 瀾舟科技的孟子系列模型,十億引數的輕量化模型登頂中文語言理解榜單 CLUE;

  • https://modelscope.cn/models/langboat/mengzi-t5-base-mt/summary


  • 智譜AI的多語言預訓練模型,支援101種語言

  • https://modelscope.cn/models/ZhipuAI/Multilingual-GLM-Summarization-zh/summary


  • 深勢科技的蛋白質結構預測模型 Uni-Fold,一個開源的超越 AlphaFold 的模型

  • https://modelscope.cn/models/DPTech/uni-fold-monomer/summary


相關文章