景聯文科技:提供通用多模態資料,助力AI多模態領域實現飛躍式發展

景联文科技發表於2024-03-15

回顧 2023年,以ChatGPT為代表的通用人工智慧大模型在全球範圍內掀起了新一輪人工智慧產業發展浪潮,我國人工智慧大模型市場呈現百“模”爭鳴、日新月異的迅猛發展態勢。

根據大模型之家、鈦媒體資料, 2023年中國大模型市場規模達到147億人民幣,同比增長110.0% 預計到 2028年中國大模型市場規模將達到1179億人民幣


其中,多模態大模型市場規模有望快速增長。第一財經資料顯示,預計至 2025年,中國多模態內容市場規模將達到832.7億美元,2018-2025年複合增長率 65.02%。多模態大模型將主要應用於教育、醫療、遊戲、商業定製和影視等領域。

不久前 OpenAI釋出文生影片模型Sora, 極大地 推動了 AI多模態領域飛速發展,AI創作等相關領域將迎來深度變革,AI賦能範圍日益擴大。

高質量的多模態資料是構建和訓練多模態大模型的基礎,它決定了模型能否有效捕獲和利用不同模態間複雜的語義關係,進而影響到模型的整體效能和應用價值。隨著多模態技術的發展,多模態資料的需求和重要性日益增加,對於推動人工智慧向著更深層次的通用智慧方向邁進具有 重要 作用。

景聯文科技是大模型資料供應商,致力於為不同階段的模型演算法匹配高質量 多模態 資料資源。

通用多模態資料集

音訊資料:

l 普通話 (人數 200 萬以上,取樣率 44.1Khz 及 以上,16bit) 100萬小時

l 方言 2.7千小時

圖片生成及隱式 /顯示推理多模態資料:

l 圖文複雜描述 50萬本

l 圖文推理問答對 400萬本

l 4K 高畫質圖片 5000萬張

影片生成及隱式 /顯示推理多模態資料:

l 影片簡單描述

l 影片複雜描述

l 影片推理問答對

同時景聯文科技提供大模型訓練資料的標註服務,建立了資料分發、清洗、標註、質檢、交付的標準化操作流程,為全球數千家人工智慧從業公司和高校科研機構交付海量、高質量的多模態大模型訓練資料。

景聯文科技|資料採集|資料標註|多模態大模型訓練資料

助力人工智慧技術,賦能傳統產業智慧轉型升級

文章圖文著作權歸景聯文科技所有,商業轉載請聯絡景聯文科技獲得授權,非商業轉載請註明出處。


來自 “ ITPUB部落格 ” ,連結:https://blog.itpub.net/70025739/viewspace-3009081/,如需轉載,請註明出處,否則將追究法律責任。

相關文章