國內首個!商湯科技釋出“日日新5o”,實時多模態流式互動對標GPT-4o

新闻助手發表於2024-07-05

2024 年 7 月 5 日,上海 ——2024 世界人工智慧大會暨人工智慧全球治理高階別會議(WAIC 2024)戰略合作伙伴商湯科技召開 “大愛無疆・向新力” 人工智慧論壇,釋出國內首個所見即所得模型 “日日新 5o”,互動體驗對標 GPT-4o,實現全新 AI 互動模式。

透過整合跨模態資訊,基於聲音、文字、影像和影片等多種形式,國內首個所見即所得模型 “日日新 5o” 帶來一種全新的 AI 互動模式,即實時的流式多模態互動。現場也為大家展示了這種創新互動模式 ——

工作人員剛開始僅是和 “日日新 5o” 打個招呼,它就自動識別出工作人員脖子佩戴的胸卡帶子上的字眼,判斷出現場就是世界人工智慧大會會場,並表示在這個地方可以 “好好學習”。

國內首個!商湯科技釋出“日日新5o”,實時多模態流式互動對標GPT-4o

接下來工作人員拿了一隻可愛小狗玩偶,“日日新 5o” 準確描述了小狗的外貌、表情以及重要穿戴 —— 一個帶著印有商湯科技 logo 白帽子,很給主場人排面。

國內首個!商湯科技釋出“日日新5o”,實時多模態流式互動對標GPT-4o

再上些難度,隨便翻開一本書的任何一頁,“日日新 5o” 都能自動介紹,不是簡單的 OCR 識別文字,而是識別圖文給出好理解的總結,這一切在瞬間即可完成,真正做到實時互動。

國內首個!商湯科技釋出“日日新5o”,實時多模態流式互動對標GPT-4o

工作人員還現場發揮了 “畫功”,隨手畫了一隻簡筆畫小兔子,“日日新 5o” 直呼畫得可愛,而後工作人員又畫了一個微笑表情,它從這個平靜的表情中捕捉到了笑意,工作人員又改了一筆把嘴巴畫大增添了舌頭,“日日新 5o” 看到後立馬說道這表情開心多了。

能聽會看更會找話題,就如同真人聊天一般的交流對話,這種互動模式特別適用於實時對話和語音識別等應用,其多工適應性強,能夠在同一模型中自然處理多種任務,且根據不同上下文自適應調整行為和輸出,能夠實現對標 GPT-4o 的互動體驗正是源於 “日日新 5.5” 基礎模型能力的全面提升。

今年 4 月釋出的 “日日新 5.0” 是國內首個對標 GPT-4 Turbo 的國產大模型,短短兩個多月時間,全新 “日日新 5.5” 體系迎來多項升級,綜合效能較 “日日新 5.0” 平均提升 30%,在數學推理、英文能力和指令跟隨等能力明顯增強,互動效果和多項核心指標實現對標 GPT-4o。

國內首個!商湯科技釋出“日日新5o”,實時多模態流式互動對標GPT-4o

“日日新 5.5” 採用混合端雲協同專家架構,最大限度發揮雲邊端協同,降低推理成本,模型訓練基於超過 10TB tokens 高質量訓練資料,包括大量合成的思維鏈資料,提升推理思維能力。

國內首個!商湯科技釋出“日日新5o”,實時多模態流式互動對標GPT-4o

為了讓更多企業使用者低門檻接入並使用 “日日新” 大模型體系的強大能力,商湯於近期推出了 “大模型 0 元 Go” 計劃。凡是 “日日新” 的新註冊使用者,都可獲得涉及呼叫、遷徙、訓練等多項免費服務大禮包。同時,商湯還將免費贈送 5000 萬 Tokens 包,並且派出專屬搬家顧問,幫助 OpenAI 使用者實現零服務成本遷移。

相關文章