騰訊大模型App元寶上線,我們用它「單挑」了下GPT-4o

机器之心發表於2024-05-30
騰訊元寶 VS GPT-4o,究竟誰技高一籌?

最近,騰訊一改往日的慢性子,忽然「卷」起來了:

5 月 14 日,騰訊全面開源混元文生圖模型;

5 月 17 日,騰訊釋出一站式 AI 智慧體創作與分發平臺「騰訊元器」;

5 月 30 日,基於混元大模型的 App「騰訊元寶」正式上線,目前應用商店已經可以下載。

騰訊元寶是一個基於混元大模型及搜尋引擎驅動的高效資訊整合工具,介面設計簡潔,可以搜尋實時資訊,也可以對上傳的多格式文件進行總結、翻譯,還能語音對話練習口語。

而此次騰訊元寶產品能力升級的背後,是騰訊混元底層模型的持續迭代。

據介紹,自 2023 年 9 月首次亮相以來,騰訊混元大模型的引數規模已從千億升級至萬億,預訓練語料從萬億升級至 7 萬億 tokens,並率先升級為多專家模型結構(MoE),整體效能相比 Dense 版本提升超 50%。

我們第一時間拿到了騰訊元寶的體驗資格,今天就拿出來 “遛一遛”。

騰訊元寶「單挑」GPT-4o

相比此前測試階段的混元小程式版本,面向工作效率場景,騰訊元寶提供了 AI 搜尋、AI 總結、AI 寫作等核心能力。

沒有對比就沒有發言權。我們決定讓騰訊元寶和大洋彼岸的 GPT-4o 進行較量。

Round 1:AI 搜尋

如今,AI 搜尋是香餑餑。

無論是「搜尋之王」谷歌還是新晉頂流 OpenAI,都在 AI 搜尋上做文章,甚至成立不到 2 年的 Perplexity AI 都成了黃仁勳的「心頭好」。英偉達創始人黃仁勳曾公開表示,自己最愛用的 AI 工具是 Perplexity。

騰訊元寶自然上線了這一功能。

要知道,微信公眾號每天都生成大量優質深度文章,背靠這棵大樹,騰訊的 AI 搜尋功能有著得天獨厚的優勢。

我們在「騰訊元寶」下方輸入框中輸入「現在適合買黃金嗎?」

(溫馨提示:投資需謹慎)

騰訊元寶的回答:

圖片

GPT-4o 的回答:

圖片

首先,從響應速度上來說,二者可以說是不相上下,幾秒鐘時間,騰訊元寶就參考完 9 篇資料,並給出了回答。

其次,從回答內容上來說,騰訊元寶似乎更勝一籌。GPT-4o 僅僅給出了購買黃金需要考慮的幾個因素,而騰訊元寶的答案涵蓋黃金價格走勢預測、投資風險以及投資策略,而且每條均有引用,這就避免了大模型「滿嘴跑火車」的缺點。

此外, 騰訊這次真的把好鋼用在了刀刃上。除了推薦了相關公眾號文章外,騰訊元寶還在首頁上線了快速播報功能,對當前最新、最重要的資訊進行摘要總結,而且每條資訊都會提供騰訊新聞的連結。

這一局,騰訊元寶勝!

Round2:文件總結

該功能旨在幫助使用者高效獲取和處理文件資訊,騰訊元寶能夠處理多種格式的文件,例如 PDF、Word、Excel 等。

前幾天騰訊正好釋出了 2024 年第一季度財報,我們下載了一份。

這份長達 48 頁、3.2 萬字的財報,不僅數字多,還是繁體字,看得人腦瓜子疼。這時 AI 就派上用場了。

我們將這份財報分別上傳到騰訊元寶和 GPT-4o,讓他們各自分析一下騰訊開年第一季度的營收情況。

騰訊元寶:

圖片

GPT-4o:圖片

總體來看,它們回答得條分縷析。兩相比較 GPT-4o 的答案更加豐富,除了財務表現和主要業務表現外,GPT-4o 還提供了運營資料、財務狀況等。

財務報表重在準確。我們拿著這堆資料一一校對,果然還是找到了 bug。

騰訊一季度的其他收入應為 20.6 億元,騰訊元寶卻寫成 206 億元,在換算過程中把小數點點錯了。

圖片

而 GPT-4o 的資料全部正確。

這一局,GPT-4o 勝!

Round3:網頁總結

這是一種自動提取網頁關鍵資訊的功能,在使用者瀏覽大量資訊時,它能快速抓住網頁內容的重點,從而節省閱讀時間,提高效率。

上週,機器之心釋出了一篇名為《李飛飛親自撰文:大模型不存在主觀感覺能力,多少億引數都不行》的文章。我們將該文章連結分別丟給騰訊元寶和 GPT-4o,讓他倆總結連結內容。

騰訊元寶:圖片

GPT-4o:圖片

騰訊元寶領到任務後「埋頭總結」,從李飛飛的看法、空間智慧與 AI、AI 感覺能力的爭議、AI 感覺能力的錯誤推理、AI 與人類智慧的區別以及未來展望等 6 個方面進行了概括。

不得不說,它總結得還挺到位。

不過,GPT-4o 臨時掉鏈子,「我無法直接訪問所提供連結的具體內容」,還讓我們提供文章描述或要點,GPT-4o 是懶得明明白白。

這一 part,騰訊元寶完勝!

Round4:AI 作圖

多模態也是重點考察物件。

我們就來看看這兩個 AI 的畫功。

我們輸入同一提示詞:請幫我畫一幅畫一個可愛的卡通女孩穿著裙子,抱著一隻白色的小貓,全身,黃色背景,Keith Haring 風格的塗鴉,清晰的插圖,大膽的線條和純色,簡單的細節,極簡主義,黃色背景。

GPT-4o「罷工」了,原因是受內容政策的限制,無法生成與 Keith Haring 風格相關的影像。

圖片

我們刪除「Keith Haring」關鍵詞後,GPT-4o 才開始幹活:

圖片

騰訊元寶倒是「好說話」,直接出圖:

圖片

騰訊元寶這種不打折扣的響應當然更討普通使用者的歡心,不過這也可能涉及到版權問題。

一口氣上線 76 款智慧體,主打實用好玩

智慧體的風也刮到了騰訊元寶。

在介面頂端的「發現」一欄,騰訊元寶推出了涵蓋工作、娛樂、效率、學習、角色五大類,共計 76 款智慧體。目測大部分是使用者或開發者自行建立釋出的。

其中效率類智慧體包括 PPT 達人、工作彙報鬼才、logo 設計小咖、宣傳稿生成器、招聘大師等,主打一個實用。

而生活娛樂類則聚焦「好玩」,比如電影推薦、周公解夢,還有同款熱門遊戲《完蛋!我被美女包圍了》……

此外,面對眼花繚亂的智慧體,騰訊元寶還製作了首發精選榜單,創意繪畫、百變 AI 頭像、口語陪練、創意貼貼貼、超能翻譯官這 5 款智慧體入選。

創意貼貼貼

小紅書上有一類小眾賽道火出圈,那就是萌寵貼紙,而「創意貼貼貼」就瞄準這一需求。

使用者只需輸入文字或上傳圖片,然後選擇風格即可。

圖片

我們上傳了一張潦草小狗的圖片,最終生成的貼紙效果如下:

圖片

也可以輸入提示詞以生成貼畫。提示詞:吃冰淇淋的小女孩,可愛風格。

圖片

百變 AI 頭像

該功能允許使用者利用 AI 技術生成個性化頭像,還可以與 QQ 二維碼融合,為使用者的 QQ 賬號增添個性化元素。

該功能還提供芭比、多巴胺、復古繁花、白領精英等 12 種風格,我們選擇「復古港漫」風格,然後上傳一張黴黴的照片。

值得注意的是,上傳圖片要求五官清晰,解析度超過 500,避免畫質模糊、面部遮擋、頭部過小或者多人照片。

生成的效果如下所示:

圖片

雖然生成的頭像與黴黴八竿子打不著,不過畫風還蠻好看的。

由於操作簡單,我們玩到停不下來。

這是芭比風格的蘇菲・瑪索:

圖片

復古繁花風格的小李子:

圖片

傻瓜級操作,分分鐘手搓一個智慧體

騰訊元寶還上線「建立智慧體」功能,把製作門檻徹底打下來了。

使用者只要點選「建立智慧體」,然後按照提示輸入名稱、角色設定、簡介、開場白、預置指令,並選擇音色、上傳 logo 即可。

例如我們建立的「朋友圈發瘋文學」生成器,分分鐘搞定。

圖片

我們讓它發個「人生歪理,句句在理」的文案,該智慧體一股腦吐出來 8 句,例如「人生就像打遊戲,不管多努力,總有那麼一關過不去。但是,我們依然熱愛這個遊戲,因為關關難過,關關過,這就是人生。」

嘿,還真邏輯自洽了。

不過,騰訊元寶自定義的智慧體還是過於「正經」了,不少句子說得確實在理,但不夠歪,不夠有梗。

如果懶得動手,也可以讓 AI 代勞。例如我們只輸入名稱「古人也 emo」,點選「AI 生成」魔法棒,幾秒鐘 AI 就把剩下的工作完成了。我們只要在細節上調整一下即可。

圖片

相關文章