騰訊大模型App元寶上線，我們用它「單挑」了下GPT-4o

机器之心發表於2024-05-30

原文網址 : https://www.jiqizhixin.com/articles/2024-05-30-4

大模型APPGPT

騰訊元寶 VS GPT-4o，究竟誰技高一籌？

最近，騰訊一改往日的慢性子，忽然「卷」起來了：

5 月 14 日，騰訊全面開源混元文生圖模型；

5 月 17 日，騰訊釋出一站式 AI 智慧體創作與分發平臺「騰訊元器」；

5 月 30 日，基於混元大模型的 App「騰訊元寶」正式上線，目前應用商店已經可以下載。

騰訊元寶是一個基於混元大模型及搜尋引擎驅動的高效資訊整合工具，介面設計簡潔，可以搜尋實時資訊，也可以對上傳的多格式文件進行總結、翻譯，還能語音對話練習口語。

而此次騰訊元寶產品能力升級的背後，是騰訊混元底層模型的持續迭代。

據介紹，自 2023 年 9 月首次亮相以來，騰訊混元大模型的引數規模已從千億升級至萬億，預訓練語料從萬億升級至 7 萬億 tokens，並率先升級為多專家模型結構（MoE），整體效能相比 Dense 版本提升超 50%。

我們第一時間拿到了騰訊元寶的體驗資格，今天就拿出來 “遛一遛”。

騰訊元寶「單挑」GPT-4o

相比此前測試階段的混元小程式版本，面向工作效率場景，騰訊元寶提供了 AI 搜尋、AI 總結、AI 寫作等核心能力。

沒有對比就沒有發言權。我們決定讓騰訊元寶和大洋彼岸的 GPT-4o 進行較量。

Round 1：AI 搜尋

如今，AI 搜尋是香餑餑。

無論是「搜尋之王」谷歌還是新晉頂流 OpenAI，都在 AI 搜尋上做文章，甚至成立不到 2 年的 Perplexity AI 都成了黃仁勳的「心頭好」。英偉達創始人黃仁勳曾公開表示，自己最愛用的 AI 工具是 Perplexity。

騰訊元寶自然上線了這一功能。

要知道，微信公眾號每天都生成大量優質深度文章，背靠這棵大樹，騰訊的 AI 搜尋功能有著得天獨厚的優勢。

我們在「騰訊元寶」下方輸入框中輸入「現在適合買黃金嗎？」

（溫馨提示：投資需謹慎）

騰訊元寶的回答：

GPT-4o 的回答：

首先，從響應速度上來說，二者可以說是不相上下，幾秒鐘時間，騰訊元寶就參考完 9 篇資料，並給出了回答。

其次，從回答內容上來說，騰訊元寶似乎更勝一籌。GPT-4o 僅僅給出了購買黃金需要考慮的幾個因素，而騰訊元寶的答案涵蓋黃金價格走勢預測、投資風險以及投資策略，而且每條均有引用，這就避免了大模型「滿嘴跑火車」的缺點。

此外，騰訊這次真的把好鋼用在了刀刃上。除了推薦了相關公眾號文章外，騰訊元寶還在首頁上線了快速播報功能，對當前最新、最重要的資訊進行摘要總結，而且每條資訊都會提供騰訊新聞的連結。

這一局，騰訊元寶勝！

Round2：文件總結

該功能旨在幫助使用者高效獲取和處理文件資訊，騰訊元寶能夠處理多種格式的文件，例如 PDF、Word、Excel 等。

前幾天騰訊正好釋出了 2024 年第一季度財報，我們下載了一份。

這份長達 48 頁、3.2 萬字的財報，不僅數字多，還是繁體字，看得人腦瓜子疼。這時 AI 就派上用場了。

我們將這份財報分別上傳到騰訊元寶和 GPT-4o，讓他們各自分析一下騰訊開年第一季度的營收情況。

騰訊元寶：

GPT-4o:

總體來看，它們回答得條分縷析。兩相比較 GPT-4o 的答案更加豐富，除了財務表現和主要業務表現外，GPT-4o 還提供了運營資料、財務狀況等。

財務報表重在準確。我們拿著這堆資料一一校對，果然還是找到了 bug。

騰訊一季度的其他收入應為 20.6 億元，騰訊元寶卻寫成 206 億元，在換算過程中把小數點點錯了。

而 GPT-4o 的資料全部正確。

這一局，GPT-4o 勝！

Round3：網頁總結

這是一種自動提取網頁關鍵資訊的功能，在使用者瀏覽大量資訊時，它能快速抓住網頁內容的重點，從而節省閱讀時間，提高效率。

上週，機器之心釋出了一篇名為《李飛飛親自撰文：大模型不存在主觀感覺能力，多少億引數都不行》的文章。我們將該文章連結分別丟給騰訊元寶和 GPT-4o，讓他倆總結連結內容。

騰訊元寶：

GPT-4o:

騰訊元寶領到任務後「埋頭總結」，從李飛飛的看法、空間智慧與 AI、AI 感覺能力的爭議、AI 感覺能力的錯誤推理、AI 與人類智慧的區別以及未來展望等 6 個方面進行了概括。

不得不說，它總結得還挺到位。

不過，GPT-4o 臨時掉鏈子，「我無法直接訪問所提供連結的具體內容」，還讓我們提供文章描述或要點，GPT-4o 是懶得明明白白。

這一 part，騰訊元寶完勝！

Round4：AI 作圖

多模態也是重點考察物件。

我們就來看看這兩個 AI 的畫功。

我們輸入同一提示詞：請幫我畫一幅畫一個可愛的卡通女孩穿著裙子，抱著一隻白色的小貓，全身，黃色背景，Keith Haring 風格的塗鴉，清晰的插圖，大膽的線條和純色，簡單的細節，極簡主義，黃色背景。

GPT-4o「罷工」了，原因是受內容政策的限制，無法生成與 Keith Haring 風格相關的影像。

我們刪除「Keith Haring」關鍵詞後，GPT-4o 才開始幹活：

騰訊元寶倒是「好說話」，直接出圖：

騰訊元寶這種不打折扣的響應當然更討普通使用者的歡心，不過這也可能涉及到版權問題。

一口氣上線 76 款智慧體，主打實用好玩

智慧體的風也刮到了騰訊元寶。

在介面頂端的「發現」一欄，騰訊元寶推出了涵蓋工作、娛樂、效率、學習、角色五大類，共計 76 款智慧體。目測大部分是使用者或開發者自行建立釋出的。

其中效率類智慧體包括 PPT 達人、工作彙報鬼才、logo 設計小咖、宣傳稿生成器、招聘大師等，主打一個實用。

而生活娛樂類則聚焦「好玩」，比如電影推薦、周公解夢，還有同款熱門遊戲《完蛋！我被美女包圍了》……

此外，面對眼花繚亂的智慧體，騰訊元寶還製作了首發精選榜單，創意繪畫、百變 AI 頭像、口語陪練、創意貼貼貼、超能翻譯官這 5 款智慧體入選。

創意貼貼貼

小紅書上有一類小眾賽道火出圈，那就是萌寵貼紙，而「創意貼貼貼」就瞄準這一需求。

使用者只需輸入文字或上傳圖片，然後選擇風格即可。

我們上傳了一張潦草小狗的圖片，最終生成的貼紙效果如下：

也可以輸入提示詞以生成貼畫。提示詞：吃冰淇淋的小女孩，可愛風格。

百變 AI 頭像

該功能允許使用者利用 AI 技術生成個性化頭像，還可以與 QQ 二維碼融合，為使用者的 QQ 賬號增添個性化元素。

該功能還提供芭比、多巴胺、復古繁花、白領精英等 12 種風格，我們選擇「復古港漫」風格，然後上傳一張黴黴的照片。

值得注意的是，上傳圖片要求五官清晰，解析度超過 500，避免畫質模糊、面部遮擋、頭部過小或者多人照片。

生成的效果如下所示：

雖然生成的頭像與黴黴八竿子打不著，不過畫風還蠻好看的。

由於操作簡單，我們玩到停不下來。

這是芭比風格的蘇菲・瑪索：

復古繁花風格的小李子：

傻瓜級操作，分分鐘手搓一個智慧體

騰訊元寶還上線「建立智慧體」功能，把製作門檻徹底打下來了。

使用者只要點選「建立智慧體」，然後按照提示輸入名稱、角色設定、簡介、開場白、預置指令，並選擇音色、上傳 logo 即可。

例如我們建立的「朋友圈發瘋文學」生成器，分分鐘搞定。

我們讓它發個「人生歪理，句句在理」的文案，該智慧體一股腦吐出來 8 句，例如「人生就像打遊戲，不管多努力，總有那麼一關過不去。但是，我們依然熱愛這個遊戲，因為關關難過，關關過，這就是人生。」

嘿，還真邏輯自洽了。

不過，騰訊元寶自定義的智慧體還是過於「正經」了，不少句子說得確實在理，但不夠歪，不夠有梗。

如果懶得動手，也可以讓 AI 代勞。例如我們只輸入名稱「古人也 emo」，點選「AI 生成」魔法棒，幾秒鐘 AI 就把剩下的工作完成了。我們只要在細節上調整一下即可。

當我們談深度學習時，我們用它落地了什麼？
2018-08-05
深度學習
我們要不要上線「個人app」？
2018-05-12
APP
從騰訊大模型的「實用」路線，我們看到了企業應用AI的新方向
2024-09-09
大模型AI
挑戰拯救痴心“舔狗”，我和大模型都盡力了
2024-04-24
大模型
阿里雲崩了，總結我們從雲上搬到線下經歷了什麼
2023-11-13
阿里
騰訊混元大模型全面降價！混元-lite即日起免費
2024-05-22
大模型
合合資訊大模型“加速器”重磅上線
2024-07-08
大模型
AI偏科的毛病「治」得咋樣了？我們實測了6款大模型
2024-12-02
AI大模型
WOT大會日程上線：我們找來數十位大模型實踐企業現身說法
2024-05-20
大模型
使用騰訊元寶+markmap生成思維導圖
2024-06-13
當我們談深度學習時，我們用它落地了什麼？阿里雲內容安全功能全新升級
2018-08-26
深度學習阿里
在騰訊釋出會上，我們發現了一款快手自研的中重度手遊
2021-05-19
騰訊雲上線DeepSeek模型API介面，率先支援聯網搜尋！
2025-02-08
模型API
一週上線 4 次，我們拼了！
2024-08-29
Windows 95 被做成了一款 app，我們在 MacBook 上體驗了它
2018-09-06
WindowsAPPMac
GC是什麼？為什麼我們要去使用它
2019-08-05
GC
騰訊釋出混元大模型Turbo版本用AI助力場景創新
2024-09-06
大模型AI
搶瘋了，騰訊給大模型人才，定了一個前所未有的標準
2024-06-21
大模型
8人小團隊單挑OpenAI，半年仿出GPT-4o，還開源了
2024-07-04
OpenAIGPT
荔枝財報背後：騰訊、位元組跳動、快手們都盯上了線上音訊
2020-11-16
音訊
訊息代理與事件代理：何時使用它們
2023-11-08
事件
出道即巔峰騰訊“混元“AI大模型實現國際權威跨模態評測榜單大滿貫
2022-04-21
AI大模型
去騰訊面試了，我自信滿滿！
2023-12-05
面試
上線首日衝頂App Store免費榜，騰訊首款AR探險手遊會大熱嗎？
2019-04-12
APP
如何更好的做單元測試並用它來提升程式碼質量（下）
2018-09-25
最新中文大模型測評出爐，騰訊混元居卓越領導者象限
2024-05-06
大模型
騰訊混元又來開源，一出手就是最大MoE大模型
2024-11-06
大模型
騰訊混元大模型核心論文曝光：Scaling law、MoE、合成資料以及更多
2024-11-22
大模型
我們測試了上萬款應用程式，總結了APP測試流程和常見問題
2019-11-22
APP
我不寫單元測試，被批了
2022-12-13
神仙打架：大模型能力線上比拼
2023-05-13
大模型
我們的世界可能已經在元宇宙深處了。
2022-05-25
元宇宙
全是寶！20款優質高效的線上協作工具任你挑，就是這麼強大！
2019-05-22
網易、騰訊寶可夢手遊大冒險
2019-09-26
站上大模型制高點：我們給不輸GPT-4的文心大模型4.0，來了一場技術揭秘
2023-10-18
大模型GPT
HyperWorks一維單元建立與模型連線管理
2024-11-19
模型
今天我們來了！
2021-03-19
中國大模型頭名易主：全球盲測榜單上，Yi-Large與GPT-4o中文並列第一
2024-05-21
大模型GPT

騰訊大模型App元寶上線，我們用它「單挑」了下GPT-4o

相關文章