我們上手實測GPT-4o:速度快到飛起,還能直出板書,但影片分析遜色

机器之能發表於2024-05-16

機器之能原創

作者:山茶花 Cardina

作為 OpenAI 有史以來最好的模型, GPT-4o 究竟強在哪裡?

你要知道,它是一個原生的多模態大模型,可以跨文字、音訊和影片進行實時推理——能聽、能說、能看、零延時、可打斷,還會「看人臉色」。

更重要的是,它還免費!

趕緊薅一把,你會知道什麼是真・科幻照進現實!

實測 GPT-4o:速度飛快,視覺能力驚豔

開啟 ChatGPT 官網,就會收到 GPT-4o 的試用邀請,點選「立即試用」即可進入對話頁面。

如果沒有收到邀請,可能是灰度測試階段,稍等一會再重新進入。

圖片

然後,直接在下方的對話方塊中與其進行對話,系統會自動切換到 4o 版本。

圖片

值得注意的是,免費使用者每天使用 GPT-4o 的次數有限,超出限制後要麼升級為付費使用者,要麼只能用 GPT-3.5。

Plus 使用者每月 20 美元,可享受高達 5 倍的訊息上限。

圖片

許多 AI 公司正在將 GPT-4o 引入他們的介面。比如,Poe 使用者可以直接勾選 GPT-4o 服務。

圖片

我們簡單薅了一把羊毛,還是被 GPT-4o 的效果驚到了。

首先,這個響應速度太爽了!快到飛起,問題剛輸入,答案就嘩啦嘩啦出來了。

圖片

有網友發現製作單個 html 檔案,僅需 6 秒;分析電子表格資料不到 30 秒......

我們上手實測GPT-4o:速度快到飛起,還能直出板書,但影片分析遜色

影片連結:https://mp.weixin.qq.com/s/T80vdLXjMYUcYPfyA1yqSg

其次,GPT-4o 具備聯網功能,可以蒐集最新的新聞資訊。

我們讓它蒐集 2024 年 5 月 13 日 AI 領域的新聞,它不僅對新聞進行了概括整理,還附上鍊接。

圖片

面對同樣的要求,GPT-4 卻直接「罷工」:

圖片

最後,GPT-4o 的視覺能力也挺驚豔。我們分別上傳了櫻桃和手寫字跡的圖片,讓它辨認,全部回答正確。

圖片
圖片

網友發現,即使是 1800 年代的手寫筆跡,也能出色地識別...... 了不起。

圖片

更離譜的是,GPT-4o 還能生成板書圖片,圖中的板書簡直跟人類寫的沒啥差別。要知道,對於大模型來說,「寫字」可是一大難題。

圖片

賈樟柯紀錄片《一直游到海水變藍》的海報設計極具巧思,正著看是波濤洶湧的大海,正好扣題,倒過來則是連綿不絕的群山,又與片中核心思想相呼應。

我們就把這張海報「喂」給 GPT-4o,還真別說,它回答的有板有眼,其中的深意均被 get 到。

圖片

不過,它的影片分析能力就遜色一些。

我們上傳了一段 7 秒的《泰坦尼克號》經典片段,並讓 GPT-4o 分析這個影片。

圖片

它迅速概括了該影片時長、每秒幀數以及解析度等。不過,當問及這出自哪部電影以及畫面中的男女主分別由誰扮演時,它「一問三不知」。


圖片

網友們瘋狂「調戲」GPT-4o

眼下,給 GPT-4o 瘋狂「整活」的影片已經在社交媒體上發酵,相當一部分可以歸為「飯碗不保」系列。

當初 ChatGPT 剛上線,編輯們驚呼「完蛋,飯碗要砸」;GPT Store 推出後,創業公司老闆們大驚失色;年初時 Sora 只是放出了 Demo 影片,就讓演員們人心惶惶……

如今 GPT-4o 一出,客服、家教、秘書、同聲傳譯「岌岌可危」,就連導盲犬也要「下崗」。

1.「充當」導盲犬

GPT-4o 現在可以實時檢視和分析事物,可以幫助盲人描述當前環境,還能幫忙叫車。唯一的 bug 是需要隨時舉著手機,要是能做成眼鏡就更 perfect 了。

我們上手實測GPT-4o:速度快到飛起,還能直出板書,但影片分析遜色

影片連結:https://mp.weixin.qq.com/s/T80vdLXjMYUcYPfyA1yqSg

2.「充當」語音客服

給客服 GPT-4o 找茬兒?很難!哪怕是處女座!

一名叫 Joe 的小哥編了一個情景:ACME Telco 寄的新 iphone 無法使用,他讓一個 GPT-4o 充當客服,另一個充當他的助手,幫他處理這事。

我們上手實測GPT-4o:速度快到飛起,還能直出板書,但影片分析遜色

影片連結:https://mp.weixin.qq.com/s/T80vdLXjMYUcYPfyA1yqSg

助手小 A 先陳述了事情的經過,接著客服小 B 就開始「連環問」:

Joe 是什麼時候收到新 iphone 的?你能告訴我訂單號碼嗎?裝置有物理性損壞嗎?Joe 是想把 iphone 退回店裡還是郵寄回去?你能告訴我 Joe 的郵件地址嗎?你能幫他看一下我剛發的郵件嗎?

最終,事情完美解決 ——AI 客服對答如流,情緒穩定,找不出瑕疵。

3.「充當」家教老師

在一段廣為傳播的影片中,OpenAI 邀請可汗學院的可汗和他兒子一起使用 GPT-4o 來輔導孩子做數學題。

我們上手實測GPT-4o:速度快到飛起,還能直出板書,但影片分析遜色

影片連結:https://mp.weixin.qq.com/s/T80vdLXjMYUcYPfyA1yqSg

期間,GPT-4o 循循善誘,即使孩子回答錯了,它仍耐心地進行指導和鼓勵。幫助家長降低心梗機率的 「人」有了,還要繼續砸銀子給家教嗎?

4.「充當」會議秘書

大語言模型產品天生是個打工人的命,GPT-4o 也不例外 —— 當完了老師又被拉進了線上會議,跟一群「不正經」的員工們掰扯著經典的「貓狗大戰」。

它不僅能充當會議秘書,總結會議內容,還能在領導 cue 時對答如流。

我們上手實測GPT-4o:速度快到飛起,還能直出板書,但影片分析遜色

影片連結:https://mp.weixin.qq.com/s/T80vdLXjMYUcYPfyA1yqSg

5.「充當」翻譯

因為外語能力出色,GPT-4o 還能充當同傳,實時翻譯,一如那條巴別魚。

搞笑的是,GPT-4o 還化身「中文老師」教一群老外學中文,不過水平「一瓶不滿,半瓶咣噹」,教出的學生個個自帶口音,還夸人家「真是個語言天才」。

我們上手實測GPT-4o:速度快到飛起,還能直出板書,但影片分析遜色

影片連結:https://mp.weixin.qq.com/s/T80vdLXjMYUcYPfyA1yqSg

此外,GPT-4o 還有一堆虛頭巴腦的玩法,情緒價值直接拉滿。

例如,憑藉出色的語音合成能力,OpenAI 總裁 Greg Brockman 亮出了「拿手絕活」—— 讓兩個 GPT-4o 實時嘮嗑。

下次開長途,如果將 GPT-4o 連線到汽車的語音功能,啟動對聊模式,是不是就有人陪咱一路聊天了?

Greg 甚至讓他們即興創作了一首歌曲,當然啦,唱功不咋地,旋律很「感人」。

我們上手實測GPT-4o:速度快到飛起,還能直出板書,但影片分析遜色

影片連結:https://mp.weixin.qq.com/s/T80vdLXjMYUcYPfyA1yqSg

下面這個影片中的小姐姐更「簡單粗暴」。

我們上手實測GPT-4o:速度快到飛起,還能直出板書,但影片分析遜色

影片連結:https://mp.weixin.qq.com/s/T80vdLXjMYUcYPfyA1yqSg

直接讓 GPT-4o 分飾兩角 ——ChatGPT 和 O,其中 ChatGPT 聲音低沉洪亮,像一把大提琴,而 O 則有著法國女高音般的激昂聲音。

它們要以「五月十日的舊金山」這一主題來個男女二重唱,期間還各種刁難,例如加和聲,節奏加快等,它通通能搞定。

GPT-4o 還能自編自唱輕柔搖籃曲、唱生日歌,那調皮的語氣活脫脫地就是個真人。

我們上手實測GPT-4o:速度快到飛起,還能直出板書,但影片分析遜色

影片連結:https://mp.weixin.qq.com/s/T80vdLXjMYUcYPfyA1yqSg

此外,朋友聚會可以請 GPT-4o 當裁判;出門面試,讓 GPT-4o 當穿搭助理;講冷笑話尷尬冷場,GPT-4o 專業捧哏;心情不爽它閉著眼一頓猛誇…… 它還能化身「AI 女友」,如果安在人形機器人上,《Her》就真的來了。

我們上手實測GPT-4o:速度快到飛起,還能直出板書,但影片分析遜色

影片連結:https://mp.weixin.qq.com/s/T80vdLXjMYUcYPfyA1yqSg

GPT-4o 剛熱了個身就遭到全網熱捧,天知道後面還會整出什麼石破天驚的玩法?

相關文章