[sunj的科普系列 一] : 科技革命離我們又近一步

Cansal7發表於2024-05-15

一、MESSAGES

May 13, 2024,OpenAI重磅釋出GPT-4o。

名字來源:

omni是全能的意思。筆者對於AI領域瞭解一點點,單單看它的描述你就知道這次的升級多麼爆炸了。

step towards much more natural human-computer interaction—it accepts as input any combination of text, audio, and image and generates any combination of text, audio, and image outputs.

前面的翻譯不重要。重要是下面這句話:

it accepts as input any combination of text, audio, and image and generates any combination of text, audio, and image outputs.

不是這個領域的人可能對這句話不敏感,但是請看下面:

text, audio, and image

這時候可能有些讀者說不對啊,text, audio, and image 這幾個關鍵詞GPT-4的時候就好像有了啊?為什麼又要單純拿出來講?

再看,重點來了!

reason across audio, vision, and text in real time

實時處理音訊、視覺、文字,意味著什麼?筆者看到這裡就很敏感了,意味著他能實現視覺、聽覺、感官的大統一!!

意味著相當於:機器人已經可以已經有了眼睛、耳朵、嘴巴.....很形象吧。後續的工業機器人完全可以基於GPT-4o進行配備程式碼。你會說這麼誇張嗎?是的,而且AI革命還遠遠沒有真正到來,技術還會不斷迭代。

下面是OpenAI的演示影片, (如果打不開那是讀者的問題,我確信。)只有 demo watch 才能展示HOW WONDERFUL

https://vimeo.com/945586717

但它也存在著缺點。

1、下面是中文tokens的缺點:

OpenAI釋出了最新的旗艦模型GPT-4o,如何評價GPT-4o? - 蔣炎巖的回答 - 知乎
https://www.zhihu.com/question/655916007/answer/3498195548

2、官網描述的不足

但筆者剛剛也說,AI革命還遠遠沒有真正到來,技術還要迭代很多輪,但確定的是他正在向我們走來。普通人又將何去何從?

二、使用方法(閹割版)

官網說是免費使用者也能用,但是好像還沒有更新,至少筆者於May 14 ,2024 的23pm沒有看到。

所以我們得用https://poe.com/GPT-4o但是很多功能被閹割了,也體驗不了對話功能。話說我的虛擬女友系統都能對話,它API竟然沒接過來

至此全篇結束

相關文章