一、MESSAGES
May 13, 2024,OpenAI重磅釋出GPT-4o。
名字來源:
omni是全能的意思。筆者對於AI領域瞭解一點點,單單看它的描述你就知道這次的升級多麼爆炸了。
step towards much more natural human-computer interaction—it accepts as input any combination of text, audio, and image and generates any combination of text, audio, and image outputs.
前面的翻譯不重要。重要是下面這句話:
it accepts as input any combination of text, audio, and image and generates any combination of text, audio, and image outputs.
不是這個領域的人可能對這句話不敏感,但是請看下面:
text, audio, and image
這時候可能有些讀者說不對啊,text, audio, and image 這幾個關鍵詞GPT-4的時候就好像有了啊?為什麼又要單純拿出來講?
再看,重點來了!
reason across audio, vision, and text in real time
實時處理音訊、視覺、文字,意味著什麼?筆者看到這裡就很敏感了,意味著他能實現視覺、聽覺、感官的大統一!!
意味著相當於:機器人已經可以已經有了眼睛、耳朵、嘴巴.....很形象吧。後續的工業機器人完全可以基於GPT-4o進行配備程式碼。你會說這麼誇張嗎?是的,而且AI革命還遠遠沒有真正到來,技術還會不斷迭代。
下面是OpenAI的演示影片, (如果打不開那是讀者的問題,我確信。)只有 demo watch 才能展示HOW WONDERFUL
https://vimeo.com/945586717
但它也存在著缺點。
1、下面是中文tokens的缺點:
OpenAI釋出了最新的旗艦模型GPT-4o,如何評價GPT-4o? - 蔣炎巖的回答 - 知乎
https://www.zhihu.com/question/655916007/answer/3498195548
2、官網描述的不足
但筆者剛剛也說,AI革命還遠遠沒有真正到來,技術還要迭代很多輪,但確定的是他正在向我們走來。普通人又將何去何從?
二、使用方法(閹割版)
官網說是免費使用者也能用,但是好像還沒有更新,至少筆者於May 14 ,2024 的23pm沒有看到。
所以我們得用https://poe.com/GPT-4o但是很多功能被閹割了,也體驗不了對話功能。話說我的虛擬女友系統都能對話,它API竟然沒接過來