太貼心！OpenAI釋出了類人化重大版本：GPT-4o

今天，OpenAI 釋出了 GPT-4o。它就是我們夢寐以求的鋼鐵俠。

下面是迄今為止最不可思議的 5 個例子：

1、實時翻譯
2、情緒和人臉檢測：
3、透過語音指令理解/除錯程式碼
4、生成各種基於情感的聲音：
5、從視覺上理解影像、繪圖和程式碼，編碼 ELO 能力能提高 100 點

GPT-4o（"o "表示 "omni"）是向更自然的人機互動邁出的一步。

這應該是蘋果 Siri 真正樣子

它將面向免費使用者並透過 API 提供。

===============================================================
今天openai 讓大家失望了......別失望。現場直播面向的是普通消費者。很酷的東西都 "藏 "在他們的網站上：

在人工智慧生成的影像中加入文字方面，領先於其他任何人
對自己的文字影像能力非常自信，可以用 GPT4-o 建立字型
3d 渲染....
聲音效果合成，而不僅僅是語音
結合實際情況上下文，有效地進行一次穩定的擴散微調！

=================================================================
OpenAI剛剛釋出了ChatGPT-4 o，它將徹底改變AI助手遊戲。
12個瘋狂的例子：

實時視覺助理：幫助盲人叫車上車
幫助學生實時學習
實時翻譯
會議助理
可實時中斷並“改變情緒”：見風使舵
幫助您在影像中新增多行文字
實現會議記錄
三維物體合成
海報創作：一致的多步驟影像建立，精確的文字渲染
詩意排版
有照片轉換為漫畫大頭照
品牌形象定位
將文字生成各種字型：利用擴散影像生成文字的新技術；輕鬆實現影像生成的一致性；即使是手寫草書也能生成一致的文字

=================================================================
OpenAI以AI的另一個重大突破贏得了網際網路。它將他們的ChatGPT功能提升到一個全新的水平。以下是他們今天公佈的7項革命性創新：

OpenAI推出了“GPT-4 Omni”，增強了其AI模型，以支援語音，文字和視覺，可供所有使用者使用，包括免費帳戶。
GPT—4 Omni'配備了新的語音助手。

- 它可以處理中斷，
- 實時響應
- 甚至能感受到

聽起來像"她"

ChatGPT獲得實時影片模式。您可以使用手機攝像頭提問。

您現在可以免費使用GPT商店和GPT-4視覺，瀏覽，記憶體和高階資料分析。這對非付費使用者來說是一座金礦。

ChatGPT現在有SELFIE情感檢測，它可以真實的時間檢測你的每一個情緒。

OpenAI還展示了其新的GPT—4o模型，可以進行實時翻譯

7/ ChatGPT有了了桌面應用程式和下一代語音和影片功能。 <ul>
======================================================================
網友的llm 工具剛剛支援OpenAI 的新 GPT-4o模型：點這裡

pipx install llm
llm keys set openai
# Paste API key here
llm -m 4o <font>"Fascinate me"

要升級現有安裝，請執行此操作：

llm install --upgrade llm

自 0.13 版起新增九個外掛：

llm-claude-3 支援 Anthropic 的 Claude 3 模型系列。
llm-command-r 支援 Cohere 的 Command R 和 Command R Plus API 模型。
llm-reka 透過其 API 支援 Reka 系列模型。
llm-perplexity 由 Alexandru Geana 設計，支援 Perplexity Labs 的 API 模型，包括 llama-3-sonar-large-32k-online （可線上搜尋事物）和 llama-3-70b-instruct。
llm-groq 由 Moritz Angermann 提供，用於訪問由 Groq 託管的快速模型。
llm-fireworks 支援由 Fireworks AI 託管的模型。
llm-together 增加了對 Together AI 廣泛的公開許可託管模型系列的支援。
llm-embed-onnx 提供了可使用 ONNX 模型框架執行的七種嵌入模型。
llm-cmd 接受 shell 命令提示符，執行該提示符並將結果填充到 shell 中，這樣你就可以檢視、編輯它，然後按 <enter> 執行或按 ctrl+c 取消。

=========================================================================
與 GPT-4 相比，GPT-4o 的速度和額外的編碼能力使其在分析方面非常強大。
"分析它。視覺化它。進行復雜分析"
給定一個超級英雄的資料集，在沒有其他背景上下文的情況下，它可以進行非常令人印象深刻的視覺化、PCA、聚類分析......

只需一個命令就能進行全面分析。不錯。
這次PCA 分析是真的？太多大模型胡編亂造！

===========================================================================
說 openai 的演示令人失望的人：

要麼是不瞭解這項技術，
要麼就是裝作不以為然。

它之所以這麼快，是因為它是一個能理解一切的單一整合模型，而不是使用多個模型。

=====================================================================
gpt4o = gpt4.75
gpt4o 比 gpt4 的改進幅度要比 3.5 相對 3 大得多!

現在，它幾乎可以完成文字、影像、音訊領域的所有工作!

======================================================================
網友討論：

1、測試者手持蘋果Iphone與gpt4o對話風趣的對話，像及了十年前剛剛釋出的Siri！當然，這可能是 OpenAI 為蘋果提供的演示，因為蘋果已經決定和CHatGPT合作：

兩家公司一直在“敲定在蘋果 iOS 18 中使用 ChatGPT 功能的協議條款”。目前尚不清楚這款流行的聊天機器人如何與蘋果的軟體整合。
該協議將使 ChatGPT 成為 Apple 預計為 iPhone 帶來的一系列人工智慧功能中的另一個工具。
蘋果在下個月舉行的年度全球開發者大會上預計將宣佈iOS 18 中的多項人工智慧功能，據稱這是 iPhone 作業系統多年來最大的升級之一。

2、老實說，我真的無法想象15年後的世界會是什麼樣子，我們是多麼幸運能夠見證即將發生的一切，真的令人難以置信

3、如果“奇點”的概念是準確的，那麼我們正處於它的早期階段。這十年即將發生的事情將使過去的 40 年看起來像石器時代。

4、

1980-1995：個人電腦
1995-2008：網際網路
2008-2015：智慧手機
2015-2020：這裡發生了什麼？
2020-？？？：人工智慧

5、我今年 66 歲了。幾乎每天都像我小時候在 60 年代和 70 年代讀過的科幻故事一樣。

6、我花了一些時間在操場上測試了新型號的影像識別和推理能力，結果讓我大吃一驚。它能從我糟糕的筆跡中找出字串，而這些字串在寫滿筆記和方程式的紙上幾乎無法辨認。(順便說一句，它在所有方面都是正確的）。

它能識別出不同的文字和影像，這些文字和影像都是用拙劣的塗鴉畫成的。
它甚至能從部分上下文中識別出字串！我簡直不敢相信它有這麼好！

7、我在公交車上跪下來流下了喜悅的淚水，希望這些技術能夠讓人類進入黃金時代

8、總結：

與人工智慧進行互動式對話的能力（比當前的聊天應用程式要好得多）。
AI可以充當輔導員，幫助孩子做作業。不僅僅是給他們答案，還要幫助他們理解主題材料。
看起來他們增強了人工智慧的個性。所以感覺不太像人工智慧，而更像一個正常人。
絕對可以看到人們在聚會模式下使用它。

太貼心！OpenAI釋出了類人化重大版本：GPT-4o

太貼心！OpenAI釋出了類人化重大版本：GPT-4o

相關文章