今天,OpenAI 釋出了 GPT-4o。它就是我們夢寐以求的鋼鐵俠。
下面是迄今為止最不可思議的 5 個例子:
1、實時翻譯
2、情緒和人臉檢測:
3、透過語音指令理解/除錯程式碼
4、生成各種基於情感的聲音:
5、從視覺上理解影像、繪圖和程式碼,編碼 ELO 能力能提高 100 點
GPT-4o("o "表示 "omni")是向更自然的人機互動邁出的一步。
這應該是蘋果 Siri 真正樣子
它將面向免費使用者並透過 API 提供。
===============================================================
今天openai 讓大家失望了......別失望。現場直播面向的是普通消費者。 很酷的東西都 "藏 "在他們的網站上:
- 在人工智慧生成的影像中加入文字方面,領先於其他任何人
- 對自己的文字影像能力非常自信,可以用 GPT4-o 建立字型
- 3d 渲染....
- 聲音效果合成,而不僅僅是語音
- 結合實際情況上下文,有效地進行一次穩定的擴散微調!
=================================================================
OpenAI剛剛釋出了ChatGPT-4 o,它將徹底改變AI助手遊戲。
12個瘋狂的例子:
- 實時視覺助理:幫助盲人叫車上車
- 幫助學生實時學習
- 實時翻譯
- 會議助理
- 可實時中斷並“改變情緒”:見風使舵
- 幫助您在影像中新增多行文字
- 實現會議記錄
- 三維物體合成
- 海報創作:一致的多步驟影像建立,精確的文字渲染
- 詩意排版
- 有照片轉換為漫畫大頭照
- 品牌形象定位
- 將文字生成各種字型:利用擴散影像生成文字的新技術;輕鬆實現影像生成的一致性;即使是手寫草書也能生成一致的文字
=================================================================
OpenAI以AI的另一個重大突破贏得了網際網路。 它將他們的ChatGPT功能提升到一個全新的水平。 以下是他們今天公佈的7項革命性創新:
- OpenAI推出了“GPT-4 Omni”,增強了其AI模型,以支援語音,文字和視覺,可供所有使用者使用,包括免費帳戶。
- GPT—4 Omni'配備了新的語音助手。
- 它可以處理中斷,
- 實時響應
- 甚至能感受到
聽起來像"她"
======================================================================
網友的llm 工具剛剛支援OpenAI 的新 GPT-4o模型:點這裡
pipx install llm |
要升級現有安裝,請執行此操作:
llm install --upgrade llm |
自 0.13 版起新增九個外掛:
- llm-claude-3 支援 Anthropic 的 Claude 3 模型系列。
- llm-command-r 支援 Cohere 的 Command R 和 Command R Plus API 模型。
- llm-reka 透過其 API 支援 Reka 系列模型。
- llm-perplexity 由 Alexandru Geana 設計,支援 Perplexity Labs 的 API 模型,包括 llama-3-sonar-large-32k-online (可線上搜尋事物)和 llama-3-70b-instruct。
- llm-groq 由 Moritz Angermann 提供,用於訪問由 Groq 託管的快速模型。
- llm-fireworks 支援由 Fireworks AI 託管的模型。
- llm-together 增加了對 Together AI 廣泛的公開許可託管模型系列的支援。
- llm-embed-onnx 提供了可使用 ONNX 模型框架執行的七種嵌入模型。
- llm-cmd 接受 shell 命令提示符,執行該提示符並將結果填充到 shell 中,這樣你就可以檢視、編輯它,然後按 <enter> 執行或按 ctrl+c 取消。
=========================================================================
與 GPT-4 相比,GPT-4o 的速度和額外的編碼能力使其在分析方面非常強大。
"分析它。視覺化它。進行復雜分析"
給定一個超級英雄的資料集,在沒有其他背景上下文的情況下,它可以進行非常令人印象深刻的視覺化、PCA、聚類分析......
- 只需一個命令就能進行全面分析。不錯。
- 這次PCA 分析是真的?太多大模型胡編亂造!
===========================================================================
說 openai 的演示令人失望的人:
- 要麼是不瞭解這項技術,
- 要麼就是裝作不以為然。
它之所以這麼快,是因為它是一個能理解一切的單一整合模型,而不是使用多個模型。
=====================================================================
gpt4o = gpt4.75
gpt4o 比 gpt4 的改進幅度要比 3.5 相對 3 大得多!
現在,它幾乎可以完成文字、影像、音訊領域的所有工作!
======================================================================
網友討論:
1、測試者手持蘋果Iphone與gpt4o對話風趣的對話, 像及了十年前剛剛釋出的Siri!當然, 這可能是 OpenAI 為 蘋果提供的演示,因為蘋果已經決定和CHatGPT合作:
- 兩家公司一直在“敲定在蘋果 iOS 18 中使用 ChatGPT 功能的協議條款”。目前尚不清楚這款流行的聊天機器人如何與蘋果的軟體整合。
- 該協議將使 ChatGPT 成為 Apple 預計為 iPhone 帶來的一系列人工智慧功能中的另一個工具。
- 蘋果在下個月舉行的年度全球開發者大會上預計將宣佈iOS 18 中的多項人工智慧功能,據稱這是 iPhone 作業系統多年來最大的升級之一。
2、老實說,我真的無法想象15年後的世界會是什麼樣子,我們是多麼幸運能夠見證即將發生的一切,真的令人難以置信
3、如果“奇點”的概念是準確的,那麼我們正處於它的早期階段。這十年即將發生的事情將使過去的 40 年看起來像石器時代。
4、
- 1980-1995:個人電腦
- 1995-2008:網際網路
- 2008-2015:智慧手機
- 2015-2020:這裡發生了什麼?
- 2020-???:人工智慧
5、我今年 66 歲了。幾乎每天都像我小時候在 60 年代和 70 年代讀過的科幻故事一樣。
6、我花了一些時間在操場上測試了新型號的影像識別和推理能力,結果讓我大吃一驚。它能從我糟糕的筆跡中找出字串,而這些字串在寫滿筆記和方程式的紙上幾乎無法辨認。(順便說一句,它在所有方面都是正確的)。
- 它能識別出不同的文字和影像,這些文字和影像都是用拙劣的塗鴉畫成的。
- 它甚至能從部分上下文中識別出字串!我簡直不敢相信它有這麼好!
7、我在公交車上跪下來流下了喜悅的淚水,希望這些技術能夠讓人類進入黃金時代
8、總結:
- 與人工智慧進行互動式對話的能力(比當前的聊天應用程式要好得多)。
- AI可以充當輔導員,幫助孩子做作業。不僅僅是給他們答案,還要幫助他們理解主題材料。
- 看起來他們增強了人工智慧的個性。所以感覺不太像人工智慧,而更像一個正常人。
- 絕對可以看到人們在聚會模式下使用它。