太貼心!OpenAI釋出了類人化重大版本:GPT-4o

banq發表於2024-05-14


今天,OpenAI 釋出了 GPT-4o。它就是我們夢寐以求的鋼鐵俠。

下面是迄今為止最不可思議的 5 個例子:

1、實時翻譯
2、情緒和人臉檢測:
3、透過語音指令理解/除錯程式碼
4、生成各種基於情感的聲音:
5、從視覺上理解影像、繪圖和程式碼,編碼 ELO 能力能提高 100 點


GPT-4o("o "表示 "omni")是向更自然的人機互動邁出的一步。

這應該是蘋果 Siri 真正樣子

它將面向免費使用者並透過 API 提供。

===============================================================
今天openai 讓大家失望了......別失望。現場直播面向的是普通消費者。 很酷的東西都 "藏 "在他們的網站上:

  • 在人工智慧生成的影像中加入文字方面,領先於其他任何人
  • 對自己的文字影像能力非常自信,可以用 GPT4-o 建立字型
  • 3d 渲染....
  • 聲音效果合成,而不僅僅是語音
  • 結合實際情況上下文,有效地進行一次穩定的擴散微調!

=================================================================
OpenAI剛剛釋出了ChatGPT-4 o,它將徹底改變AI助手遊戲。
12個瘋狂的例子

  1. 實時視覺助理:幫助盲人叫車上車
  2. 幫助學生實時學習
  3. 實時翻譯
  4. 會議助理
  5. 可實時中斷並“改變情緒”:見風使舵
  6. 幫助您在影像中新增多行文字
  7. 實現會議記錄
  8. 三維物體合成
  9. 海報創作:一致的多步驟影像建立,精確的文字渲染
  10. 詩意排版
  11. 有照片轉換為漫畫大頭照
  12. 品牌形象定位
  13. 將文字生成各種字型:利用擴散影像生成文字的新技術;輕鬆實現影像生成的一致性;即使是手寫草書也能生成一致的文字

=================================================================
OpenAI以AI的另一個重大突破贏得了網際網路。 它將他們的ChatGPT功能提升到一個全新的水平。 以下是他們今天公佈的7項革命性創新:
  • OpenAI推出了“GPT-4 Omni”,增強了其AI模型,以支援語音,文字和視覺,可供所有使用者使用,包括免費帳戶。
  • GPT—4 Omni'配備了新的語音助手。 

- 它可以處理中斷,
- 實時響應 
- 甚至能感受到

聽起來像"她"

  • ChatGPT獲得實時影片模式。 您可以使用手機攝像頭提問。
  • 您現在可以免費使用GPT商店和GPT-4視覺,瀏覽,記憶體和高階資料分析。 這對非付費使用者來說是一座金礦。
  • ChatGPT現在有SELFIE情感檢測,它可以真實的時間檢測你的每一個情緒。
  • OpenAI還展示了其新的GPT—4o模型,可以進行實時翻譯
  • 7/ ChatGPT有了了桌面應用程式和下一代語音和影片功能。 <ul>
    ======================================================================
    網友的llm 工具剛剛支援OpenAI 的新 GPT-4o模型:點這裡
  • pipx install llm
    llm keys set openai
    # Paste API key here
    llm -m 4o <font>"Fascinate me"

    要升級現有安裝,請執行此操作:

    llm install --upgrade llm

    自 0.13 版起新增九個外掛:

    1. llm-claude-3 支援 Anthropic 的 Claude 3 模型系列。
    2. llm-command-r 支援 Cohere 的 Command R 和 Command R Plus API 模型。
    3. llm-reka 透過其 API 支援 Reka 系列模型。
    4. llm-perplexity 由 Alexandru Geana 設計,支援 Perplexity Labs 的 API 模型,包括 llama-3-sonar-large-32k-online (可線上搜尋事物)和 llama-3-70b-instruct。
    5. llm-groq 由 Moritz Angermann 提供,用於訪問由 Groq 託管的快速模型。
    6. llm-fireworks 支援由 Fireworks AI 託管的模型。
    7. llm-together 增加了對 Together AI 廣泛的公開許可託管模型系列的支援。
    8. llm-embed-onnx 提供了可使用 ONNX 模型框架執行的七種嵌入模型。
    9. llm-cmd 接受 shell 命令提示符,執行該提示符並將結果填充到 shell 中,這樣你就可以檢視、編輯它,然後按 <enter> 執行或按 ctrl+c 取消。

    =========================================================================
    與 GPT-4 相比,GPT-4o 的速度和額外的編碼能力使其在分析方面非常強大。
    "分析它。視覺化它。進行復雜分析"
    給定一個超級英雄的資料集,在沒有其他背景上下文的情況下,它可以進行非常令人印象深刻的視覺化、PCA、聚類分析......

    • 只需一個命令就能進行全面分析。不錯。
    • 這次PCA 分析是真的?太多大模型胡編亂造!

    ===========================================================================
    說 openai 的演示令人失望的人:

    • 要麼是不瞭解這項技術,
    • 要麼就是裝作不以為然。

    它之所以這麼快,是因為它是一個能理解一切的單一整合模型,而不是使用多個模型。

    =====================================================================
    gpt4o = gpt4.75
    gpt4o 比 gpt4 的改進幅度要比 3.5 相對 3 大得多!

    現在,它幾乎可以完成文字、影像、音訊領域的所有工作!

    ======================================================================
    網友討論

    1、測試者手持蘋果Iphone與gpt4o對話風趣的對話, 像及了十年前剛剛釋出的Siri!當然, 這可能是 OpenAI 為 蘋果提供的演示,因為蘋果已經決定和CHatGPT合作:

    • 兩家公司一直在“敲定在蘋果 iOS 18 中使用 ChatGPT 功能的協議條款”。目前尚不清楚這款流行的聊天機器人如何與蘋果的軟體整合。
    • 該協議將使 ChatGPT 成為 Apple 預計為 iPhone 帶來的一系列人工智慧功能中的另一個工具。
    • 蘋果在下個月舉行的年度全球開發者大會上預計將宣佈iOS 18 中的多項人工智慧功能,據稱這是 iPhone 作業系統多年來最大的升級之一。

    2、老實說,我真的無法想象15年後的世界會是什麼樣子,我們是多麼幸運能夠見證即將發生的一切,真的令人難以置信

    3、如果“奇點”的概念是準確的,那麼我們正處於它的早期階段。這十年即將發生的事情將使過去的 40 年看起來像石器時代。

    4、

    • 1980-1995:個人電腦
    • 1995-2008:網際網路
    • 2008-2015:智慧手機
    • 2015-2020:這裡發生了什麼?
    • 2020-???:人工智慧

    5、我今年 66 歲了。幾乎每天都像我小時候在 60 年代和 70 年代讀過的科幻故事一樣。

    6、我花了一些時間在操場上測試了新型號的影像識別和推理能力,結果讓我大吃一驚。它能從我糟糕的筆跡中找出字串,而這些字串在寫滿筆記和方程式的紙上幾乎無法辨認。(順便說一句,它在所有方面都是正確的)。

    • 它能識別出不同的文字和影像,這些文字和影像都是用拙劣的塗鴉畫成的。
    • 它甚至能從部分上下文中識別出字串!我簡直不敢相信它有這麼好!

    7、我在公交車上跪下來流下了喜悅的淚水,希望這些技術能夠讓人類進入黃金時代

    8、總結:

    • 與人工智慧進行互動式對話的能力(比當前的聊天應用程式要好得多)。
    • AI可以充當輔導員,幫助孩子做作業。不僅僅是給他們答案,還要幫助他們理解主題材料。
    • 看起來他們增強了人工智慧的個性。所以感覺不太像人工智慧,而更像一個正常人。
    • 絕對可以看到人們在聚會模式下使用它。

    太貼心!OpenAI釋出了類人化重大版本:GPT-4o
     

    相關文章