OpenAI和谷歌分別釋出重大更新

banq發表於2024-02-16

今天OpenAI和谷歌分別釋出重大更新:

1、OpenAI推出第一個文字轉影片模型
Sora 是一個 AI 模型,可以根據文字指令建立現實且富有想象力的場景。

Sora 能夠生成一分鐘的高保真影片。我們的結果表明,擴充套件影片生成模型是構建物理世界通用模擬器的一條有前途的途徑。

12分鐘所有 Sora OpenAI 生成的示例影片的彙編(12 分鐘)

網友討論:

  • 因為感覺這是人工智慧歷史上的一個重要時刻,很榮幸看到它發生在我們眼前。

2、谷歌推出下一代型號:Gemini 1.5
模型顯著增強了效能,在跨模式的長上下文理解方面取得了突破。

Gemini 1.5 Pro 配備了標準的 128,000 令牌上下文視窗。更長的上下文視窗向我們展示了可能性的希望。它們將實現全新的功能,並幫助開發人員構建更有用的模型和應用程式。

Gemini 1.5 Pro 還融入了一系列重大架構更改,可在不降低效能的情況下對輸入進行長上下文理解,最多可處理 1000 萬個令牌

  • 當我們推出完整的 100 萬個令牌上下文視窗時,我們正在積極進行最佳化,以改善延遲、減少計算要求並增強使用者體驗。
  • 在多個維度上都顯示出顯著的改進,並且 1.5 Pro 實現了與 1.0 Ultra 相當的質量,同時使用更少的計算。

這意味著 1.5 Pro 可以一次性處理大量資訊 - 包括 1 小時的影片、11 小時的音訊、超過 30,000 行程式碼或超過 700,000 個單詞的程式碼庫。在我們的研究中,我們還成功測試了多達1000 萬令牌。

網友討論:

  • 他們在文章中聲稱它有高達 1M 的 token 上下文視窗(chatGPT 4.0 pro是128K),如果它在閱讀極長的文字時實際上有 99% 的準確率,那仍然是瘋狂的。
  • 真的希望這會給 OpenAI 帶來壓力,因為如果這就是他們所做的一切,並且他們及時公開發布它,那麼谷歌將是最快釋出強大的人工智慧模型的人
  • 昨天盤後,The Information 報導稱 OpenAI 正在開發一款搜尋引擎產品,股價開始下跌
  • 從20萬令牌直接漲到1000萬!!!最重要的是,準確性根本沒有下降,它只是爆炸了!
  • 一旦每個人都開始複製谷歌在這裡所做的事情,RAG 就會在幾個月內消亡。這太瘋狂了!!!
  • 到目前為止,谷歌有一個可怕的記錄,即過度宣傳特定功能,然後讓實際的人工智慧在釋出時或多或少毫無用處。

相關文章