聯手OpenAI,吳恩達推出一門o1推理新課程,還免費

机器之心發表於2025-01-02

在剛剛過去的 2024 年,OpenAI 推出了 o 系列模型。相比於以往大型語言模型,o 系列模型使用更多的計算進行更深入的「思考」,能夠回答更復雜、更細緻的問題。

透過在推理時執行思維鏈推理,o 系列模型在新興用例中表現出色,包括多步驟規劃、影像推理和長期編碼。那麼,具體如何使用 o 系列模型來構建需要複雜推理的應用程式呢?

最近,OpenAI 聯合人工智慧著名學者、史丹佛大學教授吳恩達推出了一門關於使用 o1 進行推理的免費 DeepLearning.AI 課程 ——Reasoning with o1,講師是 OpenAI 戰略解決方案架構主管 Colin Jarvis。

圖片

課程地址:https://www.deeplearning.ai/short-courses/reasoning-with-o1

Reasoning with o1課程內容主要包括:

  • o1 即時工程的基礎知識
  • 規劃和執行多步驟任務
  • 建立和編輯程式碼
  • 影像推理
  • 可提高模型效能的 Metaprompting

透過這門課程,學生將:

  • 瞭解 o1、它的工作原理、效能以及使用它的最佳場景。
  • 瞭解如何有效地提示 o1 以及何時將任務委派給更具成本效益、更低延遲的模型。
  • 瞭解 o1 如何在編碼和視覺推理任務上表現出色,以及如何應用 Metaprompting 來最佳化應用程式。

圖片

具體來說,在 Reasoning with o1課程中,學生將瞭解 OpenAI 如何利用強化學習來構建使用「測試時計算」來提高推理任務效能的模型;瞭解什麼是「思維鏈」提示,以及 o1 如何自主地利用它來將問題分解為更小的步驟,嘗試多種策略,並在回答問題之前仔細思考。

o1 模型特別擅長抽象推理任務。它在規劃、編碼、分析、特定領域推理(如法律)和 STEM 科目等任務上具有破紀錄的效能。Reasoning with o1課程內容涵蓋:

  • 學習識別 o1 模型適合哪些任務,以及何時需要使用更小或更快的模型,或將這兩者結合起來。
  • 瞭解使用 o1 進行提示的四個關鍵原則,並探索效能上的差異。
  • 實現一個多步驟任務,其中 o1 作為協調器建立規劃並將其交給 4o-mini 模型按順序執行規劃,平衡智慧和成本之間的權衡。
  • 使用 o1 執行編碼任務,構建新應用程式、編輯現有程式碼,並透過在 o1-mini 和 GPT 4o 之間執行編碼競賽來測試效能。
  • 使用 o1 進行影像理解,並瞭解它如何透過層次推理獲得更好的效能,其中它會預先產生延遲和成本,預處理影像並使用豐富的細節對其進行索引,以便稍後用於問答。
  • 學習一種稱為 Metaprompting 的技術,以使用 o1 來改進提示。

怎麼說?來學習嗎?

相關文章