在剛剛過去的 2024 年,OpenAI 推出了 o 系列模型。相比於以往大型語言模型,o 系列模型使用更多的計算進行更深入的「思考」,能夠回答更復雜、更細緻的問題。
透過在推理時執行思維鏈推理,o 系列模型在新興用例中表現出色,包括多步驟規劃、影像推理和長期編碼。那麼,具體如何使用 o 系列模型來構建需要複雜推理的應用程式呢?
最近,OpenAI 聯合人工智慧著名學者、史丹佛大學教授吳恩達推出了一門關於使用 o1 進行推理的免費 DeepLearning.AI 課程 ——Reasoning with o1,講師是 OpenAI 戰略解決方案架構主管 Colin Jarvis。
課程地址:https://www.deeplearning.ai/short-courses/reasoning-with-o1
Reasoning with o1課程內容主要包括:
o1 即時工程的基礎知識 規劃和執行多步驟任務 建立和編輯程式碼 影像推理 可提高模型效能的 Metaprompting
透過這門課程,學生將:
瞭解 o1、它的工作原理、效能以及使用它的最佳場景。 瞭解如何有效地提示 o1 以及何時將任務委派給更具成本效益、更低延遲的模型。 瞭解 o1 如何在編碼和視覺推理任務上表現出色,以及如何應用 Metaprompting 來最佳化應用程式。
具體來說,在 Reasoning with o1課程中,學生將瞭解 OpenAI 如何利用強化學習來構建使用「測試時計算」來提高推理任務效能的模型;瞭解什麼是「思維鏈」提示,以及 o1 如何自主地利用它來將問題分解為更小的步驟,嘗試多種策略,並在回答問題之前仔細思考。
o1 模型特別擅長抽象推理任務。它在規劃、編碼、分析、特定領域推理(如法律)和 STEM 科目等任務上具有破紀錄的效能。Reasoning with o1課程內容涵蓋:
學習識別 o1 模型適合哪些任務,以及何時需要使用更小或更快的模型,或將這兩者結合起來。 瞭解使用 o1 進行提示的四個關鍵原則,並探索效能上的差異。 實現一個多步驟任務,其中 o1 作為協調器建立規劃並將其交給 4o-mini 模型按順序執行規劃,平衡智慧和成本之間的權衡。 使用 o1 執行編碼任務,構建新應用程式、編輯現有程式碼,並透過在 o1-mini 和 GPT 4o 之間執行編碼競賽來測試效能。 使用 o1 進行影像理解,並瞭解它如何透過層次推理獲得更好的效能,其中它會預先產生延遲和成本,預處理影像並使用豐富的細節對其進行索引,以便稍後用於問答。 學習一種稱為 Metaprompting 的技術,以使用 o1 來改進提示。
怎麼說?來學習嗎?