Chain-of-Thought Prompting

lightsong發表於2024-07-16

Chain-of-Thought Prompting

https://www.promptingguide.ai/zh/techniques/cot#%E9%9B%B6%E6%A0%B7%E6%9C%AC-cot-%E6%8F%90%E7%A4%BA

鏈式思考(CoT)提示

COT

圖片來源:Wei等人(2022)

Wei等人(2022)

中引入的鏈式思考(CoT)提示透過中間推理步驟實現了複雜的推理能力。您可以將其與少樣本提示相結合,以獲得更好的結果,以便在回答之前進行推理的更復雜的任務。

思維鏈(Chain of Thought, CoT)在寫Prompt時的主要作用是引導模型進行逐步推理,特別是當處理複雜或需要多步思考的問題時。透過明確列出解題步驟,思維鏈能夠幫助模型更好地理解問題,並沿著邏輯清晰的路徑找到答案。

以下是一個使用思維鏈寫Prompt的例子,旨在解答一個簡單的數學問題:

問題:一個水果攤上,蘋果每斤3元,香蕉每斤2元。如果你買了5斤蘋果和4斤香蕉,總共需要支付多少錢?

不使用思維鏈的Prompt:

請計算購買5斤蘋果和4斤香蕉的總費用,其中蘋果每斤3元,香蕉每斤2元。

使用思維鏈的Prompt:

現在,我們要解決一個關於購買水果的費用計算問題。請按照以下步驟進行推理:

1. **確定單價和數量**:
- 蘋果的單價是每斤3元,你購買了5斤。
- 香蕉的單價是每斤2元,你購買了4斤。

2. **分別計算每種水果的費用**:
- 計算蘋果的總費用:$3 imes 5 = 15$元(單價乘以數量)。
- 計算香蕉的總費用:$2 imes 4 = 8$元(單價乘以數量)。

3. **將兩種水果的費用相加得到總費用**:
- 蘋果費用15元加上香蕉費用8元,總共是$15 + 8 = 23$元。


請根據上述步驟,計算並回答:購買5斤蘋果和4斤香蕉,總共需要支付多少錢?

在這個例子中,思維鏈透過明確列出解題步驟(確定單價和數量、分別計算費用、相加得到總費用),幫助模型更好地理解問題,並按照邏輯順序進行推理。這種方法特別適用於需要多步計算或邏輯推理的問題,因為它能夠引導模型逐步構建解決方案,而不是直接跳到最終答案。

透過思維鏈寫Prompt,我們可以提高模型的解題準確性和透明度,使其更易於理解和除錯。同時,這種方法也有助於模型學習到更廣泛的解題策略,而不僅僅是針對特定問題的記憶性解答。