基於大模型的人工智慧應用開發

张善友發表於2024-06-02

我們所向往的是一個不僅把人工智慧生成內容視為工作的一部分,還將人工智慧作為連線更加複雜任務的關鍵紐帶的時代。

image

我們看到大模型應用開發過程中的兩條軸線---垂直軸代表傳入大模型的資訊的複雜度,水平軸代表對大模型能力的要求。這兩條軸線表明了模型最佳化需要考慮的兩個方向---大模型需要知道的上下文資訊和採取的行動。大模型知道的上下文越多,它基於特定應用場景做出的判斷的能力越強;而對大模型的行動能力要求越高,就需要對大模型進行微調,或者透過Agent賦予大模型更多的智慧。

Agent是人工智慧應用開發中最為亮眼的部分,屬於成熟度極低、潛在價值極高的領域,同時也位於上下文要求高、對模型行動力要求也搞得象限。Agent 需要大模型具有最強的推理能力,所以,至今為止也只有OpenAI公司的GPT-3.5/4 系列模型和Anthropic公司的Claude 3模型能夠符合“Agent 大腦” 的要求。這些Agent能夠進行自然語言對話、回答問題、生成文字內容、甚至編寫和理解程式碼,最終成為自動化工具的核心元件。

相關文章