人人可做提示工程師！Claude上新：一鍵生成、測試和評估prompt

机器之心發表於2024-07-10

原文網址 : https://www.jiqizhixin.com/articles/2024-07-10-10

不會寫 prompt 的看過來。

在構建 AI 應用時，prompt 質量對結果有著重大影響。但製作高質量的 prompt 具有挑戰性，需要研究者深入瞭解應用需求，並具備大型語言模型方面的專業知識。為了加快開發速度並改善結果，AI 初創公司 Anthropic 簡化了此流程，可以讓使用者更輕鬆地製作高質量的 prompt。

具體來說，研究者為 Anthropic Console 新增了新功能，可以生成、測試和評估 prompt。

Anthropic 提示工程師 Alex Albert 表示：這是他們過去幾周投入了大量工作才得到的成果，現在 Claude 在提示工程（Prompt Engineering）方面表現得非常好。

難寫的 prompt，交給 Claude

在 Claude 中，寫一個好的 prompt 就像描述任務一樣簡單。控制檯提供了一個內建的 prompt 生成器，由 Claude 3.5 Sonnet 提供支援，允許使用者描述任務並讓 Claude 生成高質量的 prompt。

生成 prompt。首先點選 Generate Prompt，進入 prompt 生成介面：

然後輸入任務描述，Claude 3.5 Sonnet 將把任務描述轉換為高質量的 prompt。例如「撰寫一個用於審查入站訊息的 prompt…… 」，點選生成 prompt 就可以了。

生成測試資料。如果使用者有了 prompt，可能需要一些測試用例來執行它。Claude 可以生成那些測試用例。

使用者可以根據需要修改測試用例，並一鍵執行所有測試用例，還可以檢視並調整 Claude 對每個變數生成要求的理解，以實現對 Claude 生成測試用例更細粒度的控制。

這些功能讓最佳化 prompt 變得容易，因為使用者可以建立 prompt 的新版本並重新執行測試套件以快速迭代和改進結果。

此外，Anthropic 還按照 5 分製為 Claude 響應質量設定了評分。

評估模型。如果使用者對 prompt 感到滿意，之後可以在「評估」選項卡中一次針對各種測試用例執行它。使用者可以從 CSV 匯入測試資料，也可以直接使用 Claude 為使用者生成合成測試資料。

比較。使用者還可以在測試用例中相互測試多個 prompt，並對更好的響應進行評分，以跟蹤哪個 prompt 表現最佳。

AI 博主 @elvis 表示：Anthropic Console 是一項出色的研究，其自動化設計和最佳化 prompt 的過程可以節省大量時間。雖然生成的提示可能並不完美，但給了使用者一個快速迭代的起點。此外，生成測試用例功能也很有幫助，因為開發者可能沒有可供測試的資料。

看來，以後寫 prompt 這個活，可以交給 Anthropic 了。

瞭解更多內容，請檢視文件：https://docs.anthropic.com/en/docs/build-with-claude/prompt-engineering/overview

大模型提示工程之Prompt框架和示例
2024-03-29
大模型框架
多通道負載測試和效能評估？
2024-11-12
負載
在 Amazon Bedrock 上使用 Anthropic Claude 系統 Prompt
2024-03-14
如何評估測試工時？
2024-06-19
【雜談】做一個不被開發鄙視的測試工程師
2020-12-16
工程師
Prompt工程師指南[應用篇]：Prompt應用、ChatGPT|Midjouney Prompt Engineering
2023-05-15
工程師ChatGPT
軟體測試工程師職稱評定細則
2019-09-24
工程師
每天一點小提升，人人都是工程師
2018-07-20
工程師
一個測試工程師的養成
2020-12-24
工程師
OBC充電機測試效能評估
2024-10-30
你會怎麼去評估一個測試的能力？
2024-06-14
如何讓老闆明白測試和測試工程師不是一件事情？
2020-11-12
工程師
生成式人工智慧：人人可享的新時代報告
2023-04-07
人工智慧
Eolink Apikit 快速發起 API 測試，一鍵生成測試資料
2023-12-18
API
做「容量預估」可沒有true和false
2019-08-30
False
大資料測試 - 相關性評估
2024-08-29
大資料
Julia焦慮？這有份Facebook軟體工程師的測試差評
2018-08-10
軟體工程工程師
一個可一鍵生成短影片的AI大模型，親測可用
2024-03-27
AI大模型
測試工程師最怕的事
2019-08-22
工程師
一名測試工程師的日常習慣
2018-08-08
工程師
一個測試工程師的成長覆盤
2021-08-25
工程師
AI自動生成prompt媲美人類，網友：工程師剛被聘用又要淘汰了
2023-03-01
AI工程師
100道測試工程師筆試題
2018-11-25
工程師筆試
測試工程師的面試總結
2020-07-23
工程師面試
網站安全評估滲透測試手法分析
2021-07-12
網站
PingCastle 3.2.0.1 - Active Directory 安全檢測和評估
2024-06-10
GCAST
【測試】HD-G2L-IO評估板測試結果表
2023-03-08
Prompt提示詞概念
2024-09-21
90%測試工程師不知道的測試方法
2018-11-19
工程師
【測評】軟體測試廠商Parasoft和SmartBear關鍵功能對比
2018-11-27
論測試工程師的職責
2020-05-22
工程師
美國6w刀的遠端工作高階工程師職位,說下線上評估, 倒在第一階段, 認知能力測試?智商不夠怎麼辦?!
2020-07-05
工程師
轉：測試工程師的面試總結
2020-11-14
工程師面試
10年老測試工程師的一些心得：結合案例談談迴歸測試和確認測試
2021-04-26
工程師
3568F-評估板測試手冊（ARM端）
2024-04-10
逆變器的防孤島測試效能評估
2024-09-11
滲透測試公司談網站安全評估方法
2021-07-15
網站
如何做一個合格的測試架構師
2020-10-15
架構

人人可做提示工程師！Claude上新：一鍵生成、測試和評估prompt

相關文章