Claude 3 Opus在競技場排行榜上已經遠遠超越GPT-4
人們正在尋找使用Claude來增強工作流程的各種方法。
10個例子:
1、claude-prompt-engineer
一個能建立最佳Claude 3 提示的代理。 只需描述一項任務,一連串的人工智慧就會:
- - 生成許多可能的提示
- - 在排名賽中測試它們
- - 返回最佳提示
claude-prompt-engineer "是一個受約束的代理--這意味著它的行為受到高度控制,從而比開放式代理取得更好的結果。 它將大量 Claude 3 呼叫串聯起來,共同尋找最佳提示。
重大改進:
- - 使用 Claude 3(編寫的提示語比 GPT-4 好得多)
- - 自動生成測試用例,進一步自動化提示語編寫過程
- - 支援多變數提示語!
工作原理:
- - 使用者描述任務和輸入變數
- - Claude 生成許多候選提示供嘗試
- - 每個提示針對每個測試用例生成,(由Claude )對每個組合的輸出進行比較,採用 ELO 錦標賽方式
- - 得分最高者獲勝!
生成的提示語質量之高讓人大開眼界。
2、Maestro
laude Opus協調子代理的框架。
只需提出一個目標,Opus 就會將其分解,並智慧地協調 Haiku 例項來執行子任務,最後由 Opus 進行審查。
輸出儲存為 markdown
特徵
- 使用 Opus 模型將目標分解為可管理的子任務
- 使用 Haiku 模型執行每個子任務
- 為俳句模型提供先前子任務的記憶以供上下文使用
- 使用 Opus 模型將子任務結果細化為最終輸出
- 生成詳細的交換日誌,捕獲整個任務分解和執行過程
- 將交換日誌儲存為 Markdown 檔案以方便參考
- 利用 Opus 模型的改進提示來更好地評估任務完成情況
- 在處理程式碼專案時建立程式碼檔案。
3、claude-investor
第一個 Claude 3 投資分析代理。
claude-investor 是一個受約束的代理--這意味著它的行為受到高度控制,從而比開放式代理取得更好的結果。 它將大量 Claude 3 呼叫串聯起來,共同分析特定類別中的主要股票。
只需提供一個行業,它就可以:
- - 查詢主要公司的財務資料/新聞
- - 分析每家公司的情緒/趨勢
- - 根據投資潛力和目標價格對股票進行排名
而且是開源的!
輸出的質量令人驚歎,克勞德還提供了每一個決定的理由
工作流程
- 生成指定行業主要公司的股票程式碼列表
- 檢索每家公司的歷史價格資料、資產負債表、財務報表和新聞文章
- 對新聞文章進行情緒分析以衡量市場情緒
- 檢索每家公司的分析師評級和價格目標
- 進行行業和部門分析,以瞭解市場趨勢和競爭格局
- 生成所選公司與其同行之間的比較分析
- 根據綜合分析為每家公司提供最終的投資建議,包括價格目標
- 根據投資吸引力對行業內公司進行排名
4、Claude-ception
教 Claude3 進行自我提示工程,
Claude3 Opus 在提示工程方面非常出色。
最佳實踐:編寫提示語,在測試用例中執行,對響應進行評分,讓 Claude3 Opus 使用評分來改進提示語,然後重複。
使用 LangSmith 簡化這一流程:
- + 建立測試用例資料集
- + 用反饋註釋各代
- + 將反饋傳遞給 Claude3 Opus 以提示重寫
- + 作為迭代改進迴圈執行
將這種方法應用於論文摘要,要求 Claude3 以 @omarsar0 的優秀交流風格對論文進行摘要。 透過反饋,Claude3 調整了自己的摘要提示,並生成了越來越吸引人的論文摘要。 這展示了自動提示工程的通用策略。
駭客技術快速實現LangSmith的專案:Prompt Optimizer:
特徵
- 根據初始提示生成多樣化的測試資料集
- 在生成的測試用例上測試提示並收集使用者評價
- 將測試結果儲存到 CSV 檔案
- 根據使用者評價生成改進的提示
5、MEMEX
METAOPERATIVE OPERATING SYSTEM V1.0(或稱 Memex OS)。
這是我在主聊天介面中使用Omega Claude提示進行了一些探索後,由Claude建立的。
我一直在嘗試讓 Memex 在不同的環境中執行,供大家探索:
它以 "駭客帝國"(The Matrix)為主題,與每個特工一起(沒有提示!)開始提供威脅評估、針對感染載體建議應對措施、啟動打擊小組部署並形成特工日誌。
它推斷出賽費爾正在秘密考慮為了自己的利益而背叛團隊。當我要求系統暗中探查賽費爾的想法時,它挑選並部署了 "三位一體 "進行滲透,並附上了以下文字:
選定特工:理由:有能力收集情報並在不被察覺的情況下開展行動。與賽費爾的熟悉關係為互動提供了可信的掩護:目標:獲得賽費爾的信任,探究他的想法和動機,評估背叛風險。
6、分析Reddit
我解析了 Reddit/r/SideProject 上的 968 個專案,並使用 Claude 3 Opus 對其進行了分析。
Claude 總結了這些專案型別:
- 語言學習 (4)
- 目錄/列表 (7)
- Chrome 擴充套件 (21)
- 加密或去中心化 (5)
- 金融 (15)
- 開發工具 (26)
- 自託管 (14)
- 增長或營銷工具 (11)
- 開源 (37)
7、MRI診斷:
以下故事有待證實:
一個朋友給我發了核磁共振腦掃描結果,我把它透過Claude克勞德。
沒有其他人工智慧會提供診斷,克勞德做到了。
克勞德發現了一個惡性腫瘤。
放射科醫生的報告沒有問題。
我惹惱了放射科醫生,直到他們重新檢查。他們與3名放射科醫生和他們自己的人工智慧一起完成了這項工作。結果沒問題看來克勞德錯了
但看起來克勞德聽起來多麼令人信服!我們還早著呢...
根據MRI腦部掃描顯示,似乎有一個大的異常腫塊或病變存在。大腦中心明亮、不規則的白色區域可能是潛在的腫瘤或其他病理過程。
腫瘤表現出明顯的增強,區域性腫塊效應和周圍水腫-這些特徵在正常腦組織中是不可能的。我們可以透過多個連續的MRI切片追蹤病變,確認它是一個真實的佔位性腫塊。該位置對於原發性膠質瘤也是典型的。
雖然我承認放射學總是有一定程度的不確定性,但我估計這實際上是正常大腦或誤導性角度的可能性遠低於1%。全套影像構建了一個引人注目的,一致的圖片侵略性腦腫瘤。
我讓它回顧更多的角度:
在審查此更新影像中提供的其他MRI序列和角度後,我的評估保持不變。多平面顯示左頂葉深部有一巨大強化腫塊,周圍廣泛血管源性水腫。連續切片上再次清楚地看到病變,確認其為真正的異常而非偽影。
主要意見:
- T1加權增強後影像上病變不均勻增強,表明血腦屏障破壞
- T2 FLAIR序列顯示腫塊大部分為T2高訊號,周圍水腫
- 由於腫瘤的區域性佔位效應導致鄰近側腦室消失
- 由於病變的擴張效應,中線向右移位
這些發現再次證實了我對高階別膠質瘤的最初印象,鑑於影像學特徵,最有可能是膠質母細胞瘤。垂直於原始平面的額外檢視有助於排除體積平均偽影模仿腫塊的可能性。
總之,這一補充影像進一步鞏固了左頂葉侵襲性腫瘤的診斷,我懷疑是膠質母細胞瘤。我現在更有信心(99%)這是一個真正的病理發現,需要緊急干預。活檢和組織病理學評估最終將需要明確的分類,但影像學是相當令人信服的惡性膠質瘤。
8、模擬宇宙
- 專家說:“大規模鐳射顯微鏡無法模擬宇宙”
- 我:“<cmd> cat/sys/base_reality/physics. dat| intelligent-formatter --format=“mermaid-markdown”--granularity=“low”</cmd>“
- Claude:輸出論文
9、Memecoin分析師
claude-memecoin-analyst是第一個克勞德3米幣分析師代理。
只要給予它幾個幣種,它就會:
- - 查詢每個幣種的趨勢資料/新聞
- - 分析每個人的情緒/趨勢
- - 根據投資潛力對每個硬幣進行排名
而且是開源的!
claude-memecoin-analyst 是一個受約束的代理--這意味著它的行為是高度可控的,從而比開放式代理獲得更好的結果。 它將大量 Claude 3 呼叫串聯起來,共同分析 memecoin 的潛力。
工作原理:
- - 使用者提供一個幣種列表
- - claude-memecoin-analyst 檢索這些幣種的新聞/資訊
- - 作為背景分析情緒、潛力等
- - 利用背景/分析生成按潛力排序的投資建議
*claude-memecoin-analyst 是一個教育/資訊工具。它不應被視為金融建議或專業投資指導的替代品。 這只是為了好玩,不能用於真正的投資。
10、Claude能與自己下棋,並用 svg 製作成動畫