開發人員測試 Devin AI 後的發現

banq發表於2024-03-17


在本文中,我們將深入研究一些探索 Devin AI 功能的使用者的反應以及該工具提供的大量用例。那麼,讓我們來了解一下吧!

目前,Devin 僅針對搶先體驗推出。開發人員可以透過填寫 Google 表格來請求早期訪問,說明他們的工具需求和偏好。根據他們的需求型別,他們將在候補名單上排隊。

不過,我們發現一些較早接觸到 Devin 的使用者對這位“AI 軟體工程師”的體驗進行了深入分析。

1. Devin 設定聊天機器人 UI 專案
Mckay Wrigley,一位充滿熱情且受歡迎的 AI 愛好者,在 X 上詳細介紹了他使用 Devin AI 的體驗。

他請 Devin 為他設定本地執行的聊天機器人 UI 應用程式。如上影片所示,它首先完全克隆了 GitHub 倉庫,表現出色。它還進一步分析了倉庫中的 README 檔案,以瞭解專案需求和要求。

然後,它使用 npm 安裝所需的專案依賴項。由於版本庫中有大量 .json 檔案,Devin 的這一方法非常出色。最後,它成功地在介面中重現了 UI 聊天機器人應用,就像使用者在本地機器上執行一樣。

這次克隆的另一個有趣之處是,當使用者向 Devin 提供使用者 ID 和密碼時,Devin 甚至能登入聊天機器人應用程式。這充分說明,它的功能不僅限於編碼、除錯和克隆軟體源。

2.建立美國機場地圖
Ethan Mollick 是一位人工智慧專家,他也獲得了早期訪問權,他要求 Devin 繪製一張地圖,標明美國的機場以及與之相關的旅行時間。

Devin 首先出色地完成了收集美國機場資料來源的工作。然後,它建立了一個專為 React 應用程式設計的本地開發環境。它使用 Chakra UI 元件來實現這一功能。

它使用 Leaflet.js 為前端介面出色地開發了一個對映庫。這表明,Devin 還可以使用各種 API 或可用軟體包建立互動式網路應用程式或移動應用程式。

最後,Devin 使用 Netlify 部署了生成的地圖介面。它並沒有止步於部署,而是繼續對程式碼進行了全面測試。它確保了在生產環境中的完美效能。

整個互動過程中一個有趣的時刻是,當使用者在使用過程中發現一個錯誤時,它不僅自動修復了錯誤,還繼續向使用者保證,它正在努力修復錯誤,這是開發過程中的一個重要步驟。

結果是一個出色的類似地圖的介面,上面標明瞭所有美國機場的最佳旅行時間。使用者唯一的抱怨是該工具速度太慢,有時在使用過程中會出現故障,但積極的方面還是彌補了這一不足。

3.與 LLM 下棋的網站(GPT-4 API)
Andrew Kean Gao 是一名人工智慧愛好者,就讀於史丹佛大學並在 LangChain AI 工作。他交給工具的任務是建立一個與基於 LLM 的對手下棋的網站,特別是 GPT-4 API。

安德魯在推文中進一步指出,這是一項極其複雜的任務,因為大多數大模型都不知道如何使用 API,尤其是 GPT-4 API。他還進一步提到,Devin 是否會安全地處理 API 金鑰,並處理任何相關的軟體包錯誤。

出乎他意料的是,Devin 不僅索取了 API 金鑰,而且還進行了安全處理。不過,這位使用者也抱怨 Devin 的速度太慢,因為在要求提供 API 金鑰之前,該工具的處理時間幾乎長達 19 分鐘。此外,它正在按照 npm 文件和相關錯誤使用 chess.js 製作遊戲計劃。這是決定棋局走勢和錯誤的關鍵一步。

最後,該使用者分享了一張圖片,圖片中可以看到 Devin 正在除錯渲染問題,並檢視匯出方法以修復國際象棋遊戲環境的匯入語句。

4.開發 Chrome 瀏覽器擴充套件
安德魯甚至繼續測試 Devin 的能力。他要求 Devin 開發一個 Chrome 瀏覽器擴充套件,將 GitHub 倉庫轉化為克勞德提示。

根據你現在檢視的頁面,擴充套件會自動填寫 Repo2Prompt GitHub URL。然後,您需要提供一個 GitHub 令牌。此外,它還會生成 TXT 檔案的使用者下載連結。

Devin 的工作非常出色!誰能想到人工智慧工具會有為我們生成 Chrome 擴充套件的一天?我們即將實現一切盡在掌握!

你甚至可以從這裡here下載擴充套件程式並親自試用。開啟 Chrome 擴充套件程式的開發者設定,解壓檔案並載入它。

如何看待 Devin?
上述所有開發人員的反應和測試都非常喜歡並親身體驗了 Devin 的功能。早期使用階段的結果大多是積極的。除了程式碼處理和版本庫克隆速度較慢之外,使用者對該工具幾乎沒有任何意見。

但我們可以認為,Cognition 將在未來的日子裡解決這個問題。目前,Devin AI 背後的團隊仍未就該工具的公開時間提供任何更新資訊。

就目前而言,我們不禁要讚歎該工具在起步階段就已經如此出色。全世界的開發人員都在翹首以盼,希望能最終獲得完整的訪問許可權,併為自己的專案和個人部署編寫指令碼。

不過,也有一些使用者認為,Devin 有可能在軟體開發領域取代人類。它可以極大地搶走軟體開發人員和除錯人員的飯碗,因為大型公司和企業已經在考慮使用 Devin 編寫原始碼指令碼。

從長遠來看,我們人類是否需要並應該推廣一種有可能完全取代我們的人工智慧工具?也許人工智慧才剛剛起步。

相關文章