你訓練大語言模型(LLM)用的什麼框架?有沒有想過不用框架訓練 GPT-2?
GitHub 上就有這麼一位大神(Andrej Karpathy),他僅用大約 1k 行的 C 程式碼就完成了 GPT-2 模型的訓練,程式碼純手擼、不依賴任何機器學習框架,作者這麼做僅僅是覺得很有趣。儘管這個專案(llm.c)的教學意義大於實用價值,但開源一週便收穫了 15k Star,可見大家對他技術的認可和驚歎。
目光回到本週其他的開源熱搜專案,線上的資料庫設計工具 DrawDB 和程式設計師專屬的線上工具集合 it-tools,它們方便快捷、點開就能用。Spring 框架也想要趕上 AI 潮流,推出了幫助開發 AI 應用的 Spring 框架 spring-ai,旨在簡化開發 AI 應用的複雜度。開源的託管網站平臺 Coolify,讓你透過點點就能部署線上服務。看來不管是硬核的手擼框架,還是提供便利的工具,在 GitHub 上都是很受歡迎的。
- 本文目錄
- 1. 開源新聞
- 1.1 Andrej Karpathy 的開源專案
- 2. 開源熱搜專案
- 2.1 線上的資料庫設計工具:DrawDB
- 2.2 幫助開發 AI 應用的 Spring 框架:spring-ai
- 2.3 輕鬆託管網站和服務的開源平臺:Coolify
- 2.4 程式設計師的線上工具集合:it-tools
- 2.5 構建你的第二大腦:Quivr
- 3. HelloGitHub 熱評
- 3.1 面向所有開發者的學習路線圖:developer-roadmap
- 3.2 假裝很忙的摸魚神器:genact
- 4. 結尾
- 1. 開源新聞
1. 開源新聞
1.1 Andrej Karpathy 的開源專案
上面說的 llm.c 專案作者 Andrej Karpathy,他博士就讀於史丹佛大學,曾就職於特斯拉的自動駕駛部門負責人、OpenAI 的創始成員。
Andrej Karpathy 熱衷於深度神經網路和開源,在 GitHub 上有 71k 的粉絲。他的另外一個開源專案 nanoGPT,也是 GitHub 熱榜(Trending)的常客。
nanoGPT 是用於訓練/微調中等規模 GPT 模型的庫。它是對 minGPT 的重寫,這次的重點是速度和效率而不是教育性,值得一提的是 minGPT 的作者也是 Andrej Karpathy。
GitHub 地址:https://github.com/karpathy/nanoGPT
2. 開源熱搜專案
2.1 線上的資料庫設計工具:DrawDB
主語言:JavaScript,Star:4.7k,周增長:3.8k
這個開源專案是一個免費、簡單、強大的資料庫實體關係(DBER)線上編輯器,無需註冊即可直接在瀏覽器中使用。它提供了直觀、視覺化的操作介面,使用者透過點選即可構建資料庫表和匯出建表語句,還可以匯入建表語句,實現視覺化編輯、錯誤檢查等。支援 MySQL、PostgreSQL、SQLite、MariaDB、SQL Server 共 5 種常用的關聯式資料庫。
GitHub 地址→https://github.com/drawdb-io/drawdb
2.2 幫助開發 AI 應用的 Spring 框架:spring-ai
主語言:Java,Star:1.7k,周增長:300
這是由 Spring 官方開源的用於簡化包含 AI 功能的應用開發的 Java 框架,它可以輕鬆接入 OpenAI、Microsoft、Amazon、Google 和 Huggingface 等主流模型供應商,以及聊天、文字生成影像的模型型別,支援提示工程、AI 模型轉 POJO 物件、向量資料庫、RAG(檢索增強生成)等有助於開發 AI 應用的功能。
GitHub 地址→https://github.com/spring-projects/spring-ai
2.3 輕鬆託管網站和服務的開源平臺:Coolify
主語言:PHP,Star:13k,周增長:800
這是一個免費、自託管、可替代 Heroku / Netlify / Vercel 等平臺的開源專案,它提供了一個 Web 平臺,使用者可以在上面管理、部署各種 Web 應用和資料庫服務,比如多種程式語言的動態網站、靜態網頁、WordPress、MongoDB、Redis 等。不挑伺服器可以是自己的伺服器,也可以是任意雲伺服器,只要支援 SSH 連線即可,伺服器最低配置僅需 2C2G 即可。
GitHub 地址→https://github.com/coollabsio/coolify
2.4 程式設計師的線上工具集合:it-tools
主語言:Vue,Star:9.9k,周增長:500
該專案採用 Vue.js(Vue 3)和 Naive UI 元件庫開發,彙集了對開發人員和 IT 從業者有用的工具。它免費、介面清爽、功能豐富,支援包括中文在內的多國語言,提供了加密、轉化器、網路、文字等開發常用工具。
GitHub 地址→https://github.com/CorentinTh/it-tools
2.5 構建你的第二大腦:Quivr
主語言:TypeScript、Python,Star:31k,周增長:300
該專案利用生成式 AI 的能力,成為你的第二大腦。你可以將多種格式的文字、資料、語言和影片上傳給它,之後再和它對話時,它會學習你上傳的內容後回答你的問題,支援接入多種 LLM 和 Docker 一鍵部署。
GitHub 地址→https://github.com/QuivrHQ/quivr
3. HelloGitHub 熱評
在這個章節,將會分享下本週 HelloGitHub 網站上的熱門開源專案,歡迎與我們分享你上手這些開源專案後的使用體驗。
3.1 面向所有開發者的學習路線圖:developer-roadmap
主語言:Other
這是一份包含後端、前端、運維部署等方向的學習路徑圖,提供了全面、實用、互動式的學習指南,解決開發者面臨技術選型困難、自學路徑不明晰等痛點。
專案詳情→https://hellogithub.com/repository/50587cd6e95e4fb0b3c787104028e9d2
3.2 假裝很忙的摸魚神器:genact
主語言:Rust
該專案可以在終端上模擬一些很忙的假象,比如編譯、掃描、下載等。這些操作都是假的,實際上什麼都沒有發生,所以不會影響你的電腦,適用於 Windows、Linux、macOS 作業系統。
專案詳情→https://hellogithub.com/repository/6a78a0168ffc4a9f931b0ac1983aea9f
4. 結尾
無論是崇拜大神們的技術造詣,還是探索開源世界中的新奇工具,都希望大家可以從中獲得啟發和收穫。如果看完這些還不過癮,可以透過閱讀往期回顧的內容,找到更多熱門開源專案。
往期回顧
- 擁抱開源更省錢
- 為 AI 而生的程式語言
以上為本週的「GitHub 熱點速遞」全部內容,如果你發現其他好玩、有趣的 GitHub 專案,就來 HelloGitHub 和大家一起分享吧。