近日,Meta(原 Facebook)開源了他們公司的新一代大模型 Llama 3,雖然目前只放出了 8B 和 70B 兩個版本,但是在評估結果上已經優於 Claude 3 Sonnet、Mistral Medium 和 GPT-3.5 等大模型。Meta 官方還表示,這些只是開胃菜,更強的 400B 引數的模型已經在訓練中了,預計幾個月後將和大家見面(開源與否尚不明確)。
說回上週的熱門開源專案,最近基於 LLM 構建知識庫的開源專案很火,但我一個都沒收錄。因為如果是本地起大模型效果不好,請求大模型的 API 又不免費,所以我找到了一個 OpenAI API 反向代理開源專案,可用來實現免費白嫖 OpenAI API。內容也是知識庫的關鍵,Reader 能夠將網頁內容轉化成 LLM 友好的文字。對於沒有程式設計基礎的小夥伴,這有一個 30-Days-Of-Python 的開源教程,學它!當然,學習之餘也可以娛樂一下,比如試試‘無名殺’,這是一款類似於三國殺的開源卡牌遊戲。
- 本文目錄
- 1. 開源新聞
- 1.1 Meta 開源 Llama 3 大模型
- 2. 開源熱搜專案
- 2.1 OpenAI API 免費反向代理:ChatGPT
- 2.2 一門新興的系統級程式語言:Zig
- 2.3 將網頁內容轉化成 LLM 友好的文字:Reader
- 2.4 三國殺型別的卡牌遊戲:noname
- 2.5 為期 30 天的 Python 程式設計挑戰:30-Days-Of-Python
- 3. HelloGitHub 熱評
- 3.1 自定義 Windows 工作列透明度的小工具:TranslucentTB
- 3.2 跨平臺的手寫筆記和繪圖應用:Rnote
- 4. 結尾
- 1. 開源新聞
1. 開源新聞
1.1 Meta 開源 Llama 3 大模型
今年初,祖克伯就曾公開解釋過:Meta 為什麼開源 Llama 模型?
- 改進模型:開源可以藉助社群的力量持續提升模型的質量,因為社群的反饋和審查有助於安全性和執行效率的提升,而這對每個人都有益。
- 產品發展:雖然開源並不排除將模型轉化為商業產品的可能性,開源模型的領導者可以將社群創新整合進自家產品中,提高產品競爭力。
- 行業標準:開源軟體有潛力成為行業標準,從而促進技術發展和統一性。
- 吸引人才:由於開發者和研究人員更傾向於參與開源專案,開源策略可以幫助公司吸引和招聘到行業內的優秀人才。
最新發布的 Llama 3 相較於 Llama 2 在引數規模、訓練資料集、模型架構(GQA)、效能、多語言支援、推理和程式碼生成方面都有所提升,但現在對中文支援的不是很好,而且 meta.ai 上用的還是 Llama 2。
GitHub 地址:github.com/meta-llama/llama3
2. 開源熱搜專案
2.1 OpenAI API 免費反向代理:ChatGPT
主語言:TypeScript,Star:3.7k,周增長:1k
雖然現在無需登陸就可以免費使用 ChatGPT(gpt-3.5-turbo 模型),但如果是想用介面的話還要收費的。該專案就是基於免費的 ChatGPT 網站服務,將其轉化成免費的 ChatGPT API,介面返回和官方一致,支援 Docker 部署。需要注意的是部署的伺服器,要在 OpenAI 服務支援的國家和地區。
GitHub 地址→github.com/PawanOsman/ChatGPT
2.2 一門新興的系統級程式語言:Zig
主語言:Zig,Star:30k,周增長:300
這是一種命令式、通用、靜態型別、編譯的系統程式語言,注重效能、安全和可讀性。它支援編譯時泛型與反射、交叉編譯以及手動儲存器管理,目標為改進 C 語言,可以輕鬆地和 C 語言的程式碼庫配合工作。Zig 簡潔且直接,沒有隱式控制流、沒有隱式記憶體分配、沒有前處理器、沒有宏,特別適合用於開發編譯器、作業系統核心、桌面應用、效能敏感的應用、嵌入式系統等。
const std = @import("std");
const parseInt = std.fmt.parseInt;
test "parse integers" {
const input = "123 67 89,99";
const ally = std.testing.allocator;
var list = std.ArrayList(u32).init(ally);
// Ensure the list is freed at scope exit.
// Try commenting out this line!
defer list.deinit();
var it = std.mem.tokenizeAny(u8, input, " ,");
while (it.next()) |num| {
const n = try parseInt(u32, num, 10);
try list.append(n);
}
const expected = [_]u32{ 123, 67, 89, 99 };
for (expected, list.items) |exp, actual| {
try std.testing.expectEqual(exp, actual);
}
}
GitHub 地址→github.com/ziglang/zig
2.3 將網頁內容轉化成 LLM 友好的文字:Reader
主語言:TypeScript,Star:3k,周增長:2.5k
該專案可以將指定的 URL 內容轉化為乾淨、LLM 友好的文字,從而提高 Agent 和 RAG 系統的輸入質量,可作為構建知識庫的一環。我試用了一下,內容提取效果不錯,但是對於需要登陸才能訪問的 URL 就不行了。
GitHub 地址→github.com/jina-ai/reader
2.4 三國殺型別的卡牌遊戲:noname
主語言:JavaScript,Star:1.9k,周增長:100
「無名殺」是一款以三國為背景的卡牌策略遊戲,它完全免費、無廣告,玩法和三國殺一樣,但自由度高很多,有海量武將可供玩家選擇,還支援自制武將和技能,提供了身份、國戰、鬥地主、塔防、單挑、聯機等遊戲模式。
GitHub 地址→github.com/libccy/noname
2.5 為期 30 天的 Python 程式設計挑戰:30-Days-Of-Python
主語言:Python,Star:31k,周增長:600
該專案是幫助人們在 30 天內學會 Python 程式語言,透過每天的練習和學習,逐漸掌握 Python 的基礎和進階知識,全部完成可能需要超過 100 天。該教程適合想要快速入門 Python 的初學者,或者對 Python 有一定了解,想透過實踐深入理解 Python 的開發者。
GitHub 地址→github.com/Asabeneh/30-Days-Of-Python
3. HelloGitHub 熱評
在這個章節,將會分享下本週 HelloGitHub 網站上的熱門開源專案,歡迎與我們分享你上手這些開源專案後的使用體驗。
3.1 自定義 Windows 工作列透明度的小工具:TranslucentTB
主語言:C++
該專案是採用 C++ 開發的用於調整 Windows 工作列透明度的工具,它體積小、免費、簡單易用,支援 5 種工作列狀態、6 種動態模式、Windows 10/11 作業系統。
專案詳情→hellogithub.com/repository/48c9ce6373cd4e108d74bcb4f8ac7a41
3.2 跨平臺的手寫筆記和繪圖應用:Rnote
主語言:Rust
這是一款用 Rust 和 GTK4 編寫的繪圖應用,可用於繪製草圖、手寫筆記和註釋文件等。它支援匯入/匯出 PDF 和圖片檔案,以及無限畫布、拖放、自動儲存等功能。適用於 Windows、Linux 和 macOS 系統,需要搭配手寫板使用。
專案詳情→hellogithub.com/repository/1d768cfa742c4fcd9c0a0bd4374cb425
4. 結尾
在結束本週「GitHub 熱點速遞」的精彩內容後,希望這些開源專案能夠對大家有所啟發,幫助你們找到新的工具、學習資源或是娛樂專案。如果看完這些還不過癮,可以透過閱讀「往期回顧」的內容,找到更多熱門開源專案。
往期回顧
- 一週漲 15k Star 的開源專案
- 擁抱開源更省錢
以上為本週的「GitHub 熱點速遞」全部內容,如果你發現其他好玩、有趣的 GitHub 專案,就來 HelloGitHub 和大家一起分享吧。