Llama 3 開源了「GitHub 熱點速覽」

削微寒發表於2024-04-23

近日,Meta(原 Facebook)開源了他們公司的新一代大模型 Llama 3,雖然目前只放出了 8B 和 70B 兩個版本,但是在評估結果上已經優於 Claude 3 Sonnet、Mistral Medium 和 GPT-3.5 等大模型。Meta 官方還表示,這些只是開胃菜,更強的 400B 引數的模型已經在訓練中了,預計幾個月後將和大家見面(開源與否尚不明確)。

說回上週的熱門開源專案,最近基於 LLM 構建知識庫的開源專案很火,但我一個都沒收錄。因為如果是本地起大模型效果不好,請求大模型的 API 又不免費,所以我找到了一個 OpenAI API 反向代理開源專案,可用來實現免費白嫖 OpenAI API。內容也是知識庫的關鍵,Reader 能夠將網頁內容轉化成 LLM 友好的文字。對於沒有程式設計基礎的小夥伴,這有一個 30-Days-Of-Python 的開源教程,學它!當然,學習之餘也可以娛樂一下,比如試試‘無名殺’,這是一款類似於三國殺的開源卡牌遊戲。

  • 本文目錄
    • 1. 開源新聞
      • 1.1 Meta 開源 Llama 3 大模型
    • 2. 開源熱搜專案
      • 2.1 OpenAI API 免費反向代理:ChatGPT
      • 2.2 一門新興的系統級程式語言:Zig
      • 2.3 將網頁內容轉化成 LLM 友好的文字:Reader
      • 2.4 三國殺型別的卡牌遊戲:noname
      • 2.5 為期 30 天的 Python 程式設計挑戰:30-Days-Of-Python
    • 3. HelloGitHub 熱評
      • 3.1 自定義 Windows 工作列透明度的小工具:TranslucentTB
      • 3.2 跨平臺的手寫筆記和繪圖應用:Rnote
    • 4. 結尾

1. 開源新聞

1.1 Meta 開源 Llama 3 大模型

今年初,祖克伯就曾公開解釋過:​Meta 為什麼開源 Llama 模型?

  1. 改進模型:開源可以藉助社群的力量持續提升模型的質量,因為社群的反饋和審查有助於安全性和執行效率的提升,而這對每個人都有益。
  2. 產品發展:雖然開源並不排除將模型轉化為商業產品的可能性,開源模型的領導者可以將社群創新整合進自家產品中,提高產品競爭力。
  3. 行業標準:開源軟體有潛力成為行業標準,從而促進技術發展和統一性。
  4. 吸引人才:由於開發者和研究人員更傾向於參與開源專案,開源策略可以幫助公司吸引和招聘到行業內的優秀人才。

最新發布的 Llama 3 相較於 Llama 2 在引數規模、訓練資料集、模型架構(GQA)、效能、多語言支援、推理和程式碼生成方面都有所提升,但現在對中文支援的不是很好,而且 meta.ai 上用的還是 Llama 2。

GitHub 地址:github.com/meta-llama/llama3

2. 開源熱搜專案

2.1 OpenAI API 免費反向代理:ChatGPT

主語言:TypeScriptStar:3.7k周增長:1k

雖然現在無需登陸就可以免費使用 ChatGPT(gpt-3.5-turbo 模型),但如果是想用介面的話還要收費的。該專案就是基於免費的 ChatGPT 網站服務,將其轉化成免費的 ChatGPT API,介面返回和官方一致,支援 Docker 部署。需要注意的是部署的伺服器,要在 OpenAI 服務支援的國家和地區。

GitHub 地址→github.com/PawanOsman/ChatGPT

2.2 一門新興的系統級程式語言:Zig

主語言:ZigStar:30k周增長:300

這是一種命令式、通用、靜態型別、編譯的系統程式語言,注重效能、安全和可讀性。它支援編譯時泛型與反射、交叉編譯以及手動儲存器管理,目標為改進 C 語言,可以輕鬆地和 C 語言的程式碼庫配合工作。Zig 簡潔且直接,沒有隱式控制流、沒有隱式記憶體分配、沒有前處理器、沒有宏,特別適合用於開發編譯器、作業系統核心、桌面應用、效能敏感的應用、嵌入式系統等。

const std = @import("std");
const parseInt = std.fmt.parseInt;

test "parse integers" {
    const input = "123 67 89,99";
    const ally = std.testing.allocator;

    var list = std.ArrayList(u32).init(ally);
    // Ensure the list is freed at scope exit.
    // Try commenting out this line!
    defer list.deinit();

    var it = std.mem.tokenizeAny(u8, input, " ,");
    while (it.next()) |num| {
        const n = try parseInt(u32, num, 10);
        try list.append(n);
    }

    const expected = [_]u32{ 123, 67, 89, 99 };

    for (expected, list.items) |exp, actual| {
        try std.testing.expectEqual(exp, actual);
    }
}

GitHub 地址→github.com/ziglang/zig

2.3 將網頁內容轉化成 LLM 友好的文字:Reader

主語言:TypeScriptStar:3k周增長:2.5k

該專案可以將指定的 URL 內容轉化為乾淨、LLM 友好的文字,從而提高 Agent 和 RAG 系統的輸入質量,可作為構建知識庫的一環。我試用了一下,內容提取效果不錯,但是對於需要登陸才能訪問的 URL 就不行了。

GitHub 地址→github.com/jina-ai/reader

2.4 三國殺型別的卡牌遊戲:noname

主語言:JavaScriptStar:1.9k周增長:100

「無名殺」是一款以三國為背景的卡牌策略遊戲,它完全免費、無廣告,玩法和三國殺一樣,但自由度高很多,有海量武將可供玩家選擇,還支援自制武將和技能,提供了身份、國戰、鬥地主、塔防、單挑、聯機等遊戲模式。

GitHub 地址→github.com/libccy/noname

2.5 為期 30 天的 Python 程式設計挑戰:30-Days-Of-Python

主語言:PythonStar:31k周增長:600

該專案是幫助人們在 30 天內學會 Python 程式語言,透過每天的練習和學習,逐漸掌握 Python 的基礎和進階知識,全部完成可能需要超過 100 天。該教程適合想要快速入門 Python 的初學者,或者對 Python 有一定了解,想透過實踐深入理解 Python 的開發者。

GitHub 地址→github.com/Asabeneh/30-Days-Of-Python

3. HelloGitHub 熱評

在這個章節,將會分享下本週 HelloGitHub 網站上的熱門開源專案,歡迎與我們分享你上手這些開源專案後的使用體驗。

3.1 自定義 Windows 工作列透明度的小工具:TranslucentTB

主語言:C++

該專案是採用 C++ 開發的用於調整 Windows 工作列透明度的工具,它體積小、免費、簡單易用,支援 5 種工作列狀態、6 種動態模式、Windows 10/11 作業系統。

專案詳情→hellogithub.com/repository/48c9ce6373cd4e108d74bcb4f8ac7a41

3.2 跨平臺的手寫筆記和繪圖應用:Rnote

主語言:Rust

這是一款用 Rust 和 GTK4 編寫的繪圖應用,可用於繪製草圖、手寫筆記和註釋文件等。它支援匯入/匯出 PDF 和圖片檔案,以及無限畫布、拖放、自動儲存等功能。適用於 Windows、Linux 和 macOS 系統,需要搭配手寫板使用。

專案詳情→hellogithub.com/repository/1d768cfa742c4fcd9c0a0bd4374cb425

4. 結尾

在結束本週「GitHub 熱點速遞」的精彩內容後,希望這些開源專案能夠對大家有所啟發,幫助你們找到新的工具、學習資源或是娛樂專案。如果看完這些還不過癮,可以透過閱讀「往期回顧」的內容,找到更多熱門開源專案。

往期回顧

  • 一週漲 15k Star 的開源專案
  • 擁抱開源更省錢

以上為本週的「GitHub 熱點速遞」全部內容,如果你發現其他好玩、有趣的 GitHub 專案,就來 HelloGitHub 和大家一起分享吧。

相關文章