碉堡!“萬物皆可分”標記模型上線「GitHub 熱點速覽」

削微寒發表於2023-04-10

這周有個讓人眼前一亮的影像識別模型 segment-anything,它能精細地框出所有可見物體,它標記出的物體邊界線清晰可見。如此出色的模型,自然獲得了不少人的讚賞,開源沒幾天,就拿下了 18k+ 的 star,而上週開源不到 48 小時獲得 35k+ star 的推特推薦演算法,本週也成功突破 50k+ 關卡。

依舊是 AI 熱度不減的一週,本週的 AI 專場收錄了一個離線生圖工具,以及一個自託管 AI 程式設計助手。此外,還有 Meta 開源出來的重構版構建系統 buck2 也是大受歡迎,還有隨著各類 AI 工具火起來的向量資料庫,weaviate 也小小地展露了下頭角。

還有比較少見的工具類應用,一款極簡的輸入法 rime-ice 也值得一看。

以下內容摘錄自微博@HelloGitHub 的 GitHub Trending 及 Hacker News 熱帖(簡稱 HN 熱帖),選項標準:新發布 | 實用 | 有趣,根據專案 release 時間分類,釋出時間不超過 14 day 的專案會標註 New,無該標誌則說明專案 release 超過半月。由於本文篇幅有限,還有部分專案未能在本文展示,望周知 ?

  • 本文目錄
    • 1. 本週特推
      • 1.1 AI 專場
      • 1.2 Meta 開源構建系統:buck2
    • 2. GitHub Trending 周榜
      • 2.1 嵌入式資料庫:chroma
      • 2.2 萬物皆可分:segment-anything
      • 2.3 流處理:arroyo
      • 2.4 極簡輸入法:rime-ice
      • 2.5 向量資料庫:weaviate
    • 3. HelloGitHub 熱評
      • 3.1 GIF 錄屏工具:ScreenToGif
      • 3.2 Nginx 視覺化管理平臺:nginx-proxy-manager
    • 4. 往期回顧

1. 本週特推

1.1 AI 專場

在這波 AI 熱度消退之前,熱點趨勢的特推部分會增加一個模組來分享新的 AI 應用。

macOS 跑 SD:MochiDiffusion

主語言:Swift

New MochiDiffusion 內建 Apple 的 Core ML Stable Diffusion 框架,以實現在搭載 Apple 晶片上用極低的記憶體佔用發揮出模型最優效能。部分特性:

  • 可離線生圖
  • 高效能,極低的記憶體佔用
  • 圖轉圖,Image2Image
  • 自定義 Stable Diffusion Core ML 模型
  • 無需擔心損壞模型

GitHub 地址→https://github.com/godly-devotion/MochiDiffusion

自託管 AI 程式設計助手:tabby

主語言:Python、TypeScript

New 自託管的 AI 程式設計助手,可作為 Copilot 的替代品。特性:

  • 無需資料庫和雲服務;
  • 具有視覺化、配置模型和 MLOps 的 Web 介面;
  • 接入 OpenAPI;
  • 消費級別的 GPU 支援(用不同方法最佳化的 FP-16 權重載入)

GitHub 地址→https://github.com/TabbyML/tabby

1.2 Meta 開源構建系統:buck2

主語言:Rust

Meta 開源的大規模構建系統 buck2 繼承於 buck1,但是不同於 buck1 採用 Java 編寫,buck2 由 Rust 編寫而成。重構 buck1 的想法源自想要提供更快速、更高效的構建服務,buck2 有以下特性:

  • 解耦特定語言規則,buck2 的核心構建系統沒有任何特定的語言規則,這意味著它有更好的可擴充套件性。buck2 核心部分用 Rust 編寫,語言規則部分(例如:如何構建 C++)由 Starklark 編寫;
  • 構建系統由單一增量依賴圖提供支援,由此消減多類 bug 並增加併發性;
  • 規則 API 的設計主要為提供先進的效能特性,以及動態依賴特徵;
  • 整合遠端執行,能在遠端機器執行操作,它採用了同 Bazel 一樣的 API,並已經用 Buildbarn 和 EngFlow 進行遠端執行測試;
  • 整合虛擬檔案系統,不用整倉檢測,按需獲取檔案即可;

GitHub 地址→https://github.com/facebook/buck2

2.1 嵌入式資料庫:chroma

本週 star 增長數:1,200+主語言:Python、TypeScript

Chroma 是一個用於 Python / JavaScript LLM 應用程式的嵌入式資料庫,它具有記憶體快速訪問的優勢。它只有 4 個核心函式:

import chromadb
# setup Chroma in-memory, for easy prototyping. Can add persistence easily!
client = chromadb.Client()

# Create collection. get_collection, get_or_create_collection, delete_collection also available!
collection = client.create_collection("all-my-documents") 

# Add docs to the collection. Can also update and delete. Row-based API coming soon!
collection.add(
    documents=["This is document1", "This is document2"], # we handle tokenization, embedding, and indexing automatically. You can skip that and add your own embeddings as well
    metadatas=[{"source": "notion"}, {"source": "google-docs"}], # filter on these!
    ids=["doc1", "doc2"], # unique for each doc 
)

# Query/search 2 most similar results. You can also .get by id
results = collection.query(
    query_texts=["This is a query document"],
    n_results=2,
    # where={"metadata_field": "is_equal_to_this"}, # optional filter
    # where_document={"$contains":"search_string"}  # optional filter
)

GitHub 地址→https://github.com/chroma-core/chroma

2.2 萬物皆可分:segment-anything

本週 star 增長數:18,000+主語言:Jupyter Notebook

New 這個程式碼庫提供了使用 SegmentAnything 模型(SAM)進行推理的程式碼,SAM 是一種輸入諸如點、框等 prompt 生成高質量目標 mask 的模型,它有非常出彩的標記效果。btw,專案開源不到一週已經有 18k+ star。

GitHub 地址→https://github.com/facebookresearch/segment-anything

2.3 流處理:arroyo

本週 star 增長數:700+主語言:Rust、TypeScript

New arroyo 是一個 Rust 編寫的分散式流處理引擎,旨在高效地對流資料進行狀態計算。與傳統的批處理不同,流處理引擎可以處理有界和無界資料來源,一旦結果可用就立即輸出。

GitHub 地址→https://github.com/ArroyoSystems/arroyo

2.4 極簡輸入法:rime-ice

本週 star 增長數 1,850+主語言:Go、Lua

霧凇拼音一個極簡風的輸入法,支援簡體、全拼、雙拼。值得一提的事,作者自己維護了一個詞庫:

  • 8105 字表
  • base 基礎詞庫
  • sogou 搜狗流行詞
  • ext 擴充套件詞庫,小詞庫
  • tencent 擴充套件詞庫,大詞庫
  • Emoji

GitHub 地址→https://github.com/iDvel/rime-ice

2.5 向量資料庫:weaviate

本週 star 增長數:500+主語言:Go

Weaviate 是一個開源的向量資料庫,可以儲存物件和向量,允許將向量搜尋與結構化過濾相結合,並具有云原生資料庫的容錯性和可擴充套件性,可透過 GraphQL、REST 和各種語言客戶端進行訪問。

GitHub 地址→https://github.com/weaviate/weaviate

3. HelloGitHub 熱評

在這個章節,我們將會分享下本週 HelloGitHub 網站上的熱評專案,HG 開源專案評價體系剛上線不久,期待你的評價 ?

3.1 GIF 錄屏工具:ScreenToGif

主語言:C#

一款 Windows 上的免費 GIF 錄屏工具,易安裝、好上手,支援錄製指定區域畫面,且可以將影片匯出為 gif 等檔案格式。

HG 評價地址→https://hellogithub.com/repository/b49e4c9dd1834dc1b9f3352c89ef0239

3.2 Nginx 視覺化管理平臺:nginx-proxy-manager

主語言:JavaScript

它開箱即用,支援 Docker 一鍵部署,可以讓使用者透過 Web 介面線上配置、管理 Nginx 服務,支援轉發、重定向、SSL 證照、高階配置等功能。

HG 評價地址→https://hellogithub.com/repository/43d04968e8ed4bdfae28023b1c450291

4. 往期回顧

往期回顧:

以上為 2023 年第 14 個工作周的 GitHub Trending ?如果你 Pick 其他好玩、實用的 GitHub 專案,來 HelloGitHub 和大家一起分享下喲 ?

HelloGitHub 交流群現已全面開放,新增微訊號:HelloGitHub001 為好友入群,可同前端、Java、Go 等各界大佬談笑風生、切磋技術~

相關文章