如何讓程式更健壯「GitHub 熱點速覽」

削微寒發表於2023-02-16

對於 ML 模型訓練而言,好的資料集能讓結果更健壯,cleanlab 是一個降低資料噪音,及時幫你修正資料集錯誤的工具。好的工具能讓你的結果更完美。同樣的,RedTeam-Tools 提高了滲透測試的能力,也間接地讓你的安全系統更牢固。DocsGPT 一看便知它是個 Docs + GPT 的結合體,可以提高文件解決使用者問題的能力。meilisearch 輕量、速度的檢索能力,則提高了 HG 社群的搜尋能力。

以下內容摘錄自微博@HelloGitHub 的 GitHub Trending 及 Hacker News 熱帖(簡稱 HN 熱帖),選項標準:新發布 | 實用 | 有趣,根據專案 release 時間分類,釋出時間不超過 14 day 的專案會標註 New,無該標誌則說明專案 release 超過半月。由於本文篇幅有限,還有部分專案未能在本文展示,望周知 ?

  • 本文目錄
    • 1. 本週特推
      • 1.1 資料集質保:cleanlab
      • 1.2 動畫生成器:motion-canvas
    • 2. GitHub Trending 周榜
      • 2.1 文件助手:DocsGPT
      • 2.2 再現塞爾達 3:zelda3
      • 2.3 滲透工具:RedTeam-Tools
      • 2.4 低程式碼框架:ToolJet
      • 2.5 輕量級搜尋引擎:meilisearch
    • 3. 往期回顧

1. 本週特推

1.1 資料集質保:cleanlab

主語言:Python

資料集是每個資料工程師都會經手的東西,那麼如果這個資料集本身有問題,很多噪音,後續的模型訓練結果就不會多好。而 cleanlab 就能幫你檢測 ML 資料集是否有問題,修正裡面有問題的 label 以及標記錯誤的資料。它適用於 Sklearn / PyTorch / TensorFlow / XGBoost 等等框架,一行程式碼就能找到任意資料集中的資料和標籤錯誤,像這樣:

label_issues = cl.find_label_issues(data, labels)

而這行程式碼能幫你降低資料的噪音,讓訓練出來的模型更健壯:

cl.fit(data, labels)

GitHub 地址→https://github.com/cleanlab/cleanlab

1.2 動畫生成器:motion-canvas

主語言:TypeScript

Motion Canvas 提供了兩樣東西:

  • 一個用於生成程式設計動畫的 TS 庫;
  • 該程式設計動畫的實時預覽;

簡單來說,它能建立向量動畫,並與旁白同步。線上體驗:https://motion-canvas.github.io/editor/quickstart/

GitHub 地址→https://github.com/motion-canvas/motion-canvas

2.1 文件助手:DocsGPT

本週 star 增長數:1,450+主語言:Python、HTML

New 這周 ChatGPT 又燒起來了,這把搞點實際的,這是一個藉助 GPT 模型幫助那些向文件提問、檢索的人快速得到準確、全面的答案。

GitHub 地址→https://github.com/arc53/DocsGPT

2.2 再現塞爾達 3:zelda3

本週 star 增長數:750+主語言:C

塞爾達·眾神的三角力量的逆向工程,它用了 7-8 萬行 C 程式碼來重現經典遊戲,你可以從頭玩到通關。

GitHub 地址→https://github.com/snesrev/zelda3

2.3 滲透工具:RedTeam-Tools

本週 star 增長數:450+

New RedTeam-Tools 供 Red Team 使用的 120+ 技巧和工具,來提高滲透團隊的技術實力。下圖為其中一個工具的截圖:

GitHub 地址→https://github.com/A-poc/RedTeam-Tools

2.4 低程式碼框架:ToolJet

本週 star 增長數:1,800+主語言:JavaScript、TypeScript

一個低程式碼框架,可在幾分鐘內快速構建、部署內部工具。你可以連線到資料庫,比如:PostgreSQL、MongoDB、ES 等等;也支援 API 端點(支援匯入 OpenAPI spec 和 OAuth2 authorization),也支援對接 SaaS 工具,像 Slack、Notion、Google Sheets 之類的都可以接上,還支援物件儲存服務。

GitHub 地址→https://github.com/ToolJet/ToolJet

2.5 輕量級搜尋引擎:meilisearch

本週 star 增長數:850+主語言:Rust

一個輕量、快捷的搜尋引擎,非常適合在應用程式、網站、workflow 中使用。開箱即用,能在非常短時間內給你檢索結果。大家也可以再重溫 1 年半前滷蛋寫的 「相見恨晚!開源的傻瓜搜尋引擎,幫你快速實現搜尋功能」

GitHub 地址→https://github.com/meilisearch/meilisearch

3. 往期回顧

往期回顧:

以上為 2023 年第 6 個工作周的 GitHub Trending ?如果你 Pick 其他好玩、實用的 GitHub 專案,來 HelloGitHub 和大家一起分享下喲 ?

HelloGitHub 交流群現已全面開放,新增微訊號:HelloGitHub001 為好友入群,可同前端、Java、Go 等各界大佬談笑風生、切磋技術~

相關文章