對於 ML 模型訓練而言,好的資料集能讓結果更健壯,cleanlab 是一個降低資料噪音,及時幫你修正資料集錯誤的工具。好的工具能讓你的結果更完美。同樣的,RedTeam-Tools 提高了滲透測試的能力,也間接地讓你的安全系統更牢固。DocsGPT 一看便知它是個 Docs + GPT 的結合體,可以提高文件解決使用者問題的能力。meilisearch 輕量、速度的檢索能力,則提高了 HG 社群的搜尋能力。
以下內容摘錄自微博@HelloGitHub 的 GitHub Trending 及 Hacker News 熱帖(簡稱 HN 熱帖),選項標準:新發布
| 實用
| 有趣
,根據專案 release 時間分類,釋出時間不超過 14 day 的專案會標註 New
,無該標誌則說明專案 release 超過半月。由於本文篇幅有限,還有部分專案未能在本文展示,望周知 ?
- 本文目錄
- 1. 本週特推
- 1.1 資料集質保:cleanlab
- 1.2 動畫生成器:motion-canvas
- 2. GitHub Trending 周榜
- 2.1 文件助手:DocsGPT
- 2.2 再現塞爾達 3:zelda3
- 2.3 滲透工具:RedTeam-Tools
- 2.4 低程式碼框架:ToolJet
- 2.5 輕量級搜尋引擎:meilisearch
- 3. 往期回顧
- 1. 本週特推
1. 本週特推
1.1 資料集質保:cleanlab
主語言:Python
資料集是每個資料工程師都會經手的東西,那麼如果這個資料集本身有問題,很多噪音,後續的模型訓練結果就不會多好。而 cleanlab 就能幫你檢測 ML 資料集是否有問題,修正裡面有問題的 label 以及標記錯誤的資料。它適用於 Sklearn / PyTorch / TensorFlow / XGBoost 等等框架,一行程式碼就能找到任意資料集中的資料和標籤錯誤,像這樣:
label_issues = cl.find_label_issues(data, labels)
而這行程式碼能幫你降低資料的噪音,讓訓練出來的模型更健壯:
cl.fit(data, labels)
GitHub 地址→https://github.com/cleanlab/cleanlab
1.2 動畫生成器:motion-canvas
主語言:TypeScript
Motion Canvas 提供了兩樣東西:
- 一個用於生成程式設計動畫的 TS 庫;
- 該程式設計動畫的實時預覽;
簡單來說,它能建立向量動畫,並與旁白同步。線上體驗:https://motion-canvas.github.io/editor/quickstart/
2. GitHub Trending 周榜
2.1 文件助手:DocsGPT
本週 star 增長數:1,450+,主語言:Python、HTML
New
這周 ChatGPT 又燒起來了,這把搞點實際的,這是一個藉助 GPT 模型幫助那些向文件提問、檢索的人快速得到準確、全面的答案。
GitHub 地址→https://github.com/arc53/DocsGPT
2.2 再現塞爾達 3:zelda3
本週 star 增長數:750+,主語言:C
塞爾達·眾神的三角力量的逆向工程,它用了 7-8 萬行 C 程式碼來重現經典遊戲,你可以從頭玩到通關。
GitHub 地址→https://github.com/snesrev/zelda3
2.3 滲透工具:RedTeam-Tools
本週 star 增長數:450+
New
RedTeam-Tools 供 Red Team 使用的 120+ 技巧和工具,來提高滲透團隊的技術實力。下圖為其中一個工具的截圖:
GitHub 地址→https://github.com/A-poc/RedTeam-Tools
2.4 低程式碼框架:ToolJet
本週 star 增長數:1,800+,主語言:JavaScript、TypeScript
一個低程式碼框架,可在幾分鐘內快速構建、部署內部工具。你可以連線到資料庫,比如:PostgreSQL、MongoDB、ES 等等;也支援 API 端點(支援匯入 OpenAPI spec 和 OAuth2 authorization),也支援對接 SaaS 工具,像 Slack、Notion、Google Sheets 之類的都可以接上,還支援物件儲存服務。
GitHub 地址→https://github.com/ToolJet/ToolJet
2.5 輕量級搜尋引擎:meilisearch
本週 star 增長數:850+,主語言:Rust
一個輕量、快捷的搜尋引擎,非常適合在應用程式、網站、workflow 中使用。開箱即用,能在非常短時間內給你檢索結果。大家也可以再重溫 1 年半前滷蛋寫的 「相見恨晚!開源的傻瓜搜尋引擎,幫你快速實現搜尋功能」。
3. 往期回顧
往期回顧:
以上為 2023 年第 6 個工作周的 GitHub Trending ?如果你 Pick 其他好玩、實用的 GitHub 專案,來 HelloGitHub 和大家一起分享下喲 ?
HelloGitHub 交流群現已全面開放,新增微訊號:HelloGitHub001 為好友入群,可同前端、Java、Go 等各界大佬談笑風生、切磋技術~