AI浪潮下12大開源神器介紹

我的小熊不見了發表於2023-04-29

Auto-GPT

Auto-GPT是一個實驗性的開源應用程式。這個程式由GPT-4驅動,完全自主的去實現你給機器人佈置的任務。截至發稿,Auto-GPT已經在GitHub上收穫105K star。

專案地址:https://github.com/Significant-Gravitas/Auto-GPT

stable-diffusion

開源的文字到影像模型。

專案地址:https://github.com/CompVis/stable-diffusion

以及基於stable-diffusion的stable-diffusion-webui,可以使用瀏覽器更加方便地體驗文生圖的能力。
sd
專案地址:https://github.com/AUTOMATIC1111/stable-diffusion-webui

gpt4all

一個開源聊天機器人,可以安裝在本地客戶端直接執行。由於訓練資料問題,對中文的支援尚不友好。
gif1

專案地址:https://github.com/nomic-ai/gpt4all

langchain

使用 LLM 串聯構建應用程式。

大型語言模型(LLMs)正在成為一種具有變革性的技術,使開發人員能夠構建以往無法實現的應用程式。然而,僅僅運用這些LLM通常不足以創造出真正強大的應用程式,真正的威力在於將它們與其他計算或知識來源相結合。Auto-GPT也是藉助於這個專案的思想進行構建的。

專案地址:https://github.com/hwchase17/langchain

segment-anything

Segment Anything Model(SAM)是一種先進的影像分割模型,它基於Facebook AI在2020年釋出的Foundation Model3,能夠根據簡單的輸入提示(如點或框)準確地分割影像中的任何物件,並且無需額外訓練就能適應不熟悉的物件和影像4。它利用了傳統的計算機視覺技術和深度學習演算法,在一個涵蓋1100萬張圖片和11億個掩碼的龐大資料集上進行了訓練,展現出了卓越的零樣本效能。
img2

專案地址:https://github.com/facebookresearch/segment-anything

llama

Meta開源的大語言模型。

專案地址:https://github.com/facebookresearch/llama

基於llama的C++版本 llama.cpp。

專案地址:https://github.com/ggerganov/llama.cpp

img3

DeepSpeed

DeepSpeed 是由微軟開源的一個深度學習最佳化庫,旨在使大語言模型的訓練更簡單、高效和迅速。

專案地址:https://github.com/microsoft/DeepSpeed

ChatGLM-6B

ChatGLM-6B 是一個開源的、支援中英雙語的對話語言模型,基於 General Language Model (GLM) 架構,具有 62 億引數。結合模型量化技術,使用者可以在消費級的顯示卡上進行本地部署(INT4 量化級別下最低只需 6GB 視訊記憶體)。

gif4

專案地址:https://github.com/THUDM/ChatGLM-6B

whisper

OpenAI 的 Whisper 自動語音識別 (ASR) 模型。

專案地址:https://github.com/Const-me/Whisper

以及基於Whisper的C++版本whisper.cpp。

專案地址:https://github.com/ggerganov/whisper.cpp

以及基於Whisper並使用 CTranslate2 進行提速的faster-whisper。

專案地址:https://github.com/guillaumekln/faster-whisper

Vicuna

開源的LLM聊天機器人。可以達到 GPT4 90%的水平。

gif5

專案地址;https://github.com/lm-sys/FastChat

MiniGPT-4

具有影像理解能力的機器人。

img6

fauxpilot

用於替代GitHub Copilot的開源程式設計助手,

專案地址:https://github.com/fauxpilot/fauxpilot

相關文章