LLM技術全景圖:技術人必備的技術指南,一張圖帶你掌握從基礎設施到AI應用的全面梳理
LLM 技術圖譜(LLM Tech Map)是將 LLM 相關技術進行系統化和圖形化的呈現,此圖譜主要特點是“專注於技術人視角”,不求從 LLM 產業角度匯聚資訊,而是希望讓從事相關工作或是想了解 LLM 的技術人有一個快速感知。
LLM 技術圖譜(LLM Tech Map)從基礎設施、大模型、Agent、AI 程式設計、工具和平臺,以及算力幾個方面,為開發者整理了當前 LLM 中最為熱門和硬核的技術領域以及相關的軟體產品和開源專案。
核心價值:幫助技術人快速瞭解 LLM 的核心技術和關鍵方向。
1.基礎設施
LLM 技術圖譜(LLM Tech Map)的基礎設施部分主要包括以下幾個方面:
- 向量資料庫:向量資料庫是專門用於儲存和檢索向量資料的資料庫,它可以為 LLM 提供高效的儲存和檢索能力。
- 資料庫向量支援:傳統資料庫通常不支援向量資料的儲存和檢索,資料庫向量支援可以為傳統資料庫新增向量資料的儲存和檢索能力。
- 大模型框架、微調 (Fine Tuning):針對大模型的開發。
- 大模型訓練平臺與工具
1.1向量資料庫
- Milvus
- Pinecone
- Weaviate
- Chroma
- Qdrant
- Vespa
- Vald
- Faiss
- ScaNN
- Vearch
- AquilaDB
- Marqo
- LanceDB
- Annoy
- NucliaDB
- DeepLake
- MongoDB
1.2資料庫向量支援
- pgvector
- Redis Vector
- Elastic
- SingleStoreDB
- Solr
- OpenSearch
- ClickHouse
- Rockset
- Cassandra
- Lucene
- Neo4j
- Kinetica
- Supabase
- Timescale
1.3大模型框架、微調 (Fine Tuning)
- OneFlow
- LMFlow
- LoRA
- Alpaca-LoRA
- PEFT
- ChatGLM-Efficient-Tuning
- LLaMA-Efficient-Tuning
- P-tuning v2
- OpenLLM
- h2o-llmstudio
- xTuring
- finetuner
- YiVal
1.4大模型訓練平臺與工具
- Pytorch
- BMtrain
- colossalAI
- Tensorflow
- PaddlePaddle
- MindSpore
- Deepspeed
- XGBoost
- Transformers
- Apache MXNet
- Ray
2.大模型
LLM 技術圖譜(LLM Tech Map)的大模型部分主要包括以下幾個方面:
- 備案上線的中國大模型:有牌照提供服務的大模型,需要注意的是大模型和相應的產品多半名稱不同。
- 知名大模型:在全球範圍內,已經發布了多款知名大模型,這些大模型在各個領域都取得了突破性的進展。
- 知名大模型應用:LLM 已經在多種應用場景中得到了應用,包括文字生成、機器翻譯、問答、自然語言推理等。
2.1中國大模型
- 文心一言
- 雲雀
- GLM
- 紫東太初
- 百川
- 日日新
- ABAB 大模型
- 書生通用大模型
- 混元大模型
2.2知名大模型
- Llama 2
- OpenLLaMA
- 百川
- 通義大模型
- 文心一言
- StableLM
- MOSS
- Dolly
- BLOOM
- Falcon LLM
- ChatGLM
- PaLM 2
- 盤古
- GPT-4
- Stable Diffusion
- DALL·E 3
2.3 知名大模型應用
- ChatGPT
- Claude
- Cursor
- Mochi Diffusion
- Midjourey
- DragGAN
- Bard
- Bing
3.AI Agent(LLM Agent)
AI Agent是一種能夠自主運作並完成特定任務的計算實體或程式。它能夠透過感測器感知周圍環境,並根據感知到的資訊做出決策,然後透過執行器採取行動。LLM Agent 是指基於 LLM 技術構建的智慧代理,它可以用於各種任務,比如讓機器與 ChatGPT 互動,一層一層挖掘資訊,自動化完成任務;比如由機器人構成的虛擬小鎮。
-
核心特點
- 自主性:AI Agent具有獨立思考和行動的能力,能夠在沒有人類直接指導的情況下完成任務。
- 互動性:AI Agent能夠與環境或其他Agent進行互動,這在遊戲、對話系統、推薦系統等場景中尤為重要。
- 目的性:AI Agent設計有明確的目標或意圖,其行為是為了實現這些目標。
- 適應性:AI Agent能夠根據環境的變化調整自己的行為,以適應新的情境。
- 進化性:隨著技術的發展,AI Agent的功能和智慧水平也在不斷提升。
-
技術特點
- AI Agent與大模型的主要區別在於,大模型與人類之間的互動是基於prompt實現的,而AI Agent僅需給定一個目標,它就能夠針對目標獨立思考並做出行動。
- AI Agent的核心驅動力是大模型,並在此基礎上增加了規劃(Planning)、記憶(Memory)和工具使用(Tool Use)三個關鍵元件。
-
型別從工作模式來看,AI Agent可以分為以下三種型別:
- 單Agent:側重於執行單一任務或一系列相關任務,且不需要與其他智慧體進行互動。
- 多Agent:涉及多個智慧體之間的協作和互動,以完成更復雜的任務。
- 混合Agent(人機互動Agent):結合了人類和智慧體的互動,以實現更高效的任務執行。
-
Rivet
-
JARVIS
-
MetaGPT
-
AutoGPT
-
BabyAGI
-
NexusGPT
-
Generative Agents
-
Voyager
-
GPTeam
-
GPT Researcher
-
Amazon Bedrock Agents
4.AI 程式設計
AI程式設計是指利用計算機程式語言和技術來建立、訓練和最佳化人工智慧演算法的過程。它涵蓋了資料的收集、清洗、轉換以及演算法的選擇和應用。AI程式設計是構建未來智慧系統的關鍵,透過模擬人類智慧的能力,使計算機能夠執行類似於人類的決策和任務。程式語言如Python因其強大的資料處理庫和簡潔的語法,成為AI程式設計的常用工具。
- codeium.vim
- Cursor
- GitHub Copilot
- Comate
- StableCode
- CodeGeeX
- TabbyML
- CodeArts Snap
- Code Llama
- CodeFuse
- 姜子牙
- CodeShell
5.工具和平臺
LLM 技術圖譜(LLM Tech Map)的工具和平臺部分主要包括以下幾個方面:
- LLMOps:簡單點說(大家當前在說的),就是“快速從大模型到應用”。
- 大模型聚合平臺:匯聚大模型能力,提供服務。
- 開發工具:其它開發相關的 LLM 工具。
5.1 LLMOps
- BentoML
- LangChain
- Dify.ai
- Semantic Kernel
- Arize-Phoenix
- GPTCache
- Flowise
5.2 大模型聚合平臺(☆)
- Gitee AI
- SOTA!模型
- 魔搭ModelScope
- Hugging Face
5.3 開發工具
- v0
- txtai
- Jina-AI
- Deco
- imgcook
- Quest AI
- CodiumAI
- Codeium Vim
- Project IDX
- MakerSuite
6.算力
LLM 模型的訓練和部署需要大量的算力,算力是 LLM 技術發展的關鍵因素。
- 英偉達
- 昇騰
- AMD
- 海光
- 崑崙芯
- 天數智芯