LLM技術全景圖：技術人必備的技術指南，一張圖帶你掌握從基礎設施到AI應用的全面梳理

汀、人工智能發表於2024-06-23

LLM技術全景圖：技術人必備的技術指南，一張圖帶你掌握從基礎設施到AI應用的全面梳理

LLM 技術圖譜（LLM Tech Map）是將 LLM 相關技術進行系統化和圖形化的呈現，此圖譜主要特點是“專注於技術人視角”，不求從 LLM 產業角度匯聚資訊，而是希望讓從事相關工作或是想了解 LLM 的技術人有一個快速感知。

LLM 技術圖譜（LLM Tech Map）從基礎設施、大模型、Agent、AI 程式設計、工具和平臺，以及算力幾個方面，為開發者整理了當前 LLM 中最為熱門和硬核的技術領域以及相關的軟體產品和開源專案。

核心價值：幫助技術人快速瞭解 LLM 的核心技術和關鍵方向。

1.基礎設施

LLM 技術圖譜（LLM Tech Map）的基礎設施部分主要包括以下幾個方面：

向量資料庫：向量資料庫是專門用於儲存和檢索向量資料的資料庫，它可以為 LLM 提供高效的儲存和檢索能力。
資料庫向量支援：傳統資料庫通常不支援向量資料的儲存和檢索，資料庫向量支援可以為傳統資料庫新增向量資料的儲存和檢索能力。
大模型框架、微調 (Fine Tuning)：針對大模型的開發。
大模型訓練平臺與工具

1.1向量資料庫

Milvus
Pinecone
Weaviate
Chroma
Qdrant
Vespa
Vald
Faiss
ScaNN
Vearch
AquilaDB
Marqo
LanceDB
Annoy
NucliaDB
DeepLake
MongoDB

1.2資料庫向量支援

pgvector
Redis Vector
Elastic
SingleStoreDB
Solr
OpenSearch
ClickHouse
Rockset
Cassandra
Lucene
Neo4j
Kinetica
Supabase
Timescale

1.3大模型框架、微調 (Fine Tuning)

OneFlow
LMFlow
LoRA
Alpaca-LoRA
PEFT
ChatGLM-Efficient-Tuning
LLaMA-Efficient-Tuning
P-tuning v2
OpenLLM
h2o-llmstudio
xTuring
finetuner
YiVal

1.4大模型訓練平臺與工具

Pytorch
BMtrain
colossalAI
Tensorflow
PaddlePaddle
MindSpore
Deepspeed
XGBoost
Transformers
Apache MXNet
Ray

2.大模型

LLM 技術圖譜（LLM Tech Map）的大模型部分主要包括以下幾個方面：

備案上線的中國大模型：有牌照提供服務的大模型，需要注意的是大模型和相應的產品多半名稱不同。
知名大模型：在全球範圍內，已經發布了多款知名大模型，這些大模型在各個領域都取得了突破性的進展。
知名大模型應用：LLM 已經在多種應用場景中得到了應用，包括文字生成、機器翻譯、問答、自然語言推理等。

2.1中國大模型

文心一言
雲雀
GLM
紫東太初
百川
日日新
ABAB 大模型
書生通用大模型
混元大模型

2.2知名大模型

Llama 2
OpenLLaMA
百川
通義大模型
文心一言
StableLM
MOSS
Dolly
BLOOM
Falcon LLM
ChatGLM
PaLM 2
盤古
GPT-4
Stable Diffusion
DALL·E 3

2.3 知名大模型應用

ChatGPT
Claude
Cursor
Mochi Diffusion
Midjourey
DragGAN
Bard
Bing

3.AI Agent（LLM Agent）

AI Agent是一種能夠自主運作並完成特定任務的計算實體或程式。它能夠透過感測器感知周圍環境，並根據感知到的資訊做出決策，然後透過執行器採取行動。LLM Agent 是指基於 LLM 技術構建的智慧代理，它可以用於各種任務，比如讓機器與 ChatGPT 互動，一層一層挖掘資訊，自動化完成任務；比如由機器人構成的虛擬小鎮。

核心特點
- 自主性：AI Agent具有獨立思考和行動的能力，能夠在沒有人類直接指導的情況下完成任務。
- 互動性：AI Agent能夠與環境或其他Agent進行互動，這在遊戲、對話系統、推薦系統等場景中尤為重要。
- 目的性：AI Agent設計有明確的目標或意圖，其行為是為了實現這些目標。
- 適應性：AI Agent能夠根據環境的變化調整自己的行為，以適應新的情境。
- 進化性：隨著技術的發展，AI Agent的功能和智慧水平也在不斷提升。
技術特點
- AI Agent與大模型的主要區別在於，大模型與人類之間的互動是基於prompt實現的，而AI Agent僅需給定一個目標，它就能夠針對目標獨立思考並做出行動。
- AI Agent的核心驅動力是大模型，並在此基礎上增加了規劃（Planning）、記憶（Memory）和工具使用（Tool Use）三個關鍵元件。

型別從工作模式來看，AI Agent可以分為以下三種型別：
- 單Agent：側重於執行單一任務或一系列相關任務，且不需要與其他智慧體進行互動。
- 多Agent：涉及多個智慧體之間的協作和互動，以完成更復雜的任務。
- 混合Agent（人機互動Agent）：結合了人類和智慧體的互動，以實現更高效的任務執行。
Rivet
JARVIS
MetaGPT
AutoGPT
BabyAGI
NexusGPT
Generative Agents
Voyager
GPTeam
GPT Researcher
Amazon Bedrock Agents

4.AI 程式設計

AI程式設計是指利用計算機程式語言和技術來建立、訓練和最佳化人工智慧演算法的過程。它涵蓋了資料的收集、清洗、轉換以及演算法的選擇和應用。AI程式設計是構建未來智慧系統的關鍵，透過模擬人類智慧的能力，使計算機能夠執行類似於人類的決策和任務。程式語言如Python因其強大的資料處理庫和簡潔的語法，成為AI程式設計的常用工具。

codeium.vim
Cursor
GitHub Copilot
Comate
StableCode
CodeGeeX
TabbyML
CodeArts Snap
Code Llama
CodeFuse
姜子牙
CodeShell

5.工具和平臺

LLM 技術圖譜（LLM Tech Map）的工具和平臺部分主要包括以下幾個方面：

LLMOps：簡單點說（大家當前在說的），就是“快速從大模型到應用”。
大模型聚合平臺：匯聚大模型能力，提供服務。
開發工具：其它開發相關的 LLM 工具。

5.1 LLMOps

BentoML
LangChain
Dify.ai
Semantic Kernel
Arize-Phoenix
GPTCache
Flowise

5.2 大模型聚合平臺（☆）

Gitee AI
SOTA！模型
魔搭ModelScope
Hugging Face

5.3 開發工具

v0
txtai
Jina-AI
Deco
imgcook
Quest AI
CodiumAI
Codeium Vim
Project IDX
MakerSuite

6.算力

LLM 模型的訓練和部署需要大量的算力，算力是 LLM 技術發展的關鍵因素。

英偉達
昇騰
AMD
海光
崑崙芯
天數智芯

機器學習-搜尋技術：從技術發展到應用實戰的全面指南
2023-12-13
機器學習
Docker | Docker技術基礎梳理(一)
2019-01-21
Docker
JavaGUI——繪圖技術基礎
2018-05-31
JavaGUI繪圖
與50位技術專家連線（贈技術全景圖）
2022-04-12
技術人必須掌握能力——深度思考
2020-10-26
NLPIR技術運用知識圖譜技術應用於智慧金融
2019-12-31
如何畫出一張合格的技術架構圖？
2019-04-11
架構
前端技術演進（一）：Web前端技術基礎
2019-03-04
前端Web
Scott Brinker：2019全球營銷技術全景圖
2019-04-09
golang 技術圖
2019-04-29
Golang
一張圖看懂大型網站技術架構
2018-06-01
網站架構
Embedding技術與應用(3)：Embeddings技術的實踐應用
2023-11-08
JDBC基礎入門教程，輕鬆掌握jdbc基礎+核心技術，超全面！
2021-12-15
JDBC
乾貨 | 知識圖譜的技術與應用
2019-11-20
VR全景技術備受關注的原因分析
2021-11-24
VR
技術的採用必須從頭開始
2020-09-14
前端技術全景展望
2018-09-04
前端
Docker | Docker技術基礎梳理(二) - 映象管理
2019-01-21
Docker
不重視技術，何談掌握核心技術？
2018-04-29
從 0 到 1：我的 Flutter 技術實踐 | 掘金技術徵文
2018-07-10
Flutter
區塊鏈技術與應用：未來的一場技術革命
2019-03-12
區塊鏈
【技術面對面】基於場景圖的多物體影像生成技術
2021-03-29
vr全景技術是指什麼？什麼是vr全景技術？
2020-11-30
VR
技術路線應該會的技術
2020-05-07
解鎖機器學習-梯度下降：從技術到實戰的全面指南
2023-12-01
機器學習梯度
這是一份通俗易懂的知識圖譜技術與應用指南
2018-06-20
基礎設施如何賦能DDC/NFT技術發展
2022-02-16
技術人如何搭建自己的技術部落格
2018-09-20
深度學習核心技術實踐與圖神經網路新技術應用
2022-09-13
深度學習神經網路
AI技術在智慧海報設計中的應用
2018-12-30
AI
Spring Boot：從炒作到成熟的基礎技術？
2018-12-14
Spring Boot
人臉識別技術應用
2020-05-11
給技術人員一些技術以外的建議
2018-06-19
超詳細Maven技術應用指南
2020-06-18
Maven
技術胖TypeScript圖文視訊教程最汙的技術課
2018-09-24
TypeScript
2018最新區塊鏈技術，從入門到精通視訊教程（比特幣基礎技術）
2018-10-04
區塊鏈比特幣
Flexiv將最新的自適應機器人技術和應用帶到CIIF 2020
2020-09-24
Flex機器人
知識圖譜——技術與行業應用
2022-10-14
行業

LLM技術全景圖：技術人必備的技術指南，一張圖帶你掌握從基礎設施到AI應用的全面梳理

LLM技術全景圖：技術人必備的技術指南，一張圖帶你掌握從基礎設施到AI應用的全面梳理

1.基礎設施

1.1向量資料庫

1.2資料庫向量支援

1.3大模型框架、微調 (Fine Tuning)

1.4大模型訓練平臺與工具

2.大模型

2.1中國大模型

2.2知名大模型

2.3 知名大模型應用

3.AI Agent（LLM Agent）

4.AI 程式設計

5.工具和平臺

5.1 LLMOps

5.2 大模型聚合平臺（☆）

5.3 開發工具

6.算力

相關文章