[Nvidia Triton Inference Server課程筆記] 1.1.1 框架介紹

大师兄啊哈發表於2024-06-26

原文網址 : https://www.cnblogs.com/harrymore/p/18268552

Server筆記框架

影片連結：https://www.bilibili.com/video/BV1KS4y1v7zd/?spm_id_from=333.788&vd_source=c2a322357481107ab7f418b1ae9ce618

一、推理框架介紹

triton和推理框架不能畫上等號，推理框架一般包括客戶端端和服務端，triton是服務端部分。
使用triton的場景，一般使用k8s來管理triton應用，解決負載均衡，動態擴容等問題。
模型倉庫，用來管理模型檔案。
metrics service：監控整個推理服務，駕駛艙。
推理服務一般開啟多個部署，用以分擔推理請求壓力。triton實際上就是綠色部分。
triton支援多種深度學習框架匯出的模型，Tensorrt只是triton裡的一個推理庫而已。

二、推理框架元件介紹

進一步介紹了推理框架中的元件。

k8s——叢集。
Triton——單模式推理服務（Pod），單卡/多卡
Tensorrt——模型加速庫。

三、Triton基本功能

多框架支援；
CPU、GPU，多GPU異構支援；
並行執行能力，CPU級別最佳化；
支援HTTP/REST，gRPC APIS；
監控：透過延遲和執行狀況指標與編排系統和自動縮放程序整合；
模型管理，載入、解除安裝、更新；
開源，NGC docker倉庫支援，每月釋出；

其他：Scheduler主要是指對推理請求佇列進行排程的過程。

LLM 推理 - Nvidia TensorRT-LLM 與 Triton Inference Server
2024-06-26
Server
[Triton課程筆記] 1.2.5 程式設計實戰-請求Triton Server
2024-06-26
筆記程式設計Server
[Triton課程筆記] 2.2.3 BLS續
2024-06-26
筆記
[Triton課程筆記] 1.2.4 程式設計實戰-配置ensemble model
2024-06-26
筆記程式設計
課程介紹
2024-06-21
[Triton課程筆記] 1.2.1 程式設計實戰-準備模型倉庫
2024-06-26
筆記程式設計模型
20202.9.29課堂筆記(Sqoop介紹及資料遷移)
2020-09-29
筆記OOP
OpenGL Android課程五：介紹混合（Blending）
2019-02-19
Android
學習《HTML+CSS基礎課程》的筆記---第一篇:Html介紹
2021-09-09
HTMLCSS筆記
物聯網課程筆記
2024-04-14
筆記
會計學課程筆記
2020-10-22
筆記
lua課程學習筆記
2024-07-09
筆記
王道C短期課程筆記
2021-01-01
筆記
Nvidia Triton使用教程：從青銅到王者
2022-05-18
go培訓課程都學什麼？go語言框架學習：xorm框架知識介紹
2019-04-02
Go框架ORM
OpenGL Android課程六：介紹紋理過濾
2019-02-24
Android
快速高效學習 Kotlin | Kotlin Bootcamp 課程介紹
2018-05-30
Kotlinboot
0章 RxJava2課程目錄介紹
2019-05-13
RxJava
OpenGL Android課程四：介紹紋理基礎
2019-02-11
Android
[CS131] Lecture 1 Course Introduction課程介紹
2019-03-25
達內課程學習筆記
2018-08-23
筆記
機器學習課程筆記
2018-05-15
機器學習筆記
萬物互聯課程筆記
2018-08-17
筆記
Python基礎課程筆記5
2021-09-09
Python筆記
k8s排程器介紹（排程框架版本）
2021-10-15
K8S框架
go 併發程式設計案例一課程介紹
2018-09-20
Go程式設計
MIT6S081課程筆記
2024-05-12
MIT筆記
網站SEO課程筆記整理版！
2020-08-21
網站筆記
飛槳paddlepaddle影像分割課程筆記
2020-10-26
筆記
遨遊Unix–APUE課程筆記【１】
2019-05-12
筆記
資料庫課程作業筆記
2019-04-24
資料庫筆記
計算機網路 - 課程筆記
2024-09-12
計算機網路筆記
北航OS課程筆記--一、緒論
2024-07-25
筆記
北航OS課程筆記--六、磁碟管理
2024-07-25
筆記
北航OS課程筆記--三、記憶體管理
2024-07-25
筆記記憶體
celery筆記六之worker介紹
2023-05-11
筆記
Jenkinsant介紹(學習筆記五)
2018-04-26
Jenkins筆記
ffmpeg-入門介紹（筆記）
2021-06-27
筆記

[Nvidia Triton Inference Server課程筆記] 1.1.1 框架介紹

一、推理框架介紹

二、推理框架元件介紹

三、Triton基本功能

相關文章