LangServe如何革新LLM應用部署？

公众号-JavaEdge發表於2024-10-14

原文網址 : https://www.cnblogs.com/JavaEdge/p/18466186

0 前言

隨LLM技術演進，AI應用開發部署越來越複雜。LangServe應運而生，旨在簡化AI服務部署和運維的框架。專為LLM部署和管理而設計；本文旨在講解LangServe的功能特點和實踐運用。

1 概述

LangServe 提供一整套將LLM部署成產品服務的解決方案。可將LLM應用連結入常見Python Web框架（如FastAPI、Pydantic、uvloop、asyncio），進而生成一套RESTful API。LangServe減少開發人員的運維部署任務，使他們可以更專注於LLM應用開發。不僅簡化從開發到生產的過渡，還確保服務的高效能和安全性。它提供了包括模型管理器、請求處理器、推理引擎、結果快取、監控與日誌記錄以及API閘道器等各類元件。LangServe的目標是讓開發者能夠輕鬆整合、部署和管理AI模型，從零到一無縫地實現LLM應用從原型到產品的過渡。

倉庫地址：https://github.com/langchain-ai/langserve

2 功能

多模型支援

LangServe支援部署多種型別的AI模型，包括文字生成、影像識別、語音處理等，開發人員能夠按需切換。

高效推理快取

為了提高響應速度和節省計算資源，LangServe包含了一個高效的結果快取系統，可以智慧地儲存和管理熱點資料。

安全訪問控制

透過角色和策略的管理，LangServe提供了靈活的訪問控制機制，確保了服務的安全性和資料的隱私性。

實時監控與日誌

內建的監控系統可以實時跟蹤服務的執行狀態，詳盡的日誌記錄有助於問題的除錯和分析。

簡潔易用的API介面

LangServe的API設計簡潔直觀，易於理解和使用，大大減少了開發者的學習成本。

3 REST API 開發

1 環境準備

安裝依賴：

pip install "langserve[all]"

該命令包含了服務端和客戶端的安裝。

設定環境變數：OPENAI_API_KEY=<your valid openai api key>

2 程式碼開發

簡單的翻譯介面。除了LangServe，還引入Web框架FastAPI和Web伺服器uvicorn：

from fastapi import FastAPI
from langchain.prompts.chat import (
    ChatPromptTemplate,
    SystemMessagePromptTemplate,
    HumanMessagePromptTemplate,
)
from langchain_openai import ChatOpenAI
from langserve import add_routes

# FastAPI是一個基於Python的Web框架，用於構建高效能、可擴充套件的API
app = FastAPI(
    title="LangChain Server",
    version="1.0",
    description="A simple API server using Langchain's Runnable interfaces",
)

# 介面1
add_routes(
    app,
    ChatOpenAI(),
    path="/openai",
)

# 介面2
system_message_prompt = SystemMessagePromptTemplate.from_template("""
    You are a helpful assistant that translates {input_language} to {output_language}.
""")
human_message_prompt = HumanMessagePromptTemplate.from_template("{text}")

chat_prompt = ChatPromptTemplate.from_messages([system_message_prompt, human_message_prompt])

add_routes(
    app,
    chat_prompt | ChatOpenAI(),
    path="/translate",
)

if __name__ == "__main__":
    import uvicorn
    # Python的Web伺服器
    uvicorn.run(app, host="localhost", port=9999)

3 啟動

python app.py

4 Postman呼叫測試

通常可直接訪問 http://localhost:9999/docs，在瀏覽器線上的介面文件中找到對應的介面，並直接在網頁上進行測試。目前由於新的Pydantic版本存在相容性問題，無法生成OpenAPI文件，因此暫用Postman進行介面測試。

5 客戶端呼叫測試

在後臺開發LangServe客戶端，進行遠端呼叫REST API。

from langchain.prompts.chat import ChatPromptTemplate
from langserve import RemoteRunnable

# 配置遠端介面
openai_llm = RemoteRunnable("http://localhost:9999/openai/")

# 建立提示詞
prompt = ChatPromptTemplate.from_messages(
    [
        ("system", "你是一名資深的AI大模型專家"),
        ("human", "請幫忙講解一下，有哪些常用的通用開源大模型，中外各自羅列5個"),
    ]
).format_messages()

# LLM介面呼叫
openai_llm.invoke(prompt)

# 輸出：
# AIMessage(content='當談論通用開源大模型時，常常會提到自然語言處理（NLP）領域中的預訓練模型。以下是中外各自常用的5個通用開源大模型：
# **國外：**
# 1. BERT（Bidirectional Encoder Representations from Transformers）：由Google開發，是一種基於Transformer架構的預訓練模型，用於各種NLP任務。
# 2. GPT-3（Generative Pre-trained Transformer 3）：由OpenAI釋出，是一個非常大的語言生成模型，可以用於文字生成等任務。
# 3. RoBERTa（A Robustly Optimized BERT Approach）：由Facebook釋出的預訓練模型，基於BERT進行了一些最佳化，用於提高效能。
# 4. T5（Text-to-Text Transfer Transformer）：由Google釋出，是一個通用的文字生成模型，可以應用於多種NLP任務。
# 5. XLNet：由谷歌Brain團隊釋出，是一種自迴歸預訓練模型，結合Transformer-XL和自迴歸方法。
# **國內：**
# 6. ERNIE（Enhanced Representation through kNowledge Integration）：由百度釋出，是一種基於Transformer架構的多語言預訓練模型，融合了知識融合的方法。
# 7. GPT-2（Generative Pre-trained Transformer 2）：由哈工大訊飛聯合實驗室釋出，是一個類似於GPT-3的語言生成模型，用於文字生成等任務。
# 8. HFL/THU Bert：由清華大學自然語言處理與社會人文計算實驗室釋出，是一個BERT的中文預訓練模型，適用於中文NLP任務。
# 9. RoFormer：由華為釋出，是一種最佳化的中文預訓練模型，用於中文NLP任務。
# 10. PaddleNLP：由百度釋出，是一個NLP模型庫，提供了多種預訓練模型，包括BERT、ERNIE等，適用於各種NLP任務。')

總結

LangServe作為一款專注於AI模型部署和運維的平臺，透過其精心設計的架構和豐富的功能集合，顯著降低了AI專案的門檻，提升了開發效率和服務穩定性。無論是初創公司還是大型企業，LangServe都提供了一個可靠的解決方案，以應對AI領域中的挑戰和機遇。隨著AI技術的不斷進步，LangServe將繼續在AI服務的革新和發展中扮演關鍵角色。

關注我，緊跟本系列專欄文章，咱們下篇再續！

作者簡介：魔都架構師，多家大廠後端一線研發經驗，在分散式系統設計、資料平臺架構和AI應用開發等領域都有豐富實踐經驗。

各大技術社群頭部專家博主。具有豐富的引領團隊經驗，深厚業務架構和解決方案的積累。

負責：

中央/分銷預訂系統效能最佳化

活動&券等營銷中臺建設

交易平臺及資料中臺等架構和開發設計

車聯網核心平臺-物聯網連線平臺、大資料平臺架構設計及最佳化

LLM Agent應用開發

區塊鏈應用開發

大資料開發挖掘經驗

推薦系統專案

目前主攻市級軟體專案設計、構建服務全社會的應用系統。

參考：

程式設計嚴選網

本文由部落格一文多發平臺 OpenWrite 釋出！

Deploying LLM Applications with LangServe
2024-12-01
APPGse
Flask 應用如何部署
2018-07-05
Flask
LLM應用實戰：當KBQA整合LLM
2024-04-11
LLM應用實戰：當KBQA整合LLM(二)
2024-04-25
如何使用 docker 部署前端應用
2019-03-09
Docker前端
如何快速部署容器化應用
2019-10-29
LLM應用測試策略與方法
2024-11-24
LLM應用實戰: 文件問答系統Kotaemon-1. 簡介及部署實踐
2024-09-18
LLM學習(四)——構建 RAG 應用
2024-04-24
RMI應用部署
2018-11-06
如何在阿里雲上部署 Django 應用程式
2018-06-10
阿里Django
Docker如何高效部署Node應用？看這裡
2020-09-14
Docker
深度學習 | 如何開發、部署 Serverless 應用？
2022-11-18
深度學習Server
輕鬆部署 Laravel 應用 | 《08. 手動部署 - 部署應用程式碼》
2019-03-09
Laravel
LLM應用實戰: OpenAI多代理新作-Swarm
2024-10-22
OpenAISwarm
LLM-kimi：BMS-應用被動均衡
2024-10-24
AI Agent框架（LLM Agent）：LLM驅動的智慧體如何引領行業變革，應用探索與未來展望
2024-07-05
AI框架智慧體行業
Kubernetes(二) 應用部署
2019-09-28
SQLCoder部署和應用
2024-07-15
SQL
LNMP部署及應用
2024-06-05
LNMP
Docker部署Angular應用
2020-11-29
DockerAngular
LLM大模型部署實戰指南：Ollama簡化流程，OpenLLM靈活部署，LocalAI本地最佳化，Dify賦能應用開發
2024-08-14
大模型AI
LLM本地部署全過程記錄
2024-05-10
雲伺服器：如何在docker容器中部署應用
2019-11-22
伺服器Docker
用 Ansible 部署無服務應用!
2023-11-15
阿里canal部署和應用
2020-07-19
阿里
Docker常用的應用部署
2020-11-22
Docker
使用dockerfile部署springboot應用
2022-06-23
DockerSpring Boot
使用 Docker 部署 Node 應用
2021-06-18
Docker
AI實用指南：5分鐘搭建你自己的LLM聊天應用
2024-03-27
AI
Eclipse/tomcat 如何實現應用熱部署和熱啟動
2018-11-28
EclipseTomcat熱部署
如何處理CloudFoundry應用部署時遇到的254錯誤
2018-05-30
Cloud
構建RAG應用-day04-將LLM 接入 LangChain 構建檢索問答鏈部署知識庫助手
2024-04-25
LangChain
LLM應用實戰: 產業治理多標籤分類
2024-08-20
產業
golang: 線上上用nginx部署應用
2024-11-16
GolangNginx
用linuxdeployqt吧Qt應用部署到Linux
2021-02-02
LinuxQT
永珍革新，開啟鴻蒙原生應用生態新篇章
2024-06-23
鴻蒙
007.OpenShift管理應用部署
2020-06-21