使用Ollama部署本地LLM：構建AI REST API的簡易指南

techlead_krischang發表於2024-09-29

原文網址 : https://www.cnblogs.com/xfuture/p/18439884

AIRESTAPI

關注TechLead，復旦AI博士，分享AI領域全維度知識與研究。擁有10+年AI領域研究經驗、復旦機器人智慧實驗室成員，國家級大學生賽事評審專家，發表多篇SCI核心期刊學術論文，上億營收AI產品研發負責人。

file

利用Ollama本地LLM（大語言模型）搭建AI的REST API服務是一個實用的方法。下面是一個簡單的工作流程。

1. 安裝Ollama和LLMs

首先，在本地機器上安裝Ollama和本地LLMs。Ollama可以幫助你輕鬆地在本地部署LLMs，並讓它們更方便地處理各種任務。

安裝 Ollama

file

Ollama安裝介面

file

Ollama下載頁面

file

安裝應用檔案

為Ollama安裝LLMs

ollama pull llama3
ollama run llama3

file

下載並執行llama3

file

在本地與llama3對話

Ollama命令

可用的命令：
  /set         設定會話變數
  /show        顯示模型資訊
  /bye         退出
  /?, /help    幫助命令

使用 "" 開始多行訊息

測試Ollama

curl http://localhost:11434/api/generate -d '{  
  "model": "llama3",  
  "prompt": "為什麼天空是藍色的？",  
  "stream": true  
}'

file

如果stream設定為false，響應將是一個完整的JSON物件。

curl http://localhost:11434/api/generate -d '{  
  "model": "llama3",  
  "prompt": "為什麼天空是藍色的？",  
  "stream": false  
}'

file

2. 設定FastAPI

接下來，設定一個Python的FastAPI應用。FastAPI是一個現代、快速（高效能）的Web框架，基於標準的Python型別提示，支援Python 3.7及以上版本。它是構建穩健高效API的理想選擇。

編寫FastAPI的路由和端點，以便與Ollama伺服器進行互動。這個過程包括髮送請求給Ollama以處理任務，比如文字生成、語言理解或其他LLM支援的AI任務。以下是一個簡單的程式碼示例（你也可以使用 Ollama Python庫來最佳化程式碼）。

from typing import Union
from fastapi import FastAPI
from pydantic import BaseModel
import json
import requests

app = FastAPI(debug=True)

class Itemexample(BaseModel):
    name: str
    prompt: str
    instruction: str
    is_offer: Union[bool, None] = None

class Item(BaseModel):
    model: str
    prompt: str

urls = ["http://localhost:11434/api/generate"]

headers = {
    "Content-Type": "application/json"
}

@app.get("/")
def read_root():
    return {"Hello": "World"}

@app.post("/chat/{llms_name}")
def update_item(llms_name: str, item: Item):
    if llms_name == "llama3":
        url = urls[0]
        payload = {
            "model": "llama3",
            "prompt": "為什麼天空是藍色的？",
            "stream": False
        }
        response = requests.post(url, headers=headers, data=json.dumps(payload))
        if response.status_code == 200:
            return {"data": response.text, "llms_name": llms_name}
        else:
            print("錯誤:", response.status_code, response.text)
            return {"item_name": item.model, "error": response.status_code, "data": response.text}
    return {"item_name": item.model, "llms_name": llms_name}

測試REST-API服務

curl --location 'http://127.0.0.1:8000/chat/llama3' \
--header 'Content-Type: application/json' \
--data '{
  "model": "llama3",
  "prompt": "為什麼天空是藍色的？"
}'

file

透過API傳送Curl請求

file

API日誌

3. 部署

當你對REST API的功能和效能感到滿意後，可以將此服務部署到生產環境。這可能涉及將其部署到雲平臺、使用Docker進行容器化，或者在伺服器上部署。

在這個簡單的示例中，我們透過使用Ollama進行本地LLM部署並結合FastAPI構建REST API伺服器，建立了一個免費的AI服務解決方案。你可以透過自己的訓練資料對模型進行微調以實現定製用途（我們將在未來討論）。

本文由部落格一文多發平臺 OpenWrite 釋出！

LLM大模型部署實戰指南：Ollama簡化流程，OpenLLM靈活部署，LocalAI本地最佳化，Dify賦能應用開發
2024-08-14
大模型AI
使用ollama + AnythingLLM快速且簡單的在本地部署llama3
2024-04-22
[譯] 使用 Node 和 OAuth 2.0 構建一個簡單的 REST API
2018-10-01
OAuthRESTAPI
使用JBang構建Spring Boot Rest API教程
2024-04-07
Spring BootRESTAPI
使用open webui+ollama部署本地大模型
2024-04-25
WebUI大模型
Spring AI + ollama 本地搭建聊天 AI
2024-11-13
SpringAI
小白Windows下透過Ollama部署使用本地模型
2024-03-12
Windows模型
部署AI平臺-Ollama
2024-07-06
AI
基於 AnythingLLM 及 Ollama 構建本地知識庫
2024-07-29
在 .NET Core 中構建 REST API
2021-03-15
RESTAPI
如何用 Spring AI + Ollama 構建生成式 AI 應用
2024-11-04
SpringAI
探索Django REST框架構建強大的API
2024-03-29
DjangoREST框架架構API
使用 TDD 測試驅動開發來構建 Laravel REST API
2019-03-06
LaravelRESTAPI
Quarkus入門：構建PetClinic REST API - Rafał Borowiec
2020-03-01
RESTAPI
使用 Python 構建一個簡單的 RESTful API
2024-07-26
PythonRESTAPI
使用 PicoLisp 構建簡易文字識別程式
2024-11-17
Lisp
用Java構建反應式REST API - Kalpa Senanayake
2019-02-06
JavaRESTAPINaN
使用ollama玩轉本地大模型
2024-03-19
大模型
Django REST framework API 指南（21）：Schemas
2019-03-04
DjangoRESTFrameworkAPI
Django REST framework API 指南（6）：路由
2018-03-05
DjangoRESTFrameworkAPI路由
Django REST framework API 指南（7）：解析
2018-03-06
DjangoRESTFrameworkAPI
Django REST framework API 指南（8）：渲染
2018-03-07
DjangoRESTFrameworkAPI
Django REST framework API 指南（27）：Settings
2018-03-24
DjangoRESTFrameworkAPI
Django REST framework API 指南（15）：限流
2018-03-18
DjangoRESTFrameworkAPI
LLM本地部署全過程記錄
2024-05-10
ollama搭建本地ai大模型並應用呼叫
2024-08-19
AI大模型
LLM Twin: 構建您的生產級AI複製體
2024-10-12
AI
使用SpringBoot構建REST服務-什麼是REST服務
2020-07-02
Spring BootREST
Ollama本地部署Qwen2.5 14B(使用docker實現Nvidia GPU支援)
2024-11-27
DockerGPU
Django REST framework API 指南（17）：分頁
2019-03-04
DjangoRESTFrameworkAPI
Django REST framework API 指南（18）：版本控制
2019-02-24
DjangoRESTFrameworkAPI
Django REST framework API 指南（13）：認證
2018-03-15
DjangoRESTFrameworkAPI
Django REST framework API 指南（23）：返回 URL
2018-03-22
DjangoRESTFrameworkAPI
Django REST framework API 指南（24）：異常
2018-03-22
DjangoRESTFrameworkAPI
Django REST framework API 指南（26）：測試
2018-03-24
DjangoRESTFrameworkAPI
Django REST framework API 指南（16）：過濾
2018-03-18
DjangoRESTFrameworkAPI
mac本地搭建ollama
2024-05-10
Mac
Spring AI 與 Ollama 在本地執行案例原始碼
2024-03-29
SpringAI原始碼

使用Ollama部署本地LLM：構建AI REST API的簡易指南

1. 安裝Ollama和LLMs

2. 設定FastAPI

3. 部署

相關文章