本地執行LLaMa3:70b

Ray1997發表於2024-05-26

原文網址 : https://www.cnblogs.com/ray1997/p/18213206

主機配置

OS: CentOS Stream 9
RAM: 128 GB
CPU: Xeon W2465（16核）
GPU: NVIDIA RTX A5000 16GB

安裝GPU驅動

First, confirm that your system meets the necessary requirements, including the installation of the NVIDIA driver and CUDA toolkit.

`
docs：Install GPU Driver

安裝完成後驗證：

安裝Ollama模型管理容器

官網直達：https://ollama.com/download/linux

安裝結束執行Llama3:70b
ollama run llama3:70b

安裝Open webui

採用Docker image安裝 -> 這裡採用共享主機網路: --network=host，因為我ollama沒有采用docker安裝，docker虛擬程序網路訪問本地網路會有問題：

docker run -d -p 3000:8080 --network=host --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

開啟區域網防火牆

firewall-cmd --permanent --add-port=3000/tcp
firewall-cmd --reload

這裡要注意一下，1是本地主機的防火牆配置，2是路由器配置也要檢查一下。

效果

小記

沒有梯子基本下不動40g的包，得先裝梯子，這個可能會比較麻煩；
更有價效比的方式，還是使用百度的「文心一言」和阿里的「qwen」，這兩個中文支援比較好，LLaMa3的中文支援太弱了，需要自己在做sft，還是比較麻煩的；
llama3:70b的生成速度A5000的加速效果還是比較明顯的，如果能上兩張卡，效果會更好一些，後面可以考慮一下；

收集:本地執行Llama3
2024-04-22
10分鐘本地執行llama3及初體驗
2024-04-23
學習筆記447—本地部署 Llama3 – 8B/70B 大模型！最簡單的方法：支援CPU /GPU執行【3種方案】
2024-04-25
筆記大模型GPU
本地快速安裝執行史上最強開源LLaMa3大模型
2024-08-21
大模型
本地部署Llama3-8B/70B 並進行邏輯推理測試
2024-04-20
[20221018]本地執行與遠端執行.txt
2022-10-20
在Windows電腦上快速執行AI大語言模型-Llama3
2024-04-20
WindowsAI模型
搭建本地執行Hadoop環境
2018-11-01
Hadoop
本地執行 Gemma 的 pytorch 整合
2024-03-01
GemmaPyTorch
三種方式本地執行Knative
2020-05-21
使用ollama + AnythingLLM快速且簡單的在本地部署llama3
2024-04-22
在本地執行 LLMs 的 6 種方法
2024-02-28
可本地執行大模型的應用
2024-08-03
大模型
搭建一個本地 Laravel 執行環境
2023-04-05
Laravel
可傳輸執行緒本地簡介
2024-12-11
執行緒
透過歷史記錄執行本地模型
2024-04-07
模型
在本地執行Kubernetes的3種主流方式
2020-05-14
PHP環境搭建以及完成本地執行
2021-09-09
PHP
執行緒本地ThreadLocal的介紹與使用！
2021-07-07
執行緒thread
IDEA本地執行hadoop程式成功，叢集執行找不到自定義的Mapper類
2020-12-30
IdeaHadoopAPP
Spring AI 與 Ollama 在本地執行案例原始碼
2024-03-29
SpringAI原始碼
HarmonyOS：使用本地真機執行應用/服務
2024-11-03
Visual Studio 2019本地不能執行Azure Functions
2021-06-21
Function
Citus 11(分散式 PostgreSQL) 文件貢獻與本地執行
2022-05-02
分散式SQL
Terraform初探：遷移本地專案到Terraform Cloud執行
2021-11-30
ORMCloud
6個在本地機器上執行 Kubernetes 的工具
2021-08-15
如何使用 mock 資料在本地執行 SAP Fiori Elements
2021-04-17
Mock
如何擁有自己的專屬GPT-本地部署目前最強大模型llama3
2024-04-26
GPT大模型
使用執行緒本地變數儲存會員資訊
2024-09-03
執行緒變數
git clone一個laravel的專案到本地並執行
2021-12-30
GitLaravel
通過transmittable-thread-local原始碼理解執行緒池執行緒本地變數傳遞的原理
2020-05-02
MITthread原始碼執行緒變數
5分鐘搞定服務端本地開發遠端執行
2018-10-03
服務端
【物件儲存】Minio本地執行和 golang客戶端基本操作
2023-10-19
物件Golang客戶端
無快不破，在本地 docker 執行 IDEA 裡面的專案？
2021-12-18
DockerIdea
靈哥講llama3(上)
2024-06-14
在 Kubernetes 上部署 llama3
2024-07-17
深入理解java：執行緒本地變數 java.lang.ThreadLocal類
2018-12-10
Java執行緒變數thread
java 併發，為執行緒建立本地變數 ThreadLocal的使用
2018-08-16
Java執行緒變數thread