大模型學習進階 1-搭建一個開源大模型
本次大模型系列分享,總共會分為 5 篇文章,講解如何無編碼搭建執行起來一個大模型,到如何進行模型微調到屬於自己的一個專屬大模型
一、環境準備(沒有 GPU 可以考慮使用 2B 尺寸的模型,自己本地電腦無 GPU,記憶體 16G,執行 8B 的進行推理,基本卡死不可用)
1)Linux:
1.1、python 安裝:
務必注意這裡需要安裝 3.8 版本以上
sudo apt update
sudo apt install python3
python3 --version
1.2、pytorch 安裝
pip3 install torch torchvision torchaudio -f https://download.pytorch.org/whl/torch_stable.html -t /data2/torch
2)windows:
1.1、安裝 python
1.2、pytorch 安裝
二、相關開源軟體下載(windows 使用 gpt4all,裡面需要使用 llama.cpp 量化部署,下期會重點講解)
1)ollama
curl -fsSL https://ollama.com/install.sh | sh
2)open-webui
docker run -d --network=host -v open-webui:/app/backend/data -eOLLAMA_BASE_URL=http://127.0.0.1:11434 --name open-webui --restart always ghcr.io/open-webui/open-webui:main
三、啟動執行
1)ollama(如果網路限制建議來個科技,hugface 上下載一個 gguf 模型,0llama 本地載入,下期也會重點講解)
ollama run gemma:2b(這裡用的是一個開源的 GOOGLE 的 2B 大模型)也可以 qwen:7B
2)open-webui
docker start open-webui(docker ID)
http://自己的 IP 地址:8080/
四、效果:
下一期,會重點分析,如何利用 hugfece 上的模型 safetensors 轉 gguf,並且使用 ollama 載入本地模型
相關文章
- 大模型學習進階 5-大模型測評大模型
- 搭建一個大模型API服務大模型API
- 10個最新開源大模型Llama 3應用大模型
- 人工智慧大模型之開源大語言模型彙總(國內外開源專案模型彙總)人工智慧大模型
- 模型微調-書生浦語大模型實戰營學習筆記&大語言模型5大模型筆記
- 開源醫療大模型排行榜: 健康領域大模型基準測試大模型
- 為什麼要學習大模型應用開發?大模型
- 大模型訓練效率是推動大模型進化關鍵大模型
- 龍蜥社群成立DeepRec SIG,開源大規模稀疏模型深度學習引擎模型深度學習
- 飛槳圖學習大模型訓練框架大模型框架
- 在本地跑一個大語言模型模型
- 開源大語言模型作為 LangChain 智慧體模型LangChain智慧體
- 本週open-interpreter等10個開源AI大模型AI大模型
- 大模型時代進入尾聲:場景式模型接棒大模型
- 魔法方法推開Python進階學習大門Python
- LLM 大模型學習必知必會系列(七):掌握分散式訓練與LoRA/LISA微調:打造高效能大模型的秘訣進階實戰指南大模型分散式
- IO模型學習(一)IO模型分類模型
- 本週DBRX等八款大模型開源專案大模型
- 2024智源大會議程公開丨大語言模型模型
- 大模型綜述來了!一文帶你理清全球AI巨頭的大模型進化史大模型AI
- 歡迎 Llama 3:Meta 的新一代開源大語言模型模型
- 三大深度學習生成模型:VAE、GAN及其變種深度學習模型
- 大資料專家級技能模型與學習指南大資料模型
- LLM 大模型學習必知必會系列(八):10分鐘微調專屬於自己的大模型大模型
- 單個4090可推理,2000億稀疏大模型「天工MoE」開源大模型
- PODsys:大模型AI算力平臺部署的開源"神器"大模型AI
- PODsys:大模型AI算力平臺部署的開源“神器”大模型AI
- Ollama實現開源大模型本地化安裝部署大模型
- 阿里開源的32B大模型到底強在哪裡?阿里大模型
- 大模型價格進入“釐”時代,豆包大模型定價每千tokens僅0.8釐大模型
- 各種AI模型拿來就能用!五大深度學習模型庫大盤點AI模型深度學習
- StarCoder: 最先進的程式碼大模型大模型
- 一鍵部署本地AI大模型AI大模型
- 元象首個多模態大模型XVERSE-V開源,重新整理權威大模型榜單,支援任意寬高比輸入大模型
- 在本地跑一個大語言模型(2) - 給模型提供外部知識庫模型
- 從開發到部署,搭建離線私有大模型知識庫大模型
- 又一屆「AI春晚」拉開序幕!智源大模型集體爆發了AI大模型
- 浪潮資訊釋出源2.0基礎大模型,千億引數全面開源大模型