llama實驗

张扬zy發表於2024-10-07

嘗試在實驗室伺服器上本地執行llama，看看llama可以幹什麼？

然後按照官網執行時報錯：
…………
File "/defaultShare/archive/zhangyang/llama3/llama/model.py", line 288, in forward
mask = torch.triu(mask, diagonal=1)

透過new bing的回答進行如下嘗試
在model檔案的288行左右新增

mask = mask.to(torch.float32) # mask = torch.triu(mask, diagonal=1)

從而可以成功執行

細看程式碼參考：
https://www.cnblogs.com/xiangcaoacao/p/18173863
https://blog.csdn.net/weixin_43508499/article/details/132554559
https://zhuanlan.zhihu.com/p/679640407

細節問題：

快取實現
旋轉編碼使用的函式

想法上：
為什麼提示工程有效？
https://blog.csdn.net/2401_82469710/article/details/138614802

10分鐘本地執行llama3及初體驗
2024-04-23
unsloth微調llama3實戰全過程
2024-06-17
從 Llama 1 到 3.1：Llama 模型架構演進詳解
2024-11-25
模型架構
LLM實戰：LLM微調加速神器-Unsloth + LLama3
2024-05-14
Llama系模型總結
2024-07-19
模型
LLaMA快速上手指南
2023-03-13
實驗11.ACL實驗
2024-06-25
Sebastian Raschka最新部落格：從頭開始，用Llama 2構建Llama 3.2
2024-10-06
AST
小偷？MiniCPM-Llama3-V 2.5與Llama3-V剽竊之爭
2024-06-05
Llama3-8B到底能不能打？實測對比
2024-04-23
Llama 3：Meta新AI模型
2024-06-10
AI模型
實驗一--Easy IoT實現mqtt實驗
2020-09-25
MQQT
20個實驗之實驗10
2024-04-28
20個實驗之實驗11
2024-04-28
20個實驗之實驗16
2024-05-07
30個實驗之實驗23
2024-05-08
30個實驗之實驗25
2024-05-08
實驗5.OSPF配置實驗
2024-06-25
實驗8.Vlan Hybrid實驗
2024-06-25
實驗10.3層vlan互通實驗
2024-06-25
實驗
2024-04-22
透過ORPO技術微調 llama3大模型(Fine-tune Llama 3 with ORPO)
2024-04-23
大模型
實驗7.Vlan劃分實驗
2024-06-25
作業系統實驗——實驗1《CPU Scheduling》&&實驗二《Allocation & Reclaim》
2020-12-08
作業系統AI
Meta開源Llama 3釋出
2024-04-19
收集:本地執行Llama3
2024-04-22
靈哥講llama3(上)
2024-06-14
LLAMA3.1資料處理
2024-07-25
在 Kubernetes 上部署 llama3
2024-07-17
實驗三驗收3
2024-06-01
使用ollama分別在我的window、mac、小米手機上部署體驗llama3-8b
2024-04-22
Mac
Java實驗二：類程式設計實驗
2024-03-22
Java程式設計
實驗一和實驗二截圖
2024-03-27
實驗13.Nat轉發telnet實驗
2024-06-25
實驗9.單臂路由實現Vlan互通實驗
2024-06-25
路由
csrf實驗
2019-02-16
實驗一.
2024-03-17
實驗心得
2024-04-08

llama實驗

相關文章