【NLP高頻面題 - LLM架構篇】LLM對Transformer都有哪些最佳化？

青松^_^發表於2024-11-28

原文網址 : https://www.cnblogs.com/fasterai/p/18574150

【NLP高頻面題 - LLM架構篇】LLM對Transformer都有哪些最佳化？

⚠︎ 重要性：★★★ 💯

NLP Github 專案：

NLP 專案實踐：fasterai/nlp-project-practice

介紹：該倉庫圍繞著 NLP 任務模型的設計、訓練、最佳化、部署和應用，分享大模型演算法工程師的日常工作和實戰經驗
AI 藏經閣：https://gitee.com/fasterai/ai-e-book

介紹：該倉庫主要分享了數百本 AI 領域電子書
AI 演算法面經：fasterai/nlp-interview-handbook#面經

介紹：該倉庫一網打盡網際網路大廠NLP演算法面經，演算法求職必備神器
NLP 劍指Offer：https://gitee.com/fasterai/nlp-interview-handbook

介紹：該倉庫彙總了 NLP 演算法工程師高頻面題

目前主流的大模型架構都是基於LLaMa架構的改造，LLaMa（Large Language Model Meta AI）是由Meta AI開發的一種大語言模型，其核心架構是基於Transformer模型，這是一種由多層自注意力機制和前饋神經網路組成的深度學習結構。

具體來說，LLaMa模型主要由Attention和MLP層堆疊而成，並採用了前置層歸一化、RMSNorm歸一化函式、SwiGLU啟用函式、分組查詢注意力機制和旋轉位置編碼等技術進行改進。

LLaMa模型具有多種引數規模版本，包括7B、13B、33B和65B等多種不同的引數量，這是目前語言領域領先模型中的主流架構。

NLP 大模型高頻面題彙總

NLP基礎篇

【NLP 面試寶典之模型分類】必須要會的高頻面題
【NLP 面試寶典之神經網路】必須要會的高頻面題
【NLP 面試寶典之主動學習】必須要會的高頻面題
【NLP 面試寶典之超引數最佳化】必須要會的高頻面題
【NLP 面試寶典之正則化】必須要會的高頻面題
【NLP 面試寶典之過擬合】必須要會的高頻面題
【NLP 面試寶典之 Dropout】必須要會的高頻面題
【NLP 面試寶典之 EarlyStopping】必須要會的高頻面題
【NLP 面試寶典之標籤平滑】必須要會的高頻面題
【NLP 面試寶典之 Warm up 】必須要會的高頻面題
【NLP 面試寶典之置信學習】必須要會的高頻面題
【NLP 面試寶典之偽標籤】必須要會的高頻面題
【NLP 面試寶典之類別不均衡問題】必須要會的高頻面題
【NLP 面試寶典之交叉驗證】必須要會的高頻面題
【NLP 面試寶典之詞嵌入】必須要會的高頻面題
【NLP 面試寶典之 One-Hot】必須要會的高頻面題
......

BERT 模型面

【NLP 面試寶典之 BERT模型】必須要會的高頻面題
【NLP 面試寶典之 BERT變體】必須要會的高頻面題
【NLP 面試寶典之 BERT應用】必須要會的高頻面題
......

LLMs 微調面

【NLP 面試寶典之 LoRA微調】必須要會的高頻面題
【NLP 面試寶典之 Prompt】必須要會的高頻面題
【NLP 面試寶典之提示學習微調】必須要會的高頻面題
【NLP 面試寶典之 PEFT微調】必須要會的高頻面題
【NLP 面試寶典之 Chain-of-Thought微調】必須要會的高頻面題
......

本文由mdnice多平臺釋出

【NLP高頻面題 - LLM架構篇】LLM為何使用GQA代替MHA？
2024-11-28
架構
LLM主要架構
2024-10-19
架構
LLM面試題彙總
2024-09-09
面試題
SciTech-BigDataAIML-LLM-Transformer Series- transformer-explainer
2024-08-22
AIORM
RALLM 檢索增強LLM架構
2024-05-27
架構
前端高頻面試題JavaScript篇
2018-06-25
前端面試題JavaScript
什麼是LLM大模型訓練，詳解Transformer結構模型
2024-06-04
大模型ORM
LLM 推理最佳化探微 (1) ：Transformer 解碼器的推理過程詳解
2024-01-31
ORM
面向生產的 LLM 最佳化
2023-10-19
DataOps for LLM 的資料工程技術架構實踐
2024-11-19
架構
LLM面面觀之LLM復讀機問題及解決方案
2023-12-14
LLM大模型向量資料庫技術架構淺析
2023-11-10
大模型資料庫架構
LLM 鏈式架構基礎：從入門到實踐
2024-11-18
架構
高頻面試題
2024-06-28
面試題
debate by LLM
2024-10-03
BAT
LLM evaluation
2024-08-01
LLM應用實戰：當KBQA整合LLM
2024-04-11
MySQL高頻面試題
2023-05-11
MySql面試題
對 LLM 工具使用進行統一
2024-09-26
llm構建資料標註助手
2024-03-10
LLM應用實戰：當KBQA整合LLM(二)
2024-04-25
LLM 推理 - Nvidia TensorRT-LLM 與 Triton Inference Server
2024-06-26
Server
debate by LLM with agentscope
2024-10-03
BAT
Java高頻面試題---RabbitMQ
2024-03-14
Java面試題MQ
Java高頻面試題---MySQL
2024-03-14
Java面試題MySql
Java集合高頻面試題
2021-12-12
Java面試題
LLM學習(5)——系統評估與最佳化
2024-04-26
LLM大模型：推理最佳化-模型int8量化
2024-08-03
大模型
LLM並行訓練6-啟用最佳化
2024-07-20
並行
LLM學習(四)——構建 RAG 應用
2024-04-24
LLM實戰：LLM微調加速神器-Unsloth + Qwen1.5
2024-05-16
LLM實戰：LLM微調加速神器-Unsloth + LLama3
2024-05-14
【leetcode】高頻題目整理_樹結構篇( High Frequency Problems, Tree )
2020-10-03
LeetCode
LLM模型融合（一）
2024-10-04
模型
LLM multiple modal applications
2024-09-17
APP
Deploying LLM Applications with LangServe
2024-12-01
APPGse
Selenium 高頻面試題及答案
2024-11-06
面試題
從架構、工藝到能效表現，全面瞭解LLM硬體加速，這篇綜述就夠了
2024-09-20
架構

【NLP高頻面題 - LLM架構篇】LLM對Transformer都有哪些最佳化？

【NLP高頻面題 - LLM架構篇】LLM對Transformer都有哪些最佳化？

NLP 大模型高頻面題彙總

NLP基礎篇

【NLP 面試寶典 之 模型分類】 必須要會的高頻面題

【NLP 面試寶典 之 神經網路】 必須要會的高頻面題

【NLP 面試寶典 之 主動學習】 必須要會的高頻面題

【NLP 面試寶典 之 超引數最佳化】 必須要會的高頻面題

【NLP 面試寶典 之 正則化】 必須要會的高頻面題

【NLP 面試寶典 之 過擬合】 必須要會的高頻面題

【NLP 面試寶典 之 Dropout】 必須要會的高頻面題

【NLP 面試寶典 之 EarlyStopping】 必須要會的高頻面題

【NLP 面試寶典 之 標籤平滑】 必須要會的高頻面題

【NLP 面試寶典 之 Warm up 】 必須要會的高頻面題

【NLP 面試寶典 之 置信學習】 必須要會的高頻面題

【NLP 面試寶典 之 偽標籤】 必須要會的高頻面題

【NLP 面試寶典 之 類別不均衡問題】 必須要會的高頻面題

【NLP 面試寶典 之 交叉驗證】 必須要會的高頻面題

【NLP 面試寶典 之 詞嵌入】 必須要會的高頻面題

【NLP 面試寶典 之 One-Hot】 必須要會的高頻面題

......

BERT 模型面

【NLP 面試寶典 之 BERT模型】 必須要會的高頻面題

【NLP 面試寶典 之 BERT變體】 必須要會的高頻面題

【NLP 面試寶典 之 BERT應用】 必須要會的高頻面題

......

LLMs 微調面

【NLP 面試寶典 之 LoRA微調】 必須要會的高頻面題

【NLP 面試寶典 之 Prompt】 必須要會的高頻面題

【NLP 面試寶典 之 提示學習微調】 必須要會的高頻面題

【NLP 面試寶典 之 PEFT微調】 必須要會的高頻面題

【NLP 面試寶典 之 Chain-of-Thought微調】 必須要會的高頻面題

......

相關文章

【NLP 面試寶典之模型分類】必須要會的高頻面題

【NLP 面試寶典之神經網路】必須要會的高頻面題

【NLP 面試寶典之主動學習】必須要會的高頻面題

【NLP 面試寶典之超引數最佳化】必須要會的高頻面題

【NLP 面試寶典之正則化】必須要會的高頻面題

【NLP 面試寶典之過擬合】必須要會的高頻面題

【NLP 面試寶典之 Dropout】必須要會的高頻面題

【NLP 面試寶典之 EarlyStopping】必須要會的高頻面題

【NLP 面試寶典之標籤平滑】必須要會的高頻面題

【NLP 面試寶典之 Warm up 】必須要會的高頻面題

【NLP 面試寶典之置信學習】必須要會的高頻面題

【NLP 面試寶典之偽標籤】必須要會的高頻面題

【NLP 面試寶典之類別不均衡問題】必須要會的高頻面題

【NLP 面試寶典之交叉驗證】必須要會的高頻面題

【NLP 面試寶典之詞嵌入】必須要會的高頻面題

【NLP 面試寶典之 One-Hot】必須要會的高頻面題

【NLP 面試寶典之 BERT模型】必須要會的高頻面題

【NLP 面試寶典之 BERT變體】必須要會的高頻面題

【NLP 面試寶典之 BERT應用】必須要會的高頻面題

【NLP 面試寶典之 LoRA微調】必須要會的高頻面題

【NLP 面試寶典之 Prompt】必須要會的高頻面題

【NLP 面試寶典之提示學習微調】必須要會的高頻面題

【NLP 面試寶典之 PEFT微調】必須要會的高頻面題

【NLP 面試寶典之 Chain-of-Thought微調】必須要會的高頻面題