模型小型化：蒸餾法、剪枝

HNU-Zhou發表於2020-11-21

原文網址 : https://blog.csdn.net/weixin_43363778/article/details/109909475

蒸餾：主要思想是，通過大模型指導小模型學習。

剪枝：網路剪枝的主要思想就是將權重矩陣中相對“不重要”的權值剔除，然後再重新fine tune網路進行微調。

緊湊模型設計：

MobileNet 的 深度可分離卷積
shufflenet 的 逐點群卷積(pointwise group convolution)和通道混洗(channel shuffle)，前者通過分組卷積降低計算量，後者促進資訊在不同組之間流轉

相關文章

模型壓縮-模型蒸餾、模型剪枝、模型量化
2024-08-07
模型
剪枝量化初完結，蒸餾學習又上場
2019-09-26
模型蒸餾的程式碼
2024-06-21
模型
知識蒸餾、輕量化模型架構、剪枝…幾種深度學習模型壓縮方法
2023-03-13
模型架構深度學習
原來，這些頂級大模型都是蒸餾的
2025-01-29
大模型
祖克伯說，Llama3-8B還是太大了，量化、剪枝、蒸餾準備上！
2024-04-25
Springer知識蒸餾專著解讀 | 面向影像識別的知識蒸餾綜述
2025-02-19
Spring
英偉達玩轉剪枝、蒸餾：把Llama 3.1 8B引數減半，效能同尺寸更強
2024-08-16
模型剪枝：剪枝粒度、剪枝標準、剪枝時機、剪枝頻率
2024-11-15
模型
知識蒸餾在推薦系統的應用
2024-05-30
Meta開發System 2蒸餾技術，Llama 2對話模型任務準確率接近100%
2024-07-15
模型
深度學習之雙DNN排序模型：線上知識蒸餾在愛奇藝推薦的實踐
2020-02-27
深度學習DNN排序模型
Mamba作者新作：將Llama3蒸餾成混合線性 RNN
2024-09-01
RNN
PAIRDISTILL: 用於密集檢索的成對相關性蒸餾方法
2024-10-05
AI
pytorch中中的模型剪枝方法
2024-08-05
PyTorch模型
基於pytorch實現模型剪枝
2023-02-23
PyTorch模型
ACL 2018使用知識蒸餾提高基於搜尋的結構預測
2018-07-03
哈工大訊飛聯合實驗室釋出知識蒸餾工具TextBrewer
2020-03-03
EMNLP 2020 | 忒修斯之船啟發下的知識蒸餾新思路
2020-11-11
百萬tokens僅需8毛，不蒸餾造出世界一流大模型，豆包全新1.5Pro不走捷徑
2025-01-23
大模型
實踐Pytorch中的模型剪枝方法
2023-03-14
PyTorch模型
史丹佛吳佳俊擴散自蒸餾來了！突破文生圖身份保留挑戰
2024-11-29
模型壓縮-剪枝演算法詳解
2023-02-22
模型演算法
上交大o1復現新突破：蒸餾超越原版，警示AI研發"捷徑陷阱"
2024-11-22
AI
CVPR 2022 | 這個自蒸餾新框架新SOTA，降低了訓練成本，無需修改網路
2022-04-08
框架
「AutoML」如何使用強化學習進行模型剪枝？
2019-11-15
TOML強化學習模型
ICCV2021 | 簡單有效的長尾視覺識別新方案：蒸餾自監督(SSD)
2021-12-13
視覺
決策樹模型(3)決策樹的生成與剪枝
2024-03-28
模型
Alpha-Beta 剪枝
2024-09-06
活字印刷回溯剪枝
2020-12-10
NeurIPS 2024｜SparseLLM：突破性全域性剪枝技術，大語言模型稀疏化革命
2024-10-10
模型
DFS剪枝最佳化策略
2024-03-10
空間剪枝最佳化
2024-03-20
12%計算量就能媲美原模型，Adobe、羅切斯特大學等提出YOPO剪枝技術
2024-11-28
模型
蒙特間接蒸發冷卻系統：間接蒸發，自然冷卻，低耗節能
2018-03-08
P1433 吃乳酪 (dfs+剪枝)
2018-05-04
[leetcode 87 擾亂字串] [剪枝搜尋]
2024-05-05
LeetCode字串
COLING24｜自適應剪枝讓多模態大模型加速2-3倍，哈工大等推出SmartTrim
2024-03-18
大模型