11.2 模型finetune
一、Transform Learning 與 Model Finetune
二、pytorch中的Finetune
一、Transfer Learning 與 Model Finetune
1. 什麼是Transfer Learning?
遷移學習是機器學習的一個分支,主要研究源域的知識如何應用到目標域當中。遷移學習是一個很大的概念。
怎麼理解源域的知識應用到目標域當中呢?上圖是來自一篇遷移學習的綜述。左邊是傳統機器學習的過程,對於不同的任務分別學習得到不同的模型。而右邊是遷移學習的示意圖,不同的任務會劃分為源任務和目標任務,對原任務進行學習,學習到的稱之為知識,而我們回利用知識和目標任務進行學習,得到模型。這個模型不僅用到了目標任務,還用到了原任務的知識。
遷移學習就是將源任務的知識應用到目標任務中。
2. 遷移學習與finetune之間的關係
我們訓練一個模型,就是不斷地更新他的權值。而整個模型最重要的東西也就是他的權值。這個權值呢,也就可以稱之為他的知識。而這些知識是可以進行遷移的。我們把這些知識遷移到新任務中,這就是模型微調。
為什麼我們使用model finetune這個trick呢?這是因為在新任務中,資料量較小。
我們來看,神經網路該如何遷移。我們對神經網路,通常會劃分為兩部分,前面一些列的卷積池化,我們認為是特徵提取。後面一些全連線層,我們稱之為分類器。
我們對特徵提取的部分,認為是比較有共性的地方。而分類器的引數呢,我們認為它與具體的任務有關,通常需要去改變。在這裡,有個非常重要的地方,通常都要去改變,這就是最後一個輸出層。比如原來是千分類任務,這裡是二分類任務,這就需要改變。
二、pytorch中的Finetune
下面我們來看模型finetune需要哪些步驟。
構建好模型之後,在訓練時也會常用一些trick。
1. 固定預訓練的引數(兩種方法:(1) requires_grad = False (2)學習率設為0)
2. 使用較小的學習率。這時候就要用到params_group(引數組)的概念,讓不同的部分學習率不同。
三、舉例
下面使用Resnet-18進行finetune。
(1)準備工作
模型下載:https://download.pytorch.org/models/resnet18-5c106cde.pth
相關文章
- SAM視覺大模型的finetune視覺大模型
- 通俗易懂理解 模型微調finetune模型
- 預訓練模型時代:告別finetune, 擁抱adapter模型APT
- 11.2
- 中文語料的 Bert finetune
- PyTorch環境下對BERT進行finetunePyTorch
- Synced Global AI Weekly | 2018.10.27—11.2AI
- 11.2 煉石模擬賽
- 11.2模擬賽總結
- Oracle 11.2 DataGuard RAC To RAC搭建Oracle
- 11.2 第二型曲線積分
- PostgreSQL11.2+PostGIS2.5部署SQL
- Apple推送macOS Big Sur 11.2 RC版本APPMac
- 內網gitlab11.2升級至11.4.5內網Gitlab
- 上週熱點回顧(11.2-11.8)
- 被蘋果11.2警告的解決方案蘋果
- openSUSE 11.2 中文輸入法 SCIM 安裝
- whisper v3 finetune 中文亂碼問題的解決方案
- macOS Big Sur 11 v11.2beta2版Mac
- mac11.2安裝air遇到的問題MacAI
- iOS 11.2的系統 barButtonItem點選會保持高亮iOS
- Gartner:2023年全球半導體收入將下降11.2%
- 引數ENABLE_DDL_LOGGING從11.2到12c變化
- Gartner:預計2025年印度IT支出達1600億美元 同比增長11.2%
- CTR:2022年1-10月廣告市場同比減少11.2%
- EasyNLP整合K-BERT演算法,藉助知識圖譜實現更優Finetune 導讀演算法
- 軟體測試模型-其他模型 (W 模型|H 模型|X 模型)模型
- 美聯儲:2020年4月美國工業生產總值下降11.2%
- macOS Big Sur 11.2 RC版本:修復藍芽和顯示連線問題Mac藍芽
- 模型壓縮-模型蒸餾、模型剪枝、模型量化模型
- 微課|中學生可以這樣學Python(例11.2):tkinter猜數遊戲(1)Python遊戲
- 微課|中學生可以這樣學Python(例11.2):tkinter猜數遊戲(2)Python遊戲
- 微課|中學生可以這樣學Python(例11.2):tkinter猜數遊戲(3)Python遊戲
- 【大模型】模型安全大模型
- 11. Oracle for Linux安裝和配置——11.2. Linux安裝和配置——11.2.5. Linux配置OracleLinux
- 11. Oracle for Linux安裝和配置——11.2. Linux安裝和配置——11.2.1. 簡介OracleLinux
- 蘋果向開發人員推送macOS Big Sur 11.2的第三個候選版本蘋果Mac
- 增量學習不只有finetune,三星AI提出增量式少樣本目標檢測演算法ONCE | CVPR 2020AI演算法