解決Few-shot問題的兩大方法：元學習與微調

jp發表於2023-11-11

原文網址 : https://www.cnblogs.com/zh-jp/p/17825659.html

基於元學習（Meta-Learning）的方法：

Few-shot問題或稱為Few-shot學習是希望能透過少量的標註資料實現對影像的分類，是元學習(Meta-Learning)的一種。

Few-shot學習，不是為了學習、識別訓練集上的資料，泛化到測試集，而是為了讓模型學會學習。也就是模型訓練後，能理解事物的異同、區分不同的事物。如果給出兩張圖片，不是為了識別兩張圖片是什麼，而是讓模型知道兩張圖片是相同的事物還是不同的事物。

Few-shot可以被定義為K-way，N-shot問題，表示支援集有k個類別，每個類別有n個樣本。不同於訓練深度深度神經網路每個類有大量樣本的資料集，Few-shot的訓練資料集規模很小

Meta-Learning的核心思想就是先學習到一個先驗知識（prior），這需要經歷多個task的訓練，每個task的分為支援集（support set）和查詢集（query set），支援集包含了k個類、每個類n張圖，模型需要對查詢集的樣本進行歸類以訓練模型的學習能力。

經過了很多個task學習先驗知識，才能解決新的task，新的task涉及的類，不包含在學習過的task！ 我們把學習訓練的task稱為meta-training task，新的task稱為meta-testing task。最後的評價指標就是根據紅色部分表現結果。

meta training task
support	query
support	query
...
support	query

meta testing task
support	query

需要注意查詢集和測試集的區別，因為在Few-shot訓練過程也有查詢集，在Few-shot測試中，接觸的支援集和測試集都是全新的類。

Supervised Learning vs. Few-shot Learning

傳統監督學習	Few-shot 學習
測試樣本未在訓練集中見過	查詢樣本沒見過
測試樣本的類在訓練集中見過	查詢樣本的類屬於未知

基於微調（Fine-Tuning）的方法：

基於微調的Few-shot方法封為三個步驟：

預訓練：使用模型在大規模的資料集進行預訓練作為特徵提取器\(f\)。
微調：在支援集上訓練分類器。
Few-shot預測：
1. 將支援集上的影像透過分類器轉為特徵向量；
2. 對每一個類的特徵向量求平均，得到類的特徵向量：\(\mu_1,\dots,\mu_k\)；
3. 將查詢的特徵與\(\mu_1,\dots,\mu_k\)比較。

先省略第二步的微調，看看一般的預訓練Few-shot預測。

以上圖為例，將每一個類的平均特徵堆疊得到矩陣\(M\in\mathbb{R}^{3\times n}\)，這裡\(n\)表示特徵數。

\[M =\begin{bmatrix} \mu_1 \\ \mu_2 \\ \mu_3 \end{bmatrix}\tag{1} \]

將查詢的圖片提取特徵、做歸一化得到\(q\in\mathbb{R}^{1\times n}\)，並進行預測。

\[p = \mathrm{Softmax}(Mq) \tag{2} = \mathrm{Softmax}(\begin{bmatrix} \mu_1^Tq \\ \mu_2^Tq \\ \mu_3^Tq \end{bmatrix}) \]

本例中，輸出的第一類的機率最大。

歸納一下上述使用預訓練模型預測查詢集影像的步驟：

設定查詢集的標記樣本：\((x_j,y_j)\)。
用預訓練模型提取特徵：\(f(x_j)\)。
進行預測：\(p_j = \mathrm{Softmax}(W\cdot f(x_j)+b)\)。

以上固定了\(W=M, b=2\)。但可以在支援集進行訓練，微調\(W\)和\(b\)。於是設定損失函式去學習\(W\)和\(b\)，由於支援集較小，需要加入正則項防止過擬合：

\[\min\sum_j\mathrm{CrossEntropy}(y_j,p_j)+\mathrm{Regularization}\tag{3} \]

大量實驗證明，微調確實能提高精度。以下是一些常用的技巧：

對於預測分類器\(p=\mathrm{Softmax}=(W\cdot f(x)+b)\)，可以進行初始化\(W=M,b=0\)。
對於正則項的選擇可以考慮Entropy Regularization，相關的解釋可以參考文獻[3]。
將餘弦相似度加入Softmax分類器，即：

\[p=\mathrm{Softmax}=(W\cdot f(x)+b)=\mathrm{Softmax}(\begin{bmatrix} w^T_1q+b_1 \\ w^T_2q+b_2 \\ w^T_3q+b_3 \end{bmatrix}) \\ \Downarrow \\ p=\mathrm{Softmax}(\begin{bmatrix} \mathrm{sim}(w_1,q)+b_1 \\ \mathrm{sim}(w_2,q)+b_2 \\ \mathrm{sim}(w_3,q)+b_3 \end{bmatrix}) \tag{4} \]

其中\(\mathrm{sim}=\frac{w^Tq}{\lVert w\rVert_2\cdot \lVert q\rVert_2}\)。

對比

基於兩種方式解決Few-shot問題的對比

	元學習（Meta-Learning）	微調（Fine-Tuning）
策略	基於元學習的方法旨在透過在元任務上訓練來使模型學會更好地適應新任務。它們通常涉及在多個元任務（task）上進行訓練，以使模型能夠從不同任務中學到共性。	基於微調的方法通常涉及在一個預訓練的模型上進行微調，以適應特定的 few-shot 任務。在訓練階段，模型通常會使用大規模的資料集進行預訓練，然後在少量訓練資料上進行微調。
適用性	基於元學習的方法特別適用於 few-shot 任務，因為它們的目標是使模型從少量示例中快速學習。它們在少量資料和新任務上通常表現出色。	基於微調的方法在具有大量預訓練資料的情況下通常表現出色。它們適用於很多不同型別的任務，但在資料稀缺或新領域的 few-shot 問題上可能表現不佳。
泛化能力	基於元學習的方法旨在提高模型在新任務上的泛化能力，因為它們透過從多個元任務中學習共性來實現這一目標。它們在適應新任務和未見資料上的表現通常較好。	基於微調的方法通常在預訓練領域上有較強的泛化能力，但在新任務上的泛化能力可能有限，特別是當訓練資料非常有限時。

參考文獻

java學習中問題與解決方式
2020-10-12
Java
問卷調查中常見問題及解決方法
2023-10-08
libigl庫的學習筆記--問題與解決辦法
2020-11-21
筆記
快取穿透問題與解決方法
2018-10-10
快取穿透
遇到問題的解決方法
2020-12-30
iOS 微信支付SDK與微信友盟分享兩者同時整合時，出現的問題與解決之路。
2019-01-11
iOS
HTML中兩個tabs導航衝突問題的解決方法
2018-12-03
HTML
Redis 大key（bigkey）問題的排查與解決方案
2020-12-15
Redis
機器學習 | 八大步驟解決90%的NLP問題
2018-05-10
機器學習
SERVICE問題解決方法
2019-04-29
but no encoding declared;問題的解決方法
2024-03-14
Encoding
munium學習過程中問題解決
2024-05-30
強化學習-學習筆記11 | 解決高估問題
2022-07-08
強化學習筆記
JQuery中ajax的使用與快取問題的解決方法
2018-05-19
jQuery快取
如何最佳化測試時計算？解決「元強化學習」問題
2025-02-10
強化學習
react解決ios微信分享的問題
2018-07-20
ReactiOS
【SpringMVC】解決跨域問題的兩種方式
2018-06-11
SpringMVC跨域
元規劃：使用規劃器解決數學問題
2024-07-03
解決機器學習問題的一般流程
2018-10-11
機器學習
學習ASP.NET Core(11)-解決跨域問題與程式部署
2020-06-18
ASP.NET跨域
As常見問題解決方法
2018-08-24
解決問題通用方法論
2019-05-29
Hanlp配置自定義詞典遇到的問題與解決方法
2019-06-17
HanLP
APISIX單元測試準備工作與問題解決方案
2022-03-10
API
@AllArgsConstructor與@Value共用的問題解決
2019-12-18
Struct
教你兩招解決EOS CPU短缺問題
2018-10-18
【PWA學習與實踐】(4) 解決FireBase login驗證失敗問題
2018-04-10
解決訪問Github與clone很慢的問題
2019-01-19
Github
解決訪問 GitHub 與 clone 很慢的問題
2019-12-31
Github
教程：使用遷移學習來解決影像問題！
2018-11-06
遷移學習
Web 學習之跨域問題及解決方案
2019-02-28
Web跨域
前端學習（2577）：Nuxt解決了什麼問題
2020-11-13
前端UX
磁碟問題定位與解決
2023-02-06
解決 Sorry,this Adobe app is not available 問題的方法
2023-05-10
APPAI
vue中常見的問題以及解決方法
2021-03-29
Vue
elmentui表單重置初始值問題與解決方法
2023-09-23
UI
一生一芯預學習1 | 如何科學的提問（解決問題）
2022-05-31
css高度塌陷問題解決方法
2019-08-08
CSS

解決Few-shot問題的兩大方法：元學習與微調

基於元學習（Meta-Learning）的方法：

基於微調（Fine-Tuning）的方法：

對比

參考文獻

相關文章