遷移學習(TSRP)《Improving Pseudo Labels With Intra-Class Similarity for Unsupervised Domain Adaptation》

加微信X466550探討發表於2023-04-06

論文資訊

論文標題:Improving Pseudo Labels With Intra-Class Similarity for Unsupervised Domain Adaptation
論文作者:Jie Wang, Xiaoli Zhang
論文來源:July 2022——ArXiv 
論文地址:download 
論文程式碼:download
視屏講解:click

1 介紹

  問題:

    • 首先,偽標籤主要是透過源域和目標域之間的良好對齊獲得的,而偽標籤的準確性對效能的影響沒有深入研究。通常在源域上訓練分類器生成偽標籤時,在每次最佳化迭代中都可能出現一些錯誤的偽標籤,如 Figure1 所示。由於錯誤的累積,不正確的偽標籤會極大地影響最終的效能;
    • 其次,大多數方法主要集中在挖掘源域以提高目標域偽標籤的準確性,目標域樣本之間的內在關係似乎還沒有被探索;

    

  為了解決上述兩個問題,在本文中,提出挖掘目標域類內相似性來修復目標域中的偽標籤(TSRP),以提高偽標籤的準確性。 TSRP 的核心思想是使用目標相似性透過生成樹 [22] 來選擇具有高置信度的偽標籤(UTSP)。 然後,使用選擇的高置信度偽標記樣本和源資料來訓練強分類器。 強分類器用於糾正部分錯誤標記的具有低置信度偽標籤的目標樣本。 我們稱之為偽標籤的補救過程。 通常,我們的方法可以整合到任何透過使用在源域上訓練的分類器生成目標域的偽標籤的方法。

2 相關工作

  在 [37] 中,Saito 等人。 使用三個非對稱分類器來提高偽標籤的準確性,其中兩個分類器用於選擇置信偽標籤,第三個旨在學習目標域的判別資料表示。 [18]透過結構化預測探索目標域的結構資訊,並結合最近的類原型和結構化預測來提升偽標籤的準確性。 [38]將目標域中同一簇的樣本視為一個整體而不是個體。 它透過類質心匹配為目標叢集分配偽標籤。 [39]提出了一種從易到難的策略,將目標樣本分為三類,即簡單樣本、困難樣本和不正確的簡單樣本。 它傾向於為簡單的樣本生成偽標籤,並儘量避免困難的樣本。 從易到難的策略可能偏向於簡單的類。 為了解決這個問題,[40] 中提出了一種置信度感知的偽標籤選擇策略。 它根據偽標籤的機率獨立地從每個類中選擇樣本。 在 [39, 40] 中,他們使用目標樣本到源樣本中心的距離作為選擇標準來選擇高度置信度的偽標籤。 在 [18, 38] 中,他們迭代地生成可信的偽標籤。 但是,他們沒有考慮如何糾正錯誤生成的偽標籤。 與上述方法不同,在本文中,我們建議透過探索目標域中的類內相似性來糾正錯誤生成的偽標籤。

3 方法

  整體框架:

  

  整體演算法:

  

  UTSP 如下:

  

  UTSP 圖解如下:

  

  公式:

    $\hat{\mathbf{y}}_{l, \text { remedy }}^{T}=f_{\text {strong }}\left(\mathbf{Z}_{l}^{T}\right)   \quad\quad\quad(1)$

    $S_{i, j}^{k}=\left\{\begin{array}{ll}0, & i=j \\\frac{\left\langle\mathbf{z}_{i}^{T k}, \mathbf{z}_{j}^{T k}\right\rangle}{\left\|\mathbf{z}_{i}^{T i}\right\|\left\|\mathbf{z}_{j}^{T k k}\right\|}, & \text { otherwise }\end{array}, \forall k=1,2, \ldots, C_{y}\right. \quad\quad\quad(2)$

    $S_{\text {rank }}^{k}=\left\{S_{\operatorname{rank}(1)}^{k}, S_{\operatorname{rank}(2)}^{k}, \ldots, S_{\operatorname{rank}\left(n_{p}\right)}^{k}\right\} \quad\quad\quad(3)$

    $\delta=S_{\left.\operatorname{rank}\left(\mid \rho n_{p}\right\rfloor\right)}^{k}  \quad\quad\quad(4)$

    $M_{i j}^{k}=\left\{\begin{array}{ll}1, & S_{i, j}^{k} \geq \delta \\0, & \text { otherwise }\end{array}\right.  \quad\quad\quad(5)$

    $D_{i i}^{k}=\sum\limits _{j} M_{i j}^{k}  \quad\quad\quad(6)$

    $m=\arg \underset{i}{\text{max}} D_{i i}^{k}   \quad\quad\quad(7)$

  Note:為防止類不平衡問題,將某類 $i$ 樣本數少於 $3$  的全部視為高置信度樣本;

4 實驗

Performance 

  

消融實驗

  

5 總結

 

 

論文:

標籤生成策略:硬標籤[19、35、17] 和 軟標籤[36]

偽標籤產生負面影響:[18]

相關文章