近年來,自動機器學習(AutoML)在模型結構、訓練策略等眾多深度學習領域取得了進展。然而,損失函式作為深度學習模型訓練中不可或缺的部分,仍然缺乏良好的探索。目前,多數研究工作仍然使用交叉熵損失(Cross-Entropy Loss)、範數損失(L1/L2 Loss)來監督網路訓練。儘管這類損失函式在多數情況下可以取得不錯的效果,但它們與網路在測試時使用的評估指標之間大多存在差異,而這種差異會對模型訓練效果造成損傷。
手工設計。手工設計損失函式依賴於設計者對特定任務和評價指標的專業知識和理解,因此很難在不同任務上進行推廣。
自動設計。自動設計損失函式的工作嘗試自動搜尋較優的損失函式,但當前的工作都僅僅關注於某個特定任務(如語義分割)或特定評價指標(如mAP),對特定情形進行了針對性設計,因此其可推廣性也存在疑問。
AutoLoss-Zero是首個通用於各種任務的損失函式搜尋框架,其搜尋空間由基本數學運算構成,無需先驗知識,可以極大地減少損失函式設計所需的人力。該研究在多項計算機視覺任務(目標檢測、語義分割、例項分割、姿態估計)上驗證了AutoLoss-Zero的有效性;
該研究提出了高效的拒絕機制,從而快速地篩選掉絕大多數沒有希望的損失函式。同時,該研究提出了一個基於梯度的等價性檢測,以避免對於彼此等價的損失函式進行重複的評估;
實驗表明,該方法搜尋出的損失函式可以很好地遷移到不同資料集和網路結構上。