Ablations

Gaowaly發表於2024-11-20

消融實驗(ablation study)是什麼?

太長不看版:

說白了就是設立對照組/控制變數法的意思,透過去除/增加某個模組的作用,來證明該模組的必要性,如果消融實驗後得到效能結果大幅變化,說明該模組起到了作用。

——————————————————————————

嚴謹版:

Robert Long對消融研究(或消融實驗)定義:通常用於神經網路,尤其是相對複雜的神經網路,如R-CNN。我們的想法是透過刪除部分網路並研究網路的效能來了解網路

“消融”的原始含義是手術切除身體組織。

ablation
解釋: 透過機械方法切除身體組織,如手術,從身體中去除,尤指器官、異常生長或有害物質。

“消融研究”這一術語的根源於20世紀60年代和70年代的實驗心理學領域,其中動物的大腦部分被移除以研究其對其行為的影響。
在機器學習,特別是複雜的深度神經網路的背景下,已經採用“消融研究”來描述去除網路的某些部分的過程,以便更好地理解網路的行為。

自從Keras深度學習框架的主要作者Francois Chollet在2018年6月釋出twtter以來,該術語受到了關注:

消融研究對於深度學習研究至關重要。理解系統中的因果關係是產生可靠知識的最直接方式(任何研究的目標)。消融是一種非常省力的方式來研究因果關係。
如果您採用任何複雜的深度學習實驗設定,您可能會刪除一些模組(或用隨機的模組替換一些訓練有素的功能)而不會降低效能。消除研究過程中的噪音:進行消融研究。
如果您無法完全理解您的系統?很多活動部件,想確定它的工作原因是否與您的假設密切相關?嘗試刪除東西。花費至少約10%的實驗時間來誠實地反駁你的論文。

舉個例子會理解直觀些:

Girshick及其同事描述了一個由三個“模組”組成的物體檢測系統:第一個使用選擇性搜尋演算法提出影像區域,在該區域內搜尋物體。進入一個大的卷積神經網路(有5個卷積層和2個完全連線的層),進行特徵提取,然後進入一組支援向量機進行分類。為了更好地理解該系統,作者進行了一項消融研究,其中系統的不同部分被移除 - 例如,移除CNN的一個或兩個完全連線的層導致效能損失驚人地少。

這使作者得出結論:

CNN的大部分代表性力量來自其卷積層,而不是來自更大的密集連線層。

是什麼

消融實驗是一種科學研究方法,用於確定一個條件或引數對結果的影響程度。當研究者提出了一個新的方案或方法時,消融實驗透過逐一控制一個條件或引數,來觀察結果的變化,以確定哪個條件或引數對結果的影響更大。

舉個例子,假設在目標檢測系統中,使用了A、B、C三種方法相加取得了不錯的效果。但是我們並不知道這個效果是由於A、B還是C起的作用。為了確定哪個方法對結果的影響更大,我們可以保留A、B,移除C進行實驗,觀察結果的變化。透過這樣的消融實驗,我們可以最終確定到底是哪個方法對結果的影響更大。

總結來說,消融實驗類似於"控制變數法",透過逐一控制條件或引數來觀察結果的變化,以確定它們對結果的影響程度。

優勢與劣勢

消融實驗的優點是可以幫助研究人員理解模型的不同組成部分對整體效能的貢獻。透過逐步消除模型中的某些元件或功能,研究人員可以評估這些元件或功能對模型效能的影響。這有助於揭示模型的關鍵元件和關鍵功能,以及它們在任務中的作用。

消融實驗的侷限性在於,它可能無法完全反映真實世界的情況。透過消除某些元件或功能,消融實驗可能會導致模型在特定任務上的效能下降,但在實際應用中,這些元件或功能可能是必要的。此外,消融實驗可能無法考慮到元件之間的相互作用和複雜性,因此結果可能不完全準確。

總的來說,消融實驗是一種有用的方法,可以幫助研究人員理解模型的工作原理和效能貢獻,但需要謹慎解釋和應用其結果

案例

一文搞懂什麼是ablation study
Mask-Guided Attention Network for Occluded Pedestrian Detection

總結

消融實驗是希望探究某一個單一變數對於系統的影響。針對可以去除的部分/模組/選項,可以採用去除的方式來設計實驗;而針對不可以去除的變數/超引數等,可以採用grid search等方法來展示引數對於系統的影響。好的論文離不開詳實的消融實驗來讓讀者更好地瞭解作者的貢獻,以及加深對於新提出的模組的作用的理解。總而言之,設計消融實驗時,應該注意單尺度敘事原則,即一次只控制一個變數,進而研究該變數對於系統的影響。

Reference:

Girshick, R., Donahue, J., Darrell, T. and Malik, J., 2014. 《Rich feature hierarchies for accurate object detection and semantic segmentation》. In Proceedings of the IEEE conference on computer vision and pattern recognition (580-587頁).

消融實驗(ablation study)是什麼?-CSDN部落格