Synchronized bn

偷摸學習的山哥發表於2020-10-06

在一般的視覺問題上,單卡的batchsize其實已經夠大,沒必要把所有卡上的都統計一遍。然而到了現在的檢測或者分割問題上,有些大模型單卡只能bz=1,這樣的話BN完全無法發揮作用,所以我們需要在更多的卡上同步bn。

跨 GPU 批量歸一化,第一次聽說,反正也用不到不研究了

相關文章