Facebook開源演算法程式碼庫PySlowFast,輕鬆復現前沿視訊理解模型

AIBigbull2050發表於2020-01-08



2020-01-07 13:51:04

機器之心釋出

機器之心編輯部

在近些年的視訊理解研究中,Facebook AI Research 貢獻了許多精彩的工作。近日,FAIR視訊團隊在 ICCV 相關研討會上開源了視訊識別檢測程式碼庫 PySlowFast,並同時釋出了預訓練的模型庫。同時,該團隊表示,他們還將實時將他們的前沿工作新增至此程式碼庫。

Facebook開源演算法程式碼庫PySlowFast,輕鬆復現前沿視訊理解模型

  • 專案地址:https://github.com/facebookresearch/SlowFast
  • Tutorial 地址(附 PPTT 資源):https://alexanderkirillov.github.io/tutorials/visual-recognition-iccv19/

視訊與動作理解儼然已成為當今最火熱的研究方向之一,然而在開源社群中找到一個簡潔、高效、易於修改的視訊理解程式碼庫仍不是一件簡單的事情。更重要的是,復現當今前沿的 (state-of-the-art) 的深度學習模型一直是一件令研究者頭疼的事情。
這些視訊理解模型往往動輒幾十 GFlops,需要訓練數天,而復現出一個模型需要反覆的實驗調參,讓每個細節都正確。這往往會耗費大量的時間和資源,讓很多研究者望而卻步。

Facebook開源演算法程式碼庫PySlowFast,輕鬆復現前沿視訊理解模型

Facebook AI Research 在 CVPR、ICCV 等國際會議釋出了眾多研究工作,並贏得了 CVPR 2019 行為檢測挑戰賽的冠軍。而後,在今年的 ICCV 上,FAIR 推出了他們的視訊理解程式碼庫:PySlowFast。
PySlowfast 是一個基於 PyTorch 的程式碼庫,讓研究者可以輕而易舉地復現從基礎至前沿的視訊識別 (Video Classification) 和行為檢測 (Action Detection) 演算法。
不但如此,PySlowFast 程式碼庫同時開源了大量預訓練模型 (pretrain models),讓研究者省去了反覆訓練模型的煩惱,可以直接使用 FAIR 預訓練的前沿 (cutting edge performance) 模型。

Facebook開源演算法程式碼庫PySlowFast,輕鬆復現前沿視訊理解模型

pySlowFast開源的模型的視覺化檢測結果

自開源後,PySlowFast 就一度蟬聯 GitHub 趨勢榜前十。以下對此開源專案進行了簡要介紹。 根據研討會教程和開原始碼庫資訊, PySlowFast 既提供視訊理解基線(baseline)模型,還提供了當今前沿的視訊理解演算法復現。其演算法不單單囊括視訊視訊(video classification),同時也包括行為檢測(Action Classification)演算法。
與當今開源社群中各種視訊識別庫復現出參差不齊的效能相比, 使用 PySlowFast 可輕而易舉地復現出當今前沿的模型
視訊識別(Kinetics)

Facebook開源演算法程式碼庫PySlowFast,輕鬆復現前沿視訊理解模型

表 1:PySlowFast 在視訊分類資料庫 Kinetics 400 上的效能)(節選自 https://github.com/facebookresearch/SlowFast/blob/master/MODEL_ZOO.md)

Facebook開源演算法程式碼庫PySlowFast,輕鬆復現前沿視訊理解模型

PySlowFast 不單單可以用於視訊分類,同時也可用於視訊理解,並提供贏得了 2019 年 CVPR ActivityNet Challenge Winner 的視訊檢測模型。
行為檢測(AVA)

Facebook開源演算法程式碼庫PySlowFast,輕鬆復現前沿視訊理解模型


此外,PySlowFast 預留了介面,可通過簡單的編輯支援多模態視訊理解、視訊自監督學習等等任務。該團隊稱, PySlowFast 將被積極維護,實時更新其團隊和業界的前沿演算法,同開源其預訓練模型,使程式碼庫成為視訊理解領域的基線標杆
通過以下教程,讀者們可以簡單試用下 PySlowFast 程式碼庫。在完成安裝後,通過下載 MODEL_ZOO 提供的預訓練模型和相應的配置檔案,執行如下程式碼,就可以測試(Test)模型在不同視訊資料庫上的效能:

pythontools/run_net.py\--cfgconfigs/Kinetics/C2D_8x8_R50.yaml\DATA.PATH_TO_DATA_DIRpath_to_your_dataset\NUM_GPUS2\


我們可以發現,通過此程式碼庫可以輕易復現出前沿的高效能模型,同時讀者們也可以嘗試通過簡單的修改來實現自己的模型,並用多臺 GPU 進行訓練得到前沿的效能。



https://www.toutiao.com/i6779074008320049668/



來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946223/viewspace-2672396/,如需轉載,請註明出處,否則將追究法律責任。

相關文章