Detectron 是 FAIR 用於實現最先進的目標檢測演算法(包括 Mask R-CNN)的軟體系統。
該系統是在Apache 2.0許可下提供的Python庫,並建立在由Facebook支援的深度學習框架“Caffe2”上。
自2018年釋出以來,Detectron物件檢測平臺已經成為Facebook人工智慧研究(FAIR)廣泛採用的開源專案之一。
為了繼續推進該專案,Facebook推出可Detectron2,Detectron2在研究和生產使用上都有了重要的改進。
以下是Detectron2的新特性:
PyTorch:最初的Detectron在Caffe2中實現。PyTorch提供了一個更直觀的指令式程式設計模型,它允許研究人員和從業人員可以更快地迭代模型設計和實驗。
使用者現在可以受益於PyTorch的深度學習方法,以及不斷改進PyTorch模組化、可擴充套件設計的大型活躍社群:在Detectron2中引入了模組化設計,使用者可以將自定義模組的實現插入物件檢測系統的任何部分。
這意味著許多新的研究專案可以用數百行程式碼編寫,而核心Detectron2庫和新穎的研究實現之間可以完全分離。
透過實現新模型並發現新方法,不斷完善模組化和可擴充套件的設計,使得Detectron2更加靈活。其模組化特性也使其能夠有效幫助研究人員探索最先進的演算法設計。
該圖顯示了Detectron2的模組化設計如何使使用者能夠拍攝影像並輕鬆切換到自定義主幹,插入不同的預測頭以及執行全景分割
新模型和新功能:Detectron2包括原始Detectron中的所有模型,例如Faster R-CNN,Mask R-CNN,RetinaNet和DensePose。
Detectron2還包括幾個新模型,有Cascade R-CNN,Panoptic FPN和TensorMask,未來將繼續新增更多演算法。Detectron2還新增了一些特性,比如同步批處理規範和對LVIS等新資料集的支援。
新任務:Detectron2支援與物件檢測有關的一系列任務。像原始的Detectron一樣,它支援邊界框和例項分割掩碼的物件檢測,以及人體姿態預測。
此外,Detectron2還增加了對語義分割和全景分割的支援,這是一項結合了語義和例項分割的任務。
高實現質量:重寫Detectron2能夠重新審視底層的設計決策,並解決原來Detectron的幾個實現問題。
速度和可擴充套件性:透過將整個訓練pipeline移至GPU,能夠使Detectron2比原來的Detectron更快,適用於各種標準型號。
此外,現在可以將訓練分佈到多個GPU伺服器,從而可以輕鬆地將訓練擴充套件到非常大的資料集。
Detectron2go:新增了將模型產品化部署的軟體實現,包括標準的內部資料訓練工作流實現、模型壓縮量化、模型轉化等。
開發人員希望透過Detectron2的開源,使研究人員和產品開發人員都能從中受益。