西工大開源擁擠人群資料集生成工具,大幅提升演算法精度 | CVPR 2019

AI科技大本營發表於2019-03-13

640?wx_fmt=jpeg


作者 | 周強(CV君)

轉載自 我愛計算機視覺(公眾號id:aicvml)


近年來,因為擁擠人群計數在視訊監控、公共安全方面的應用廣泛,引起了不少學者的關注。


簡單說來這個任務就是給定影像,返回該影像所描述場景中有多少人。


這可以幫助城市管理者、大型活動組織方實時瞭解人群擁擠情況,以利於早期防範群體事件、人群踩踏等。


和大多數計算機視覺任務面臨相同的困境,視訊資料容易獲取,但標註卻是個耗費大量人力物力的工作。


今天新上傳到 arXiv 的 CVPR 2019 的接收論文《Learning from Synthetic Data for Crowd Counting in the Wild》,來自西北工業大學的學者提出使用計算機圖形工具建立擁擠人群資料集的方法,並開源了他們建立的大型資料集,在此資料集上訓練的演算法精度獲得了大幅提升,超越了之前的state-of-the-art。


作者資訊:


640?wx_fmt=jpeg


作者全部來自西北工業大學。


作者使用計算機圖形學的方法,通過設定不同的多樣化的場景、設定不同的人物模型,建立了大量的樣本資料。


640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg


下圖是與現有資料集的比較,可見該論文中提出的GCC資料集是目前最大的公開資料集。


640?wx_fmt=jpeg


同時,該資料集在每幅影像中行人個數、時間分佈、天氣情況分佈各個方面也具有多樣性,非常適合人群計數任務。


640?wx_fmt=jpeg


如何用這個資料集?


該資料集是合成資料集,作者提出兩種方法,使用該資料集參與演算法訓練。


如下圖,上面部分為監督學習方法,下面部分為使用域適應的方法。


640?wx_fmt=jpeg


一種是監督學習的方法,使用該大型資料集預訓練網路,再在實際的真實場景資料集中微調網路。


使用這種方法,作者採用的網路模型:


640?wx_fmt=jpeg


獲得了超越目前該任務state-of-the-art的精度。


640?wx_fmt=jpeg

640?wx_fmt=jpeg


使用域適應方法的演算法流程圖:


640?wx_fmt=jpeg


使用該資料集後,演算法同樣獲得了大幅的精度提升。


640?wx_fmt=jpeg


作者已經公開了該資料集,並開源了資料建立標註工具。

https://github.com/gjy3035/GCC-CL

專案主頁:

https://gjy3035.github.io/GCC-CL/

論文地址:

https://arxiv.org/pdf/1903.03303.pdf


感謝各位作者!


下面來看看作者放出的資料建立Demo視訊:



對於做相關方法的朋友,非常值得參考!


(本文為 AI科技大本營轉載文章,轉載請聯絡原作者


線上分享會

週五晚8點

拿下史丹佛和劍橋雙offer,00後的演算法學習之路


640?wx_fmt=png

推薦閱讀:

                         640?wx_fmt=png

點選“閱讀原文”,檢視歷史精彩文章。

相關文章