全球最大的第一視角視訊資料集開源,取自真實生活,還能提升廚藝
安妮 編譯整理
量子位 出品 | 公眾號 QbitAI
最近,一個有趣的視訊資料集開源了,它不僅能助你研究生涯一臂之力,或許還能提升你的……嗯,廚藝。
這個將鍋與視訊播放鍵融於一體的影像,就是剛開源的Epic Kitchens資料集的logo。
聰明的你可能已經猜到,這個資料集和廚房有關。
沒錯,在這個第一視角視訊的資料集中,記錄了多個多角度、無指令碼、本地環境中的廚房場景。
它們均來自拍攝者真實的日常飲食生活,並且使用了一種新穎的實時音訊評論方法來收集註釋,因為拍攝者在做飯的時候總喜歡自言自語些什麼~
這個世界上最大的廚藝第一視角視訊資料集大禮包裡都有啥?這有一個介紹視訊——
成分分析
Epic Kitchens資料集裡包含什麼內容?不妨看看這張資料集“構成成分”表——
視訊採集城市:4個
包含的廚房數:32個
視訊總時長:55小時(全高清,60fps)
總幀數:11500000幀
動作片段:39594個
物體邊界框數:454158個
資料集中的視訊均為操作人員的頭戴式攝像機採集,包含多種語言的描述,其中描述的動詞有125種,名詞有331種。
△ 頭戴式的GoPro攝像機在採集影像
成分統計
研究人員將Epic Kitchens中的視訊資料進行分類,想看看這個資料集中到底是怎樣的場景。
統計顯示,資料集中的視訊大多來自晚飯時間,其中傍晚7-8點是採集的高峰期。9-10點也是一個採集小高峰,看來資料的來源群體有吃“早午飯(brunch)”的文化。
△ 視訊時間統計
資料集中43.14%的視訊為烹飪階段,17.55%為資料收集者在做相關準備,16.48%的視訊為他們在刷刷洗洗。
△ 活動統計
研究人員用視訊中的標註生成了標籤雲,“開”“關”“拿”“鍋”“叉子”“勺子”“刀子”等均為大比重的關鍵詞。
△ 標註的標籤雲
在標註中的動作統計中,“put”“take”“wash”等關鍵動作均出現了上千次。做飯嘛,不就是由拿起和放下組成的嘛~
視訊標註中提到的最多的物體是各種廚房用具,其次是各種調料與蔬菜。
研究團隊
這項研究由布里斯托大學、多倫多大學和卡塔尼亞大學的11名研究人員完成,研究論文Scaling Egocentric Vision: The EPIC-KITCHENS Dataset也已釋出在arXiv上。
論文一作是一名叫Dima Damen的小姐姐,目前是布里斯托大學的高階講師,負責計算機視覺的相關研究。
△ 一作Dima Damen
Damen的研究經常亮相頂會。今年2月,她論文Who’s Better, Who’s Best被CVPR2018接收,Trespassing the Boundaries: Labeling Temporal Bounds for Object Interactions in Egocentric Video被ICCV2017接收,還被評為ICCV2017的最佳審稿人。
獲取方式
想獲取這份資料集的相關資訊,有以下幾種開啟方式~
專案地址:
https://epic-kitchens.github.io/2018
論文地址:
https://arxiv.org/abs/1804.02748
資料集下載地址:
https://data.bris.ac.uk/data/dataset/3h91syskeag572hl6tvuovwv4d
程式碼地址:
https://github.com/epic-kitchens/annotations
祝各位學業廚藝雙豐收~
作者系網易新聞·網易號“各有態度”簽約作者
— 完 —
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話介面,回覆“招聘”兩個字。
量子位 QbitAI · 頭條號簽約作者
վ'ᴗ' ի 追蹤AI技術和產品新動態
相關文章
- 以資訊的視角思考即刻
- 檢視oracle資料庫真實大小Oracle資料庫
- 圓形視訊和圓角視訊的一種實現方式
- 大資料小視角2:ORCFile與Parquet,開源圈背後的生意大資料
- 資料視覺化分析平臺開源方案集錦視覺化
- 資料視覺化的藝術視覺化
- 中美科技實力對比:全球視角
- 前端視角看視訊處理前端
- 『中美科技實力對比:全球視角』今日資料行業日報(2019.05.27)行業
- 【手摸手玩轉 OceanBase 77】如何檢視叢集的資源資訊?
- 產品視角下的資料倉儲
- 上帝視角一覽大資料開發體系大資料
- 愛奇藝AI剪輯師到底能剪出怎樣的視訊?AI
- 程式碼複用:DDD視角下的平衡藝術
- 視覺還原小技巧!CSS 實現角標效果視覺CSS
- 要割草還是更真實的格鬥體驗?頂視角《斬妖Raksasi》給了自我表達
- iOS視訊採集實戰(AVCaptureSession)iOSAPTSession
- 現在短視訊本地生活小程式業務還能做嗎?
- 騰訊又添 AI 開源專案!騰訊 AI Lab 開源業內最大規模多標籤影像資料集AI
- 騰訊又添 AI 開源專案!騰訊 AI Lab 開源業內最大規模多標籤影象資料集AI
- 緝毒題材互動影像作品《晨昏線》PV首曝:雙重視角、還原真實卷宗
- 100多萬個視訊短片資料集來啦!
- 影像融合演算法及多視角(多源)資訊融合總結演算法
- 尚矽谷大資料視訊_Shell視訊教程大資料
- 騰訊又添 AI 開源專案!騰訊 AI Lab 正式開源業內最大規模多標籤影象資料集AI
- 曠視聯合智源釋出全球最大物體檢測資料集Objects365,舉辦CVPR DIW2019挑戰賽ObjectS3
- 廣告OCPC資料還能告訴我們哪些被忽視的真相
- 資料顯示Netflix 70%視訊流量源於網際網路電視
- 阿里重磅開源!4000臺伺服器真實資料集,揭祕世界級資料中心阿里伺服器
- BI零售資料分析:以自身視角展開分析
- 從全域性視角看資料結構資料結構
- 視訊點播開發者實戰:視訊水印的基本使用
- 視訊:豆瓣資料架構實踐DX架構
- Android音視訊(一) Camera2 API採集資料AndroidAPI
- 短視訊APP是如何開啟你的美好生活的?APP
- 資料視覺化開發必備的10款工具,真強大視覺化
- 愛奇藝短視訊智慧標籤生成實踐
- 現實生活中的視覺符號視覺符號