全球最大的第一視角視訊資料集開源,取自真實生活,還能提升廚藝
安妮 編譯整理
量子位 出品 | 公眾號 QbitAI
最近,一個有趣的視訊資料集開源了,它不僅能助你研究生涯一臂之力,或許還能提升你的……嗯,廚藝。
這個將鍋與視訊播放鍵融於一體的影像,就是剛開源的Epic Kitchens資料集的logo。
聰明的你可能已經猜到,這個資料集和廚房有關。
沒錯,在這個第一視角視訊的資料集中,記錄了多個多角度、無指令碼、本地環境中的廚房場景。
它們均來自拍攝者真實的日常飲食生活,並且使用了一種新穎的實時音訊評論方法來收集註釋,因為拍攝者在做飯的時候總喜歡自言自語些什麼~
這個世界上最大的廚藝第一視角視訊資料集大禮包裡都有啥?這有一個介紹視訊——
成分分析
Epic Kitchens資料集裡包含什麼內容?不妨看看這張資料集“構成成分”表——
視訊採集城市:4個
包含的廚房數:32個
視訊總時長:55小時(全高清,60fps)
總幀數:11500000幀
動作片段:39594個
物體邊界框數:454158個
資料集中的視訊均為操作人員的頭戴式攝像機採集,包含多種語言的描述,其中描述的動詞有125種,名詞有331種。
△ 頭戴式的GoPro攝像機在採集影像
成分統計
研究人員將Epic Kitchens中的視訊資料進行分類,想看看這個資料集中到底是怎樣的場景。
統計顯示,資料集中的視訊大多來自晚飯時間,其中傍晚7-8點是採集的高峰期。9-10點也是一個採集小高峰,看來資料的來源群體有吃“早午飯(brunch)”的文化。
△ 視訊時間統計
資料集中43.14%的視訊為烹飪階段,17.55%為資料收集者在做相關準備,16.48%的視訊為他們在刷刷洗洗。
△ 活動統計
研究人員用視訊中的標註生成了標籤雲,“開”“關”“拿”“鍋”“叉子”“勺子”“刀子”等均為大比重的關鍵詞。
△ 標註的標籤雲
在標註中的動作統計中,“put”“take”“wash”等關鍵動作均出現了上千次。做飯嘛,不就是由拿起和放下組成的嘛~
視訊標註中提到的最多的物體是各種廚房用具,其次是各種調料與蔬菜。
研究團隊
這項研究由布里斯托大學、多倫多大學和卡塔尼亞大學的11名研究人員完成,研究論文Scaling Egocentric Vision: The EPIC-KITCHENS Dataset也已釋出在arXiv上。
論文一作是一名叫Dima Damen的小姐姐,目前是布里斯托大學的高階講師,負責計算機視覺的相關研究。
△ 一作Dima Damen
Damen的研究經常亮相頂會。今年2月,她論文Who’s Better, Who’s Best被CVPR2018接收,Trespassing the Boundaries: Labeling Temporal Bounds for Object Interactions in Egocentric Video被ICCV2017接收,還被評為ICCV2017的最佳審稿人。
獲取方式
想獲取這份資料集的相關資訊,有以下幾種開啟方式~
專案地址:
https://epic-kitchens.github.io/2018
論文地址:
https://arxiv.org/abs/1804.02748
資料集下載地址:
https://data.bris.ac.uk/data/dataset/3h91syskeag572hl6tvuovwv4d
程式碼地址:
https://github.com/epic-kitchens/annotations
祝各位學業廚藝雙豐收~
作者系網易新聞·網易號“各有態度”簽約作者
— 完 —
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話介面,回覆“招聘”兩個字。
量子位 QbitAI · 頭條號簽約作者
վ'ᴗ' ի 追蹤AI技術和產品新動態
相關文章
- 優酷真實視訊地址解析
- 圓形視訊和圓角視訊的一種實現方式
- 檢視oracle資料庫真實大小Oracle資料庫
- 資料視覺化的藝術視覺化
- 前端視角看視訊處理前端
- 大資料小視角2:ORCFile與Parquet,開源圈背後的生意大資料
- 資料視覺化分析平臺開源方案集錦視覺化
- 關於房事的真實生活大資料大資料
- 前端視訊資源分享前端
- 現在短視訊本地生活小程式業務還能做嗎?
- 程式碼複用:DDD視角下的平衡藝術
- 上帝視角一覽大資料開發體系大資料
- iOS視訊採集實戰(AVCaptureSession)iOSAPTSession
- 產品視角下的資料倉儲
- 視覺還原小技巧!CSS 實現角標效果視覺CSS
- 尚矽谷大資料視訊_Shell視訊教程大資料
- 複雜資料操作最佳實踐 | 公開課視訊
- 廣告OCPC資料還能告訴我們哪些被忽視的真相
- 緝毒題材互動影像作品《晨昏線》PV首曝:雙重視角、還原真實卷宗
- iOS 學習視訊 資料集合 (視訊 +部落格)iOS
- 短視訊APP是如何開啟你的美好生活的?APP
- 視訊:豆瓣資料架構實踐DX架構
- 100多萬個視訊短片資料集來啦!
- 開源視訊播放器介紹播放器
- Clappr——開源的Web視訊播放器APPWeb播放器
- BI零售資料分析:以自身視角展開分析
- 阿里重磅開源!4000臺伺服器真實資料集,揭祕世界級資料中心阿里伺服器
- 微軟全息眼鏡“第一視角”曝光:科幻微軟
- 從全域性視角看資料結構資料結構
- 25個Vim教程、視訊和資源
- Docker通訊全視角:原理、實踐與技術洞察Docker
- 資料視覺化開發必備的10款工具,真強大視覺化
- 周源:視訊加密和DRM實施實踐加密
- 36款頂級的開源音訊/視訊應用程式音訊
- 極客視角看安全:智慧生活遠沒想象中安全
- 現實生活中的視覺符號視覺符號
- php短視訊原始碼,按鈕的圓角圖示實現PHP原始碼
- 開源,還能走多遠?