美圖影像研究院(MT Lab)斬獲3項國際人工智慧頂會大獎

新闻助手發表於2024-06-26

5月30日,國際人工智慧頂會CVPR 2024舉辦的第3屆野外畫素級影片理解挑戰賽(The 3rd Pixel-level Video Understanding in the Wild, PVUW。下文簡稱PVUW)公佈賽事結果,美圖影像研究院(MT Lab)再獲殊榮,斬獲影片語義分割(VSS)、複雜場景影片目標分割(MOSE)雙賽道亞軍,影片全景分割挑戰賽(VPS)賽道季軍,這也是美圖影像研究院(MT Lab)第3次在CVPR大會上摘得獎項,共獲得了1金3銀3銅的傑出成績。

美圖影像研究院(MT Lab)斬獲3項國際人工智慧頂會大獎

作為全球範圍內計算機視覺領域的頂級會議,CVPR憑藉其廣泛影響力吸引了大批頂尖高校、科研院所等參與其中,成為全球AI領域領先科研團隊展示前沿研究成果的舞臺,深受學術界及產業界的關注。

美圖影像研究院(MT Lab)斬獲3項國際人工智慧頂會大獎

同時,PVUW賽事專注於影片理解領域,由牛津大學、復旦大學、浙江大學、北京航天航空大學、北京交通大學、Amazon、Meta等學術界及產業界的頂尖研究者共同發起,憑藉其前沿性及挑戰性,本屆競賽吸引了包括中國科學院大學、中國科學院自動化研究所、哈爾濱工業大學、美圖公司、三星、中興通訊等海內外高校、科研院所及知名企業參加。

本屆PVUW競賽共包含4個賽道,除影片語義分割挑戰賽(VSS Challenge)、影片全景分割挑戰賽(VPS Challenge)外,新增複雜場景影片目標分割挑戰賽(MOSE Challenge)和基於動作描述的指向性影片分割挑戰賽(MeViS Challenge)2個超高難度賽道,其中,複雜場景影片目標分割挑戰賽(MOSE Challenge)採集了目前最大規模的複雜場景影片目標分割資料集Complex Video Object Segmentation (MOSE),包括目標的消失和重現、不顯眼的小物體、嚴重的遮擋以及擁擠的環境等。旨在於幫助應對影片理解領域目前面臨的如背景複雜性、目標遮擋和消失重現、描述動作的文字理解等挑戰,提升對複雜場景及現實場景的理解能力。

美圖影像研究院(MT Lab)斬獲3項國際人工智慧頂會大獎

美圖影像研究院(MT Lab)此次參賽取得的優異成績背後,是在影片領域長期佈局與持續探索的成果證明,同時也已將這一前沿技術應用於美圖公司旗下美圖秀秀、美顏相機、Wink、美圖設計室等產品中,為使用者帶來“影片人像精修”、“AI商品影片”、“智慧摳圖”等實用功能與創意玩法,透過創新研發成果為廣大使用者提供優質影像與設計服務。

隨著新興影片形態的蓬勃發展,影片行業進一步向多元化發展,美圖影像研究院(MT Lab)也持續加大在影片領域的研發投入,目前專業影片人像精修工具Wink榮登影片編輯工具賽道第二名,開拍已成為口播創作工具賽道第一名。

作為美圖的核心研發中樞,美圖影像研究院(MT Lab)未來也將繼續專注於AI領域前沿技術研發,推動AI技術的落地應用,透過技術創新與升級為使用者和客戶打造更好的AI工作流。

相關文章