阿里達摩院參與制定VCM國際影片標準,提案斬獲兩項第一

伺服器頻道發表於2022-11-18

11月18日訊息,在國際影片標準MPEG Technical Requirements工作組關於MPEG Video Coding for Machine(以下簡稱“MPEG-VCM”)的技術徵集提案評測中,阿里巴巴達摩院聯合香港城市大學提交的方案在機器視覺任務中取得2項第一,是唯一一個斬獲多項第一的提案。據悉,MPEG於今年上半年向全球釋出MPEG-VCM技術徵集書,10月完成響應提案效能的評測,該階段的提案將為後續標準制定提供重要參考。

影片編碼是影片訊號儲存和傳輸的基礎,它可以在人眼觀看無明顯質量下降的情況下將影片壓縮數百倍甚至數千倍,極大地降低影片傳輸頻寬成本和儲存成本。該領域於上世紀八十年代開始進入標準化發展,至今面向人眼的影片編碼標準已經歷了多代的迭代和最佳化,目前最新最高效的影片編碼標準為H.266/VVC標準。

隨著自動駕駛,智慧城市和工業網際網路等人工智慧場景的發展,面向機器的影片編碼需求急劇上升,以機器視覺為主的機器到機器的資料傳輸預計將於2023年佔據全球資料傳輸總量的約50%。相比傳統影片,該類場景具有高觀測精度、高感知靈敏度、高強度工作耐受性等特點,業界迫切需要全新的影片編碼技術。為此,MPEG於2019年7月成立VCM工作組,推進機器視覺影片編碼標準化工作,並吸引了阿里巴巴、愛立信、諾基亞、浙江大學及ETRI等國內外企業和機構的參與。

提案徵集是影片標準制定的重要階段,本次MPEG-VCM共接收到來自全球16家企業和機構的提案,所有提案在多項機器視覺任務和多個資料集上進行測試。以BD-rate和BD-rate(Pareto)指標衡量各個提案相對於H.266/VVC標準的位元速率節省,最終,達摩院聯合香港城市大學的提案(Proposal 02)在物體檢測任務中取得兩項效能第一。

    

(圖:達摩院與香港城市大學的提案獲得兩項第一)

據介紹,達摩院提出了全新的VCM框架,聯合自適應時空域編碼方案JAST,該方案包括面向機器的預分析、面向機器的預處理、自適應時域變取樣、自適應空域變取樣和核心影片編碼器五大模組,最終有效提升面向機器視覺任務效能的壓縮效率。在標準測試條件的物體檢測任務中,JAST方案可獲得平均39.04%的效能提升。

達摩院研究員葉琰表示:“隨著超高畫質影片、AR/VR、自動駕駛、智慧城市和工業網際網路等新應用的爆發,影片編碼技術既要面向人眼也要面向機器,我們將持續深度參與國際影片標準的制定,用創新技術為各行各業降低頻寬成本。”

過去幾年,達摩院積極參與國際影片標準的制定,在ITU-T和INCITS等重要國際影片標準組織中擔任主席和副主席職位,達摩院自研的Ali266在全球編解碼頂級賽事MSU 2021比賽中獲得了全高畫質FullHD客觀效能賽道的8項第一和主觀賽道的冠軍。

來自 “ 廠商動態 ”, 原文作者:廠商動態;原文連結:廠商動態,如有侵權,請聯絡管理員刪除。

相關文章