視訊畫質評測難點

zhangminghui發表於2020-08-04

1、視訊行業的痛點

視訊行業實際上處於一個高速發展的階段,使用者的痛點也在不斷髮生變化。視訊行業的痛點主要體現在:首先客戶終端發生了變化,即從電視到手提電腦到Pad到手機,而且手機終端的應用也有極大的豐富。

其次視訊的高清體驗不斷提升,解析度從1K到4K到8K超高清、立體聲從單聲道、雙聲道到立體聲道、幀率從10fps到30fps到60fps,都有很大提升,所以隨著視訊行業的發展趨勢,在頻寬、網路極大豐富的背景下,高清相比位元速率的需求會增加。同時視訊內容發生變更,PGC、UGC、雲遊戲的出現,當手機娛樂達到一個瓶頸時,會螺旋式地向大屏方向發展,包括pad、8k超高清電視等。netflix,google stadia 就是很好的例子。

Netflix是美國最大的流媒體播放服務商和美國最受歡迎的視訊網站,電視會員群體發展非常良性,而google stadia則在大屏上具備了比手機端更加非凡的效果。

2、量化主觀質量的難點

在5G時代,視訊高清發展不斷提升的大背景下,如何不斷地提升高清體驗,如何衡量包括超分、修復、增強等這些視訊質量效果是量化主觀質量的難點。

我們從線上爬取了14萬的資料,並篩選了1000個視訊,每個視訊時長在五秒鐘左右。在1000個視訊裡進行隨機地編碼和縮放失真,生產了2000段噪聲資料,並對這2000段噪聲資料進行標註,總計有15萬次標註。

通過VMAF、PSNR數值得出VMAF、PSNR的SROCC值並不高,這反映出雖然擁有客觀評價指標,但客觀評價指標實際上很難量化主觀觀看的效果。這僅是編碼失真的衡量上就體現出這樣的難點,那麼AI增強以及修復等增強的效果可能更難去衡量

3、視訊主觀畫質可量化指標的難點

建立視訊主觀畫質可量化指標主要從以下四個方面進行分析:

首先是視訊的篩選,如何從海量視訊裡挑選具備代表性的視訊和內容的覆蓋面廣度是比較關鍵的問題,因為不同的視訊測試集,最終得出的測試結果完全不一樣,那麼測試序列該如何篩選呢?

其次是評測維度的制定,哪些評測維度是有必要衡量的,用幾分制?全參考和無參考的模式也不相同。

再次是評測質量,因為評測需要多人的評測才能得出一個平均分數,那麼多少人的評測才能既保證評測的精度又不浪費人力成本?同時還要考慮評測的結果是否需要篩選,資料如何分析的問題。

最後是資料對映,不同時期,不同情景下的評測分數,如何將這些不同時期的資料進行資料對映這也是其中的難點。以上四點是我們認為的評測中的難點。

大家是如何進行畫質評測的呢?歡迎大家瀏覽討論

相關文章