深度解讀:阿里雲視訊直播重磅功能升級

程式碼派就是我發表於2022-04-22

2022 年註定是體育超級大年,冬奧、亞運會、大運會、世界盃等各類大型體育賽事應接不暇。隨之而來便是各類賽事直播,客戶對直播服務要求變得越來越高,視訊直播技術創新顯得格外重要。如何利用直播技術創新降低線下部署導播臺的成本、如何提供靈活及場景化的能力、如何確保線上內容傳輸安全穩定,成為許多企業客戶關心的問題。

為更好服務客戶,阿里雲對視訊直播進行了重磅功能升級,打造一站式沉浸體驗雲上虛擬直播間服務,提供在傳輸處理雲上直播高可靠、冗餘設計等端到端一站式的能力,為大型賽事或活動保提供保駕護航的能力。

阿里雲視訊直播產品服務原理

阿里雲視訊直播服務是基於領先的內容接入與分發網路和大規模分散式實時視訊處理技術打造的音視訊直播平臺,提供易接入、低延遲、高併發、高清流暢的音視訊直播服務。

首先,在直播生產端提供了推流端SDK,再通過邊緣節點將流收入到直播中心。阿里雲在全球擁有九大直播中心,支援雲導播、轉碼、錄製等場景化的功能。同時,在分發側基於邊緣節點可將內容分發到全球以及支援多端多平臺的播放器。

阿里雲視訊直播的主要優勢有:

1 、低延遲、高併發

依託遍佈全球的2800多個CDN節點以及150+TB商用頻寬能力,阿里雲視訊直播服務能夠保證賽事畫面從源頭穩定分發到終端。在分發側,基於UDP協議的超低延遲直播RTS能夠將端到端延時降低在1秒內,精彩直播畫面提前獲取,同時也支援SRT、LL-HLS等低延時協議,滿足不同的場景需求。

2 、高清、流暢

基於阿里雲自研的窄帶高清轉碼技術,實現視訊畫質提升,降低傳輸位元速率,節省頻寬成本,最終提升整體視訊畫面分發效率。阿里雲視訊直播服務還提供面向不同場景的轉碼方案,例如,賽事場景中基於深度學習的智慧插幀演算法,可提升視訊幀率,從而提高整個視訊的流暢性。

3 、端到端、場景化

提供了直播從生產端到雲端管理,再到分發播放的全鏈路能力。雲端豐富的場景化功能,如錄製、截圖、識別等功能,可滿足不同場景下的需求,極大降低了企業開發門檻,助力業務快速上線。

本次釋出分為兩塊內容:

一、 虛擬直播間。提供了行業首創全鏈路雲端實景摳像與虛擬背景合成能力,專門為遠端互動打造,實現虛擬直播間的沉浸式體驗,為遠端製作、異地互動直播的場景提供解決方案。

二、直播重保。 基於阿里雲多年直播最佳實踐經驗為客戶提供全方位技術支援和諮詢服務。利用邊緣推流、窄帶高清轉碼、雲上導播、全域邊緣節點分發等技術能力,通過全鏈路災備與應急預案等保障手段,為重要活動、體育賽事、演唱會等大型線上直播場景提供高可靠、高品質、低延時的直播服務。

虛擬直播間 讓直播服務能力提升

雲端互動虛擬演播室為 遠端採訪、異地互動、虛擬實時製作 等場景打造富有沉浸感的演播體驗,達到專業廣電級導播效果,並已成功應用在各類大型賽事直播場景中。通過雲端的 多路實時實景摳像、虛擬背景生成與實時動態渲染技術 ,有效解決了主播與嘉賓不在同一空間,以及現場環境受限無法進行專業演播的痛點。將身處在不同地方的人合成到任意演播廳,即便身處千里之外,也能透過虛擬演播技術,體驗沉浸於同一空間的互動感。

目前,演播廳常用的摳圖技術大多跟綠幕摳圖相關。但綠幕摳圖存在幾個弊端:首先要專門搭建綠幕演播室或者是綠幕裝置,應用場景受限;同時,為了保證綠幕摳圖的最佳效果,還需要加裝燈光裝置進行除錯,甚至需要有拍攝經驗或操作者進行提前的佈景。

而阿里雲利用AI技術創新對虛擬演播廳的技術方案進行了全面的升級,打磨出了全新實景摳像演算法和引擎能力。首次採用了實景預設背景摳像、多機位切換+實時摳像、最高6路摳像源+摳像合成處理等技術方案。為了對標廣電級別的節目規格,阿里雲視訊技術團隊還嘗試了多種的演算法以及工程模型,提升實景摳像的效果以及長時間直播的穩定效能,將實景摳像的效果提升行業領先的水平。因此,在各種採訪環境不可控的雜亂背景下,阿里雲虛擬演播廳技術均可以處理實現最佳的成像效果。

阿里雲還打通了音視訊通訊RTC以及全球音視訊實時傳輸網路GRTN,將多機位、多視角同步直播的技術能力與RTC實時連麥、異地開播等能力進行結合,為使用者提供了簡單穩定的連線功能,真正的實現了互動虛擬演播的能力。

從去年至今,互動虛擬演播廳技術方案已被廣泛應用到國內各類賽事活動直播中,打造了多場沉浸式的直播報導。而這一新技術的運用也打破了傳統的電視臺記者的採訪形式,即無需要記者再攜帶攝像團隊以及沉重的裝置到處奔波,更無需以往一定要把記者與受訪者設定於同一環境的固有模式。通過互動虛擬演播廳採訪任務僅需要兩部手機加一臺電腦,即可以隨時隨地的展開直播與轉播,同時也讓觀眾們可以在第一時間體驗到了更具有沉浸感的播報視感。

互動虛擬演播廳技術能力升級概括總結如下:

第一,對實景摳像打造出了新的演算法引擎和極致的效果,解決了實景扣像邊緣粗糙、抖動等問題,並且摳像效果精細到了人物畫質真實細膩的效果,也促進了產品的可應用性,打破了行業實景摳像的壁壘;

第二,豐富了業務側的接入能力,實現了實時互動+導播的完整方案,打造出了實時互動的場景。通過手機APP,既可以簡單便捷的開播,讓使用門檻大幅度降低;

第三,全面升級了雲導播的穩定性,包括超長時間連麥的穩定性、摳像的穩定性、音視訊互動、APP效能、全方位的滿足異地多人多場景以及超長時間的連麥和直播需求。對於複雜的多場景,比如單人切換、雙人遠景切換、近景直播中插入電片廣告等,實現了無線無縫的切換,真正的達到了廣電級級別的節目製作水準。

這一次全面的技術升級,也是將之前的虛擬演播廳升級為具有實時互動、沉浸效果體驗的互動虛擬演播廳。產品方案也為各類業務和行業帶來了直播報導的全新體驗。從實際的應用場景上來看,互動虛擬演播廳不僅高度契合體育競技國內外賽事類的現場轉播,遠端直播、多主持人解說模式等場景,還可以應用於各類行業轉播。

同時,雲導播進行了全面的服務升級和易用性的改造,接入門檻極大的降低。通過輕量化服務的技術方案的實現,大大的擴充了該技術的應用場景。接入方式不僅支援從RTC的服務自動獲取直播間線上流,還支援手機、相機、攝像機等多種裝置的推流。錄製視訊,或者直接輸入直播UIL等方式,並且通過自動的智慧的摳像與背景的合成渲染輸出直播流。在直播的過程中,還可以結合直播內容,可以實時的切換場景,切換指令碼,插入廣告或者VCR小片,新增圖文包裝效果,並進行監聽、監播和調音、混音等操作互動。

虛擬演播廳也提供了多種產品使用方案。在阿里雲登入直播控制檯,即可以開箱即用視覺化的配置和開播,可以實時的製作播出監看,調整直播內容。本地與線上一鍵同步,無需開發介入,適合各種運營和業務團隊的使用。此外,還可以基於完善的API服務,按需呼叫封裝自己的直播業務系統。雲導播還提供了帶有控制檯前端頁面的完整web SDK,可以直接巢狀整合,節省開發成本,幫助提供整套直播解決方案。

目前阿里雲導播臺支援最多12路的輸入源,同時六路的摳像合成,支援自定義的背景圖,支援對於摳像物件的位置和大小直接進行拖拽設定,支援只保留音訊的監聽模式,支援佈局圖層順序調整,只需要通過簡單的兩三步配置即可完成快速開播。同時,圖文包裝、知識、素材樣式、位置以及投放邏輯的實時編寫和設定實時字幕。結合達摩院的ASR語音轉文字和實時翻譯的能力,支援多語種的雙向實時互譯。同時結合上字幕包裝的效果,可以很輕鬆的完美的呈現一場精彩的直播。

專業直播重保 讓直播服務更穩

隨著直播使用者增長, 各平臺都開始精細化運營,保證百萬量級以上併發直播活動的高可靠、高品質、商業化探索是各直播平臺急需解決的問題。

 

首先阿里雲的資源儲備是非常充足的。 阿里雲擁有遍佈全球2800+CDN節點,150+T頻寬,9大直播中心,支援海外業務無縫佈局,通過阿里雲搭建的全球實時音視訊通訊網(GRTN),全世界各地的直播流可實現就近接入,通過高速通道快速傳輸至指定直播中心進行內容分發。

對於客戶來說,需要根據自身業務場景選擇合適的協議進行推流和播放。以下列舉阿里雲視訊直播支援主要5類直播協議,直播延時由低到高。延時指的是一個能夠穩定流暢播放所測出的資料。不同協議的技術成本存在差異,簡單講就是延遲越低成本越高。之前比較流行的直播協議是RTMP、FLV、HLS,現在都慢慢轉向RTS和LL-HLS。

在協議選擇完成後,還需要對視訊引數進行響應選擇。推流播放端推流的話,有的是通過客戶端推流,就是客戶端比較重要。比如說傳媒類的,可能是用流媒體伺服器作為推流端,或者作為源站進行一個拉流,然後最終的播放可能用系統播放器或者定製播放器。因此需要根據自己的一個實際情況來進行選擇。如果是像RTS和LL-HLS這種進階的協議的話,基本上是要定製的播放器的。

幀率的選擇,對於不是很重要的內容的,有些會選擇15幀。但最為常見的是25幀,這是通用的一個幀率,能夠保證相對的畫面流暢。對於體育賽事這種要求要求極致流暢的,可能會採用50幀或60幀。編碼格式一般選擇是H.264和H.265。解析度不是越大越好。在位元速率和成本固定的情況下,解析度越變越大,整個客觀質量有可能會下降。位元速率越大,也會帶來其他問題。比如卡頓率會提升,成本會提升,但是它畫質的提升其實存在位元速率變大後提升效果越來越小的情況。一般720P的話是1到3M左右。畫面簡單就1M,畫面複雜可能就2到3M,根據實際情況可以實測。

阿里雲直播重保方案包含 全鏈路穩定方案、全鏈路防盜鏈方案、千萬級併發排程方案、全鏈路監控方案、全量鏈路監控方案

如果是普通流,左邊有個直播源,無論是原站拉流的方式,還是推流推流的方式,到阿里雲直播中心處理之後,CDN分發就一路。這是最普通的一個流。對於一個重要的直播活動,為了保證前面推流或者源站的一個高可用穩定,推薦使用兩個推流端,分兩路推到直播中心,直播中心做一次合成,合成之後再進行處理轉碼進行分發,避免推流端的單點風險以及推流網路單點風險。如果這個活動是非常重要, 不在乎成本的,建議客戶這邊有兩個推流端,同時推到不同直播重心,雙中心各自合流形成主備。

視訊直播支援訪問控制,如Refer UA黑白名單、IP黑白名單等, 可以做到基礎的防護,但是偽造比較容易

支援URL防盜鏈,標準鑑權和自定義演算法都是通過演算法加密,偽造困難,但是無法防止複製已經加密的URL進行播放,把URL釋出到社交平臺或者盜鏈網站,直接能播放。

支援通用二次鑑權和業務方的遠端鑑權,前者可以通過限制相同加密url的訪問頻次來限制複製URL的行為,後者是完全由業務的業務中心來判斷請求是否合法,可以更加靈活的控制和分析。

更進一步是視訊加密,直播視訊加密是雲端一體的視訊加密解決方案,支援行業通用DRM加密,支援多終端、多平臺、全方位進行版權保護。該加密方法擁有獨立加密金鑰,避免單一金鑰洩密引起大範圍的安全問題,支援加密轉碼+解密播放,動態金鑰管理更安全地保護視訊資源,可有效防止視訊洩露和盜鏈問題。數字水印技術在直播視訊中應用,實現大型賽事直播版權視訊內容搬運侵權的取證、溯源和追責。

對於這種千萬級併發的直播頻寬抖動是非常大的。以往年世界盃直播為例,上下半場之間有中場休息時間,畫面比較簡單,通過阿里雲的窄帶高清技術在進行傳輸時頻寬只有峰值的三分之一或四分之一,當下半場開始時,大量使用者快速湧入直播間,頻寬瞬間回到峰值。短短一分鐘內,頻寬增長几個T或十幾個T。這樣場景下的排程風險是非常大的。

如何來規避這個風險呢?排程方式有三種:DNS排程、302排程,HTTPDNS排程。從接入的方便性來說的話,DNS排程是 最好最容易的,這是廣泛應用於網際網路的一種排程,但缺點是反應非常慢。比較快的是302排程,但僅限於HTTP的協議, 並且影響首屏。但綜合起來最好的是HTTPDNS排程,它反應速度非常快,而且也不存在那個首屏的影響,需要客戶端這些做一些接入。同時,阿里雲還會提前智慧預測需要頻寬趨勢,提前分配好資源,做好大型活動賽事優先順序保障, 能夠非常有效的防止T級頻寬突發帶來的風險

在護航過程中,會有專人在後臺提供全程服務保障以及全鏈路服務監控。從推流開始到最終播放的整個鏈路的情況,包括幀率、位元速率以及全網頻寬壓力情況。針對特別重大活動,阿里雲還會定製一個類似右側一樣的大屏。對於每一路直播流,都會用紅綠燈的方式去顯示它的通斷情況,並且把它排在一起看,這樣能夠迅速的發現哪一路流出現問題。具體某一路流也可以去具體的看幀率、位元速率以及線上的使用者數。全鏈路上有每一個裝置的效能狀況,便於直播活動中問題排查。

使用者如希望看到一些視訊直播資料資訊,阿里雲可以提供一個新的產品叫做廣 系統。廣播系統把客戶這邊直播的幾路直播,無論是原始流,或者是轉碼,流合併成一路監控流進行監控。整個監控可以分成四屏、八屏、十二屏來實現一個盯屏畫面。可以實時的在看板資料化的顯示它的幀率、位元速率、音柱這些資訊。如果幀率抖動,位元速率異常,以及音視訊的同步異常,卡頓這種情況出現的時候,直接會進行實時的報警。

 


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31550522/viewspace-2888260/,如需轉載,請註明出處,否則將追究法律責任。

相關文章