5G跟音訊,有關係嗎?

naojiti發表於2019-08-20

“5G來了,你最盼望的應用是什麼?”

如果拿這個問題去詢問大部分手機使用者,相信收穫的答案會是高畫質直播、VR、雲遊戲等等。應該近乎沒人會說,“5G來了,會讓我聽音樂更爽”。

確實,5G提高頻寬降低時延,基本指向於網路能夠支撐更好畫質,於是無論影片、遊戲還是AR、VR,都把5G牢牢和視覺困在了一起。

那麼5G網路的升級,真的就跟聽覺一點關係都沒有嗎?換言之,今天智慧手機以及個人硬體裡,關於“聽”的那一部分是不是已經走到了盡頭?

其實未必,5G雖然與視覺緊密相關,但它能給聲音帶來的東西也不算少數。今天我們從幾個方向展示一下,5G對音訊的賦能到底是怎麼發生的。

高音質與低時延:5G特性下的聲音

首先能夠給聲音帶來改變的,依舊是5G的基礎特性:大頻寬與低時延。

沿著這兩條軌跡,我們會發現現有聲音傳輸還是有較大空間來進行最佳化。在4G網路環境下,我們習慣了隨時線上收聽音樂、音訊節目,甚至觀看直播,但其基本是建立在音質經過較大幅度壓縮基礎上的。而當網路傳輸速率達到10Gbps左右的時候,高畫質音質也可以透過網路快速傳輸,保證實時化共享。另一方面,5G網路的低時延特性也給聲音帶來了新的可能,比如多聲源同步問題可以得到比較妥善的解決。

把這些5G特性落到應用場景裡,我們可以比較簡單地看到,三個方面的5G+聲音能力將被開啟。隨之而來是一些新玩法可能被挖掘。

一、高畫質、高品質音樂的線上化。

我們知道,一些高質量音樂在手機段很難復現,一方面是由於揚聲環境有限,另一方面也是因為網路環境限制,導致質量較大的音訊檔案很難傳輸。5G直接帶來的改變,是高品質音樂和音訊節目具有更高的實現性。這個特性可能開啟的應用,不僅於音樂一項。很多對於音質細節具有高要求的音訊內容,比如環境音、催眠音效、白噪音等等也可以獲得更好的輸出效果。比如用聲音來觸發大腦舒適感的ASMR,一直以來其圈內都強調專用收音裝置的等級。而高等級收音同時也需要大頻寬網路的輔助,才能最終讓使用者體驗到最終效果,5G到來或許是類似領域的一個契機。

二、讓聲音在5G中互動。

5G的另一個特性是低時延,這意味著不同音源的聲音可以更好組成統一體。這一點應用在線上音訊中,可以很好解決幾個終端同步收音合奏的效果。今天的直播界,也經常會搞一些對唱和聲之類的玩法,但質量很難跟現場音樂相提並論。尤其樂器合奏,近乎於是無法在4G網路環境下達成很好效果的。

5G網路的特性,可以讓異地音樂排練變為可能。而對商業形態的最直接影響在於,5G網路或許可以讓不同地域的歌手樂手完成高品質的合奏玩法,換言之就是網上音樂會成為可能。在今天直播與音訊節目盛行的環境下,類似玩法應該會有比較好的表現。

三、更好的聲畫同步效果。

音訊當然不止於自身,更多情況下它需要與影片合作。5G網路的低時延特性,一個可能性在於能夠升級VR、遊戲等環境下的聲畫同步體驗,讓聲音更好與視覺配合。這個體驗最直接的商業想象力在於互動影片,更復雜可互動的音效,是互動影片體驗升級的核心路徑之一。

聲音漂移:IoT環境下無處不在的聲音

更多時候,5G不能被看作一個單獨的技術路徑,而是必須與更多技術突破相結合,提供網路方面的助力。對於聲音來說,這樣的“5G+”賦能也同樣存在。

比如我們知道,大量生活場景裡的IoT裝置,都趨向於取消按鍵和觸屏,而是用智慧語音互動作為主要控制入口。

這也意味著,大量家庭生活與車載場景裡的IoT裝置,都將攜帶發聲裝置。那麼在5G環境下,這些裝置將獲得更好的聯接效果與硬體虛擬化能力。聲音也就可以在這些裝置之間更好傳輸。

或許不久的未來,我們可以期待這樣的場景:客廳中用電視追劇的你,要起身去運動,然後去廚房搞點吃的。在執行這個非常符合減肥需求的行動同時,你並不想停止追劇,至少也要聽個聲音。那麼你可以把電視的聲音扔到運動耳機上,運動之後再把耳機的聲音扔到廚房的音響,或者乾脆扔到冰箱、燃氣灶上……

IoT體系下的聲音無縫體驗,並不僅僅意味著使用者可以指揮聲音到處遊走,同時也意味著裝置對使用者聲音的識別、理解與互動能力。每個裝置和使用者說過什麼話,學習到了什麼東西,都需要體系化共享與再學習,這都需要建立在強大網路環境上。5G和wifi6,目前看來是這一能力的網路基礎基石。

IoT必須擁有更多能力,而聲音正是其中之一。

演算法即聲音:AI+5G賦能音訊

或許關注AI領域的朋友有這樣一個感覺,新聞裡的AI語音能力越來越神奇,什麼聲音克隆、情緒識別、機器對話,都非常強力。但落到自己的手機和音響上,總感覺有點傻傻的?

這裡面有一個核心問題,就是算力和網路環境不達標,龐大的深度學習模型沒法在現有條件下跑在終端裝置上。雖然類似問題出現在機器視覺領域更多,但隨著這兩年語音模型飛速發展,算力和網路能力不足,優秀演算法不能落到使用者終端的問題,也開始出現在了語音領域。

所以5G給音訊的賦能,另一個想象力在於跟AI結合。

未來,我們聽見的機器聲音和其他人傳遞過來的音訊,很有可能已經經過了大量演算法“美化”。聲音界更具欺詐性的“喬碧蘿殿下”可謂指日可待。

相對需要5G網路加持的語音演算法應用,包括機器音的實時美化和情緒修飾、聲音克隆、多模態語義理解等等。另一方面,在5G網路下,AI也將有條件更好理解使用者的聲音,並從中產生更多玩法和商業化價值。

5G即將到來,升級網路環境和眾多新網路特性,對於各產業都將帶來不同的升級效果。對於內容創作者來說,5G是新的畫板。無論你的創作載體是聲音、影片、遊戲,或者想象中的其他形式,5G都是一個新的機遇。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2654356/,如需轉載,請註明出處,否則將追究法律責任。

相關文章