MIT 最新技術：從靜音視訊中提取聲音

發表於2014-08-06

一組由 MIT、微軟和 Adobe 組成的影像、聲學演算法學家等開發出了一種新的演算法，能夠通過靜音視訊中的物品微小的振動幅度，提取復原出當時場景中的聲音！

該團隊已經測試了該技術：測試者在房間內對話，房間內放置一個薯片袋；房間外一臺攝像機隔著隔音玻璃對著這個薯片袋進行拍攝。研究人員從這段完全無聲的視訊中復原出了測試者在房間內的對話！

其他測試物件還包括鋁箔、水面，甚至一盆植物的葉子……團隊都能夠通過演算法，從這些視訊中的材質表面微震中提取出有效的音訊素材。該團隊將會在今年的國際頂級計算機影像峰會 Siggraph 大會上呈現研究成果。

聲波接觸到物品的時候，會導致物品發生振動——即便是最微小的振動。這種振動人眼幾乎識別不了，人們不知道從這種振動中能夠提取出資訊。

Abe Davis, 機電工程和電腦科學研究生，MIT

團隊成員還包括 Frédo Durand、Bill Freeman，兩位 MIT 的電腦科學教授；Neal Wadhwa，MIT 的另一名研究生；Michael Rubinstein 博士，來自微軟研究院；Gaytham Mysore，來自 Adobe 研究院。

不過，大家別太擔心普通的攝像頭拍下的視訊能夠被用於提取音訊訊號。該研究團隊使用了能夠拍攝每秒 2000 到 6000 幀素材的高速攝像機——已經非常快，但並沒有目前世界頂尖的商業級高速攝像機快，後者能夠拍攝高達 10 萬幀每秒的視訊。

但這並不意味著普通的攝像機達到不了效果。該團隊解釋，使用 60 幀每秒的攝像機拍攝的素材，通過演算法仍然能夠提取出「一些」音訊訊號，雖然可能完全聽不清說的是什麼，不過能夠判別出講話者的個數、講話者的性別，甚至講話者的聲學特性——用以判斷講話者的身份。

研究團隊對著一個正在播放搖滾樂的耳機進行拍攝，通過演算法重現出一個音訊檔案，然後播放給猜歌軟體 Shazam。後者完美地識別出了最一開始播放的這首歌……

ffmpeg 去除音訊中的靜音
2024-05-15
音訊
MIT又出新玩法，利用AI可輕鬆分離視訊中的樂器聲音
2018-07-09
MITAI
Android 聲網音視訊體驗記錄|掘金技術徵文
2019-04-16
Android
音視訊技術基礎
2018-09-29
Mac線上視訊音訊提取工具
2021-09-26
Mac音訊
OpenAI：可從15秒的音訊中克隆出聲音
2024-03-30
OpenAI音訊
從實時音視訊的微場景看混音技術
2018-08-15
即時通訊的語音回聲消除技術
2014-11-13
風雲音訊處理大師提取視訊中的音訊檔案的方法
2020-10-28
音訊
一款非常強大的從電影中提取人聲、提取音樂、提取特效聲的AI工具
2024-04-26
特效AI
聲網Agora音訊通話實踐 | 掘金技術徵文
2019-04-17
Go音訊
音視訊技術：視訊質量評價方法簡介
2018-08-26
基於webRTC技術音訊和視訊，IM解
2015-10-24
Web音訊
C# 提取Word中插入的多媒體檔案（視訊、音訊）
2022-03-03
C#音訊
Google最新開發技術動態 (中字視訊)
2017-08-04
Go
音視訊技術開發週刊65期
2018-09-04
音視訊技術開發週刊67期
2018-09-20
實時音視訊技術入門提綱
2018-05-31
音視訊技術開發週刊56期
2018-07-05
iOS ARKit錄製視訊（AVAssetWriter & 有聲音）
2018-05-17
iOS
【秒懂音視訊開發】06_重識聲音
2021-03-10
聲網視訊通話，視訊直播小程式 SDK 初體驗 | 掘金技術徵文
2019-04-22
win10怎麼錄螢幕視訊帶聲音錄製視訊沒有聲音的解決方法
2020-12-29
Win10
web技術支援| 從視訊元素流式傳輸到視訊元素
2022-05-10
Web
技術分享| 小程式實現音視訊通話
2022-08-04
最新熱乎的尚矽谷Docker核心技術視訊教程
2018-12-19
Docker
2018最新區塊鏈技術，從入門到精通視訊教程（比特幣基礎技術）
2018-10-04
區塊鏈比特幣
Flutter之聲網Agore實現音訊體驗記錄 | 掘金技術徵文
2019-05-27
FlutterGo音訊
MIT"傳聲"新技術，幾米開外也能說“悄悄話”
2019-01-29
MIT
語音的關鍵聲學特徵（語音情感特徵提取）
2018-11-21
特徵
wavesurfer fluent-ffmpeg提取音訊
2018-11-06
音訊
RTC 系統音視訊傳輸弱網對抗技術
2022-05-17
音視訊技術傻瓜版解析：帶你解鎖RTMP
2018-09-26
“小程式+直播”怎樣攪動音視訊技術生態？
2017-12-29
視訊對講技術
2017-11-27
短視訊“音訊化”，音樂“視訊化”
2021-11-29
音訊
js對flv提取h264、aac音視訊流
2020-12-27
JS
錄音內容如何轉成文字？從音訊中提取文字的實用方法
2021-04-16
音訊

MIT 最新技術：從靜音視訊中提取聲音

相關文章