AI技術來干預麥克風獲取聲音並不是一個新奇的點子

mangcubwwd發表於2022-05-05

在智慧時代,演算法和算力的不斷突破,讓AI技術飛速發展。在工業生產、醫療、交通、能源等領域,AI與大資料技術相互協助,解放了人們許多無意義、重複危險的工作,也為企業的效率與安全帶來了增益。

不過完美的技術並不存在,我們一邊享受著資料帶來的紅利,另一方面也面臨著個人資訊“裸奔”的挑戰,身邊越來越多的智慧裝置都偷窺我們的個人隱私。

我們或許都有過這些經歷——

隨意地和同事聊天,討論哪裡的火鍋、燒烤好吃,開啟大眾點評,首頁上都是火鍋與燒烤的推薦;

和閨蜜、女朋友討論哪家的奶茶好喝,想喝新出的某個口味,外賣平臺上都是這個奶茶的推薦;

在和家人討論劉畊巨集,討論減肥,討論瑜伽服,再開啟某寶的話,也會收穫滿屏的健身用品推薦。

身邊的電子裝置都在各種暗中偷偷觀察我們的言行,詭異得令人不舒服。這些對我們聲音的窺探,也是一種消費市場風靡下各類App的營銷手段。通過對許可權隱私的開啟,實時將我們的聲音傳輸到系統中,運用所謂AI為我們推送定製化的服務。事實上,這些以獲取隱私為前提的營銷,讓消費者十分困擾。

如何避免這類情況的出現?有些人選擇不長期授權開啟麥克風,一次一授權,但是這種方式太麻煩。更極端的方式,有人故意在交談過程中,使用外放的音樂或者電視劇等嘈雜的聲音來遮蓋交談聲音,但這種殺敵一千自損八百的體驗過分難受。如何用技術的手段來規避這類情形呢?

用魔法打敗魔法

用AI來打敗AI,可能是一個不錯的出路。一種新的AI系統上線,這個AI系統的規避邏輯是,在談話的過程中加一些其他聲音的“佐料”,只不過這些“佐料”很微弱,不會像外放的音樂、聲音那麼嘈雜,影響我們正常的交談。

只要在人們交談的過程中,開啟這個系統,空間內就會播放一段微弱聲音,在不影響正常對話的前提下,掩蓋交談的聲音,以避免被麥克風收音。

這個AI系統,是來自美國哥倫比亞大學的研究團隊提出的一種新方法。該系統可以很容易地部署在我們常用的電子裝置中,只要在電腦、手機等硬體執行,就可以實時保護使用者的隱私。

用AI技術來干預麥克風獲取聲音,並不是一個新奇的點子。此前也有相關的技術解決這類問題,不過因為聲音交談的特殊情境,無法預測幾秒後談話的單詞與語速,這使得AI無法跟上交談雙方的對話節奏,從而影響對話覆蓋遮蔽的效果。

新的AI系統,可以通過深度學習的演算法,預測交談雙方接下來要說的話的特點,以兩秒鐘的輸入語音為條件,實現了實時效能。實時生成的合適麥克風噪音可以有效地干擾對對話隱私的獲取。

這個新演算法使用了一種“預測攻擊”的訊號,該訊號可以干擾任何被自動語音識別模型訓練來轉錄的單詞。並且當干擾的聲音在自然環境播放時,需要足夠大的音量來干擾任何可能在遠處的流氓“竊聽”麥克風。這個系統被證實在有自然環境噪聲和複雜形狀的真實房間中都具備良好的效果。不過目前演算法系統只對英文交流的語言有效,團隊正在將更多的精力放在其他語言的遷移應用中。

在這場爭鬥中,AI系統對裝置背後的神經網路推薦系統勝算滿滿。這一研究成果也在走出實驗室的過程中,向多語言多場景輻射落地,未來或許能夠幫助我們免受各式各樣對話隱私的“騷擾”。

聲音的隱私對我們的影響主要是消費領域的干涉和侵擾,在視訊領域,我們的肖像隱私更是重災區。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69929371/viewspace-2890754/,如需轉載,請註明出處,否則將追究法律責任。

相關文章