只要6秒 AI人工智慧只要聽聲音就能描繪你的長相
你相信嗎?AI人工智慧最近已經進化到,只要花6秒的時間,聽到你的聲音除可以分辨出你的性別、年紀與種族外,甚至可以描繪出你的長相。
這款由麻省理工學院(MIT)所打造出來的AI,研究人員用一個由數百萬個影片剪輯而成的資料集,對一個名為Speech2Face的神經網路模型進行自我訓練,而這款網路的運作大概分成兩部分,一個是語音編碼器,主要負責對輸入的語音來進行分析,並預測出相關的臉部特徵;另一個則是臉部解碼器,主要對輸入的臉部特徵來進行整合併產生影像。從最終結果來看,僅用了6秒,就能靠著聲音來還原人臉,效果上是令人滿意的。
該研究團隊表示,他們的目的並非為了準確還原說話者的模樣,Speech2Face模型主要是為了研究語音與相貌之間的關聯性。目前Speech2Face已經可以識別出性別,而對於白種人與亞洲人也能輕易分辨,在年紀部分從30、40、70歲的年齡段聲音命中率會比較高一點。
除了基礎的性別、年紀與種族外,Speech2Face還可以猜中一些臉部特徵,像是鼻子結構、嘴唇厚度與形狀、咬合等情況,也可以猜出大概的臉部骨架,基本上聲音輸入的時間越長,這款AI的準確率就越高;不過研究人員也坦言,AI的聽覺也會有錯,這款AI會將尚未經歷變聲期的小男生當作女性、對說話者的口音也會有判斷錯誤的時候、甚至搞錯年齡等。研究人員表示,Speech2Face之所以會有侷限性,部分原因是因為資料集中的說話者,本身種族多樣性不夠豐富,所以讓它在辨認不同種族人士聲音這樣的能力上是比較弱的。
不過也有人認為這項技術背後所隱藏的隱私與歧視等問題,令人擔憂;他們認為雖然這是純粹的學術調查,但臉部資訊的潛在敏感性,是有必要進一步討論當中的道德因素,應該要對此進行嚴謹的技術測試,並確保實際資料可以代表預期中的使用者群。
【編輯推薦】
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946223/viewspace-2708025/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 只要有熱情和方法就能學好LinuxLinux
- 尤拉計劃708:你只要2
- 科大訊飛:讓世界聽見AI的聲音AI
- 據說只要用上10%的自動駕駛汽車就能緩解交通擁堵,你信嗎?自動駕駛
- 太可怕,這項技術僅透過語音就能勾勒出你的長相
- 只要五分鐘,帶你學會策略模式模式
- 只要一張圖就能「還原」繪畫過程,這篇論文比爆火的Paints-UNDO實現得更早AI
- 解放雙手!這個外掛只要一張表就能生成CRUD程式碼
- 只要200行JavaScript程式碼,就能把特斯拉汽車帶到您身邊JavaScript
- 只要你不認慫,生活就沒辦法撂倒你
- 只要一句話,為你生成創意畫作
- 抖音最火彈幕小程式只要100行程式碼行程
- 如何選擇創業專案你只要懂得這六招創業
- 京東智造雲:在世界人工智慧大會上,聽到的工業智慧生長的聲音人工智慧
- 只要挺過初期的迷茫,《展翅翱翔》會給你難忘的體驗
- 聲音好聽,顏值能打,基於PaddleGAN給人工智慧AI語音模型配上動態畫面(Python3.10)人工智慧AI模型Python
- 連續假期不無聊,只要 30 分鐘就能學會如何架設一個網站!網站
- 出現“順豐慢”是選錯了服務專案,只要瞭解時效就能避免
- 想學AI開發很簡單:只要你會複製貼上AI
- Android聲音相關總結Android
- 只要你懂為啥有人愛砍傳奇,就能明白《逃離塔科夫》為何會成功
- “聽聲知著”|雲知聲AI開放平臺,打造有情感有溫度的定製音庫AI
- 無論你英語多差,只要想學,看了此文必有改變
- 只要這幾步,webpack速成不是事兒Web
- 只要99,這個領域橫著走
- 大地震!某大廠“硬核”搶人,放話:只要AI人才,高中畢業都行!AI
- 癌細胞檢測,只要0.0758秒 | 谷歌AR+AI顯微鏡問世谷歌AI
- 它將AI與定向聲音技術相結合,防止更加私密的通話出現漏音AI
- 納尼?我的Gradle build編譯只要1sGradleUI編譯
- 攻擊銀行內網,只要三步內網
- 為啥大公司只要全棧工程師?全棧工程師
- 只要有心學好Linux並非難事Linux
- 只要有心,學好Linux並非難事Linux
- 只要有耐心,就一定能學好LinuxLinux
- “聽相聲的可以出去了,我們是來賣貨的。”
- GitHub標星近1萬:只需5秒音源,這個網路就能實時“克隆”你的聲音Github
- 只要三步!連老師帶你初探Hi3861程式碼結構
- 只要戴上這副眼鏡,你也可以去歌神演唱會抓逃犯了