谷歌DeepMind人工智慧 學會讀唇語讓監控變“監聽”

佚名發表於2016-11-25

谷歌的人工智慧DeepMind又厲害了。

近日,DeepMind部門與牛津大學研究人員共同創造了一個記錄:在測試的上千小時BBC影片片段中,DeepMind AI實現了46.8%的讀唇識別文字精準率。也許你覺得46.8%不是很牛,但其實經過訓練的人類讀唇專家,正確率也僅為12.4%而已。

谷歌AI學會讀唇語了 能幫助盲人“看”電視

牛津大學的研發小組在本月早些時候釋出了報告,首先他們開發了一款名為“Lipnet”的讀唇軟體,其測試成績為93.4%準確率,似乎比DeepMind AI更高,但其實這是在特製錄影的條件下完成的,測試語句全部為公式化。

谷歌AI學會讀唇語了 能幫助盲人“看”電視

DeepMind AI則不同,它完全是在“看電視”的情況下測試的,也就是說片段隨機、片段中人物的語音隨機,更具挑戰性。為此,DeepMind AI經過了約5000小時的訓練,包括大量新聞節目,鍛鍊並學習“看、聽、讀、拼”的能力。

DeepMind的研究表明,AI可以實現更強大的語言學習能力,並且擁有廣泛的應用價值,比如幫助聽障人士理解自然對話、可以詮釋無聲電影或是整合到諸如Siri和Alexa等語音助手中。

當然,也有人對該技術感到恐懼,認為這是一種更方便的監控技術。不過研究人員表示,該技術需要在明亮的、高解析度影片畫面中執行,目前的監控影片還不具備操作條件。但無論如何,AI正在變得越來越聰明,這是一件好事。

相關文章