聲紋識別在智慧家居中備受青睞,但還面臨一些“困擾”

行者武松發表於2018-03-01

在智慧家居領域,語音識別的熱潮正悄然平息,聲紋識別接替而上。



在智慧家居備受青睞,聲紋識別還面臨一些困擾


近日,根據調查機構CIRP的報告顯示,亞馬遜在2014年11月推出的Echo系列智慧音響產品在美銷量已突破510萬臺。並且,根據市場資料,CIRP推算2016年前九個月亞馬遜就已經售出200萬臺Echo產品(包括Echo DotEcho Tap)。


看到亞馬遜的智慧音響銷量如此之好,我們都意識了智慧家居語音控制系統的前景之利好。不過,即使當前的語音識別技術已經基本上達到了人們所需要的標準,在智慧家居語音控制系統之中,仍然有一些瑕疵的存在,比如在人聲嘈雜的環境裡,如何正確識別出使用者發出的命令。


在智慧家居備受青睞,聲紋識別還面臨一些困擾


出於需求,聲紋識別是智慧家居的一個補充


當前,儘管智慧家居語音控制系統已經滿足了人們的基本需求,不過,仍然有一些小小的不足,而這方面,就需要聲紋識別技術進行補充了。


藉助聲紋識別,進一步提升使用者體驗。以智慧音響為例,為了更好的進行定位、捕捉聲音、以及降低無關噪音的影響,開發者們會採用多麥克風的形式,不過,一旦處於人聲鼎沸的環境之中,智慧音響的語音識別系統極有可能“罷工”,因為它很難從眾多聲音中準確的識別出下命令的使用者。


在智慧家居之中,大多家庭往往只買一個智慧音響。打個比方,當聲紋識別技術發展較為成熟之時,若一位家庭成員呼喚音響開啟自己房間的燈,語音控制系統就能通過聲紋識別技術確認說話人的身份,從而準確的開啟說話人房間的燈。由此,在體驗上,不管是從眾多人聲中準確辨認使用者,還是確認說話人的身份,聲紋識別都能讓使用者體驗進一步的提升。


在智慧家居備受青睞,聲紋識別還面臨一些困擾


搭載聲紋識別,提高家庭安全指數。由於不能確認說話人的身份,只要條件允許,當非使用者下達命令之時,語音控制系統極有可能會執行。


舉個例子,有人非法入侵住宅,若語音控制系統不限制說話人的身份,縱然有著智慧監控系統,闖入者完全可以直接下命令關閉監控系統,如此一來,闖入者就成功的得到了住宅的臨時控制權。當搭載聲紋識別技術,基於聲紋的獨特性,再不能識別出闖入者身份的前提下,語音控制系統就能接著進行報警等一系列安防措施。


在智慧家居備受青睞,聲紋識別還面臨一些困擾


備受青睞,聲紋識別仍有“困擾”


如今,在智慧家居領域,語言識別已經充分的體現了自己的價值,緊接著,隨著語音識別熱潮的過去,聲紋識別又成為了新的熱門,被稱為智慧家居未來發展的關鍵,或是語音互動的下一個風口。且不論它在智慧家居領域的未來發展如何,就目前而言,其想在智慧家居領域真正落地,還需解決一些困擾。


首先是聲紋的採集和特徵的建立。不管是人工識別,還是依靠深度學習演算法進行自動化識別,聲紋庫的建立都是進行一切行動的前提。當前,公安的聲紋鑑別庫應該是最全的,不過,企業要想研究聲紋識別,從公安處入手顯然行不通,因而,聲紋庫的建立就依賴於企業自行收集,這是一件相當艱難的任務。


不同於人類的雙耳,機器的識別都是在數以百萬、千萬計的資料訓練中不斷改善的,可以說,如果沒有足夠的資料支援,就沒有如今的語音識別等人工智慧技術的突破。對於企業而言,想要訓練聲紋識別演算法,他們所需的不僅僅是語音資料,還需要特徵多樣化的語音資料,像方言、口音等等,如此才能全方面的對聲紋識別演算法進行訓練。


除了聲紋的採集,聲紋特徵的建立也是當前聲紋識別進展的一個難題。理論上來講,聲紋就像指紋一樣,很少會有兩個人具有相同的聲紋特徵。雖說如此,但正如雙胞胎一般,有些聲紋極其相似,可能只存在一丟丟的差異,這時,找出特徵就成了一件相當具有難度的事。當然,你或許會說這部分可以由計算機完成,的確,依計算機的運算速度,該工作的完成還是相當不費吹灰之力的。不過,在特徵建立工作中,這裡又再次回到了上一個話題,沒有充足的聲紋庫,又如何建立足夠的聲紋特徵?


在智慧家居備受青睞,聲紋識別還面臨一些困擾


其次,除了聲紋的採集和特徵的建立,如何準確識別說話人也是當前一個急需解決的問題。不僅僅是靜態檢測,現在的聲紋識別更多的是被要求進行實時動態監測,因而,說話環境、說話人身體狀況、情緒變化等都能對聲紋識別的結果造成影響。


以說話人本身的狀況為例,用iPhone 7上Siri的聲紋識別做實驗,在提前儲存聲紋資料的基礎上,鎂客君的小夥伴分別以正常、加粗、尖細的聲音喚醒Siri,結果證明,只有正常的語音狀態下,Siri才能被喚醒,其他則是毫無反應。對照該結果,我們可以總結,只要說話人的聲音出現狀況,比如沙啞、情緒化等等,聲紋識別系統就不能將之與庫中的聲紋對上號,從而不能確認說話人的身份。


在智慧家居備受青睞,聲紋識別還面臨一些困擾


正如當前人們所言,在語音識別之後,聲紋識別成了智慧家居的又一個關注點。然而,聲紋庫、特徵的建立以及提高準確率也不是一朝一夕可以完成的,就比如語音識別,縱然準確率已經接近百分之百,但若周遭環境嘈雜,其準確率就差強人意了。因而,在智慧家居領域內備受青睞的聲紋識別,其距離應用的日子還有一段路要走!

原文釋出時間:2016-12-01 18:15


本文作者:韓璐
本文來自雲棲社群合作伙伴鎂客網,瞭解相關資訊可以關注鎂客網。


相關文章