第一個突破是在自動說話人識別軟體上獲得了更高的準確性。該軟體的主要功能基於人類語音對說話者的身份進行辨識。
早在 2000 年,當時最好的說話人識別驗證軟體的錯誤率在 10% 左右,如今的行業標準已經將錯誤率縮減到了 1% 以內,而 IBM 的軟體則創下了 0.59% 的新紀錄。
Pelecanos 承認,該突破看上去似乎沒什麼重大意義,但有著 0.6% 錯誤率和 1% 錯誤率的兩套識別系統,在對人聲的識別驗證上,0.6% 的系統識別錯誤拒絕放行的機率比 1% 的系統要低了近 50%。
IBM 團隊還研發了一個軟體來評估說話者的年齡,據公司稱,它在同類軟體中同樣擁有著最高的準確率,平均誤差在 4.7 歲左右。
該技術可用於 AI 軟體與人類的互動,在對說話者年齡進行估計後,系統可採用更為個性化、更符合說話者年齡的詞彙和語法與之進行互動,讓 AI 變得更智慧更靈活。