日前,專注於聲紋識別的初創企業聲揚科技VoiceAI宣佈,公司已完成由香港 X 科技基金領投、 Brizan Ventures 等跟投的千萬級 Pre-A 輪融資。聲揚科技方面表示,本輪融資將主要用於人才團隊的建設與培養,一方面在全球範圍內招募智慧語音領域的科學家、演算法工程師等頂尖人才, 與香港科技大學人工智慧研究中心(CAiRE) 合作在香港籌建智慧語音研究院,開展相關研究課題,以鞏固其在聲紋識別等核心領域的領先優勢,另一方面夯實產品與開發團隊,利用其在海內外多個樣板專案的實施經驗,在國內安全、金融、物聯網等領域對聲紋技術應用需求爆發之時快速搶佔市場。
聲揚科技前臺
聲揚科技:聲紋識別的先行者
在經過智慧手機對指紋識別和人臉識別的科普之後,大家對生物識別都有了相當的認識,而聲紋識別就是當中一個安全係數比較高的一個識別方式。
所謂聲紋識別,是指根據待識別語音的聲紋特徵識別該段語音所對應的說話人的過程。不同於指紋識別和麵部識別需要其他硬體的支援,聲紋識別只需要用一個麥克風採集聲音就可以跨平臺執行聲紋識別,這就使得他們較之前兩者更有優勢;同時,作為目前唯一的主動驗證方式,聲紋識別的安全度也有了提升,這就驅使聲紋識別成為市場追逐的目標,連央行也在去年10月正式對外發布了《移動金融基於聲紋識別的安全應用技術規範》金融行業標準,這意味著聲紋識別技術得到金融監管部門的認可,也同時意味著其背後有很大的市場靜待挖掘。而聲揚科技就是當中的先行者。
不同型別生物識別的特徵對比
聲揚科技由產業界和學術界的語音領域專家於2016年成立,在聲紋識別方面有了深厚的積累,同時公司還在語音識別、 麥克風陣列和語音訊號處理等領域擁有完全自主智慧財產權的領先演算法和應用技術。例如在聲紋方面,公司已經推出了聲紋1:1,聲紋1:N和性別識別等功能,識別準確率也做到了業界領先,超過了99.5%,且能夠支援百萬級併發和百萬級資料庫的聲紋識別。為了避免錄音帶來的潛在威脅,聲揚科技還自主開發了聲音活體檢測技術,進一步提升聲紋識別的安全性。
基於此,聲揚科技的產品也被廣泛應用到大金融、社保、 安全、 政務、物聯網與網際網路和智慧硬體等行業。客戶也包括了中國南方電網、 ASUS 華碩、廣發證券、 印尼國家社保機構 TASPEN、墨西哥國家級貸款銀行 INFONAVIT 等國內外企業與政府機構等提供技術服務。其中,印尼國家級社保機構 TASPEN 在其 2018 年 5 月上線的多重生物識別驗證系統,採用了聲揚科技的聲紋識別和語音識別技術,用於 250 萬養老金領取人的生存驗證,養老金領取人在任何地方打一通電話即可完成其生存驗證,省去了現場驗證的舟車勞頓,社保機構也節約了大量人力物力。聲揚科技也在持續推動聲紋識別技術的普及。
持續攻克難題,未來不排除自研AI晶片
雖然聲紋識別擁有各種各樣的好處,但因為聲紋使用終端和使用環境的複雜性,這就使得聲紋識別也擁有很多問題需要解決。例如距離遠近、語種、口音和不同使用環境和終端都會對聲紋識別帶來挑戰,而聲揚科技表示,未來會持續推進解決這些問題。
另外,從聲紋識別的原理上看,需要經歷提取聲音特徵、訓練建模,打造複合聲紋模型庫,待辨識物件與模型庫對比的過程,這就是現在火熱的人工智慧所專長的。聲揚科技也是通過應用領先的深度神經網路(DNN)演算法,研發出 Attention-based R-CNN, DPNN, DHNN 等語音底層演算法,解決了長期困擾業界的語音長度要求過長、無法相容通道差異等難題,並在此基礎上開發了若干核心演算法引擎,用於進行 1:1 和 1:N 聲紋比對驗證。
在這種運算需求下,就要求硬體,尤其是晶片方面的專用性,目前很多的語音識別廠商也推進相關的晶片自研,也是為了解決這個問題而來的。聲揚科技方面表示,他們在AI晶片方面早有關注,在恰當的時候,公司也會推出自研的AI晶片,而公司也也在上面做了不少的儲備。他們指出,公司的投資人兼董事高秉強教授是國際著名的大規模積體電路科學家,IEEE院士,香港工程協會院士,他會在公司未來的AI晶片計劃中提供充足的支援。
公司會持續地在上面投入,推動聲紋識別應用到各種場景中去,讓每一個人的生活變得更好才是AI技術的終極使命。聲揚科技方面強調。