中國AI又奪一冠!依圖刷榜全球聲紋識別挑戰賽,大比分奪魁
魚羊 發自 凹非寺
量子位 出品 | 公眾號 QbitAI
中國軍團,繼續重新整理全球AI各項競賽。
這一次,是 全球聲紋識別競賽;這一次,是獨角獸 依圖。
VoxCeleb說話人識別挑戰賽,簡稱VoxSRC,近日正式公佈結果。
在這場匯聚了中外語音領域頂級高手的挑戰賽中,依圖(logicworld)以絕對領先優勢斬獲冠軍。
而且挑戰賽比拼內容,正是當前語音識別領域最高精尖的“聲紋識別”賽道。
之前依圖已經展示了視覺感知、語音識別和語義理解等方面的不俗實力。
現在,依圖則進一步用一個前沿技術領域的全球冠軍,展示了其技術深度之外,在廣度方面的開拓。
真是依圖出沒,氣勢洶湧。
依圖又奪何冠?
VoxSRC,由來自牛津大學,史丹佛國際研究院和麻省理工的學者組織舉辦。
參賽者包括約翰霍普金斯大學、法國國家資訊與自動化研究所、日本電氣(NEC)等傳統豪強,也有中國的清華大學,天津大學,中山大學,依圖科技,平安科技等學校企業。
選手都有備而來,比拼直接而激烈。
指紋識別,人臉識別已經被大眾所熟知,但同樣作為生物資訊識別的一種——聲紋識別(即說話人識別),目前還是技術挑戰的前沿,常在科幻電影中出現,也常被語音AI公司當展望談及。
聲紋識別權威評判標準不多,但真正檢驗技術的,VoxCeleb說話人識別挑戰賽可能算一個。
其主要考核,是運用AI技術如何能夠從自然語音中識別出說話人。
比賽採用的訓練資料集為 VoxCeleb2,由牛津大學發起提供。這一資料集中的音訊全部採集自YouTube,場景包括明星紅地毯、名人演講、真人節目訪談以及大型體育解說等,包含了5994位名人的超過一百萬條語音。
這些名人涉及不同的性別,種族,口音,職業和年齡,並且音訊中存在各種各樣的背景噪聲,包括環境突發噪聲、背景人聲、笑聲、回聲,室內噪聲和錄音裝置噪聲等等。
比賽的測試集則全部沒有標註,屬於“盲測”,保證了競賽的公平與公正。
面對如此挑戰,想讓AI準確提取聲學特徵、說話人特徵,並實現準確的識別匹配,並非易事。
在發表於Interspeech 2018的論文中,VoxCeleb2的作者牛津大學Visual Geometry Group實驗室訓練出的ResNet-50達到了3.95%的等錯誤率(EER),超越了當時的基線方法。
而就在這場比賽中,依圖不僅大幅重新整理該紀錄,將EER壓縮至 0.98%,還超出第二名(1.42%)一個身位,以絕對優勢奪冠。
毫無疑問,這是一次技術實力的肌肉展示。
但如果熟悉依圖業務,就可能忍不住想得更多。
依圖參與全球聲紋識別競賽,又怎會是為了刷榜而刷榜?
技術“冗餘”,增強場景化落地
從聲紋識別本身來說,作為生物識別技術的一種,應用前景原本就非常廣闊。
在個人資訊加密領域,更能發揮重要的作用。
作為一種生物識別解決方案,聲紋識別在金融等對個人資訊保安有高要求的行業當中,也能夠提供更高的安全性,強化風控能力。
此外作為智慧語音應用落地的更大挑戰,聲紋識別的攻堅,對於性別年齡畫像、語種方言識別,進而做到真正的語音互動千人千面,都是繞不過去的核心問題。
而且隨著AI在各行各業的場景化落地越來越普遍,技術冗餘,針對不同問題提供不同解決方案,也在成為AI公司競爭力的核心要求。
在各項技術上有實力、有儲備,才能發展、落地更全面。
也就意味著,AI公司下一階段發展,深度和廣度,都得兼備。
AI公司的深度&廣度
這或許也是依圖目前發展開拓的背後思路。
之前,依圖被人熟知,更多是“CV四小龍”的並稱,強調其在視覺領域的地位。
依圖也確實在多項視覺國際比拼中斬獲冠軍。比如依圖連續三年參加美國國家標準技術局(NIST)人臉識別供應商測試(FVRT),連續三次斬獲冠軍。
在安防、金融和醫療領域,依圖的AI視覺能力,也贏得了真實業務場景的認可。
但2018年以來,依圖開始展現出強大的“泛化”能力,開始將AI技術打通,並迅速在擴充領域取得核心突破。
在語音領域,其語音識別演算法在全球最大的開源中文資料庫AISHELL-2上字錯率僅3.71%,大幅重新整理紀錄。
在NLP方面,依圖聯合廣州婦女兒童醫療中心等機構,將自然語言處理(NLP)技術應用於兒科疾病診斷,成果登上《自然·醫學》(Nature Medicine),這也創下中國AI醫學的新紀錄。
其後更令業界震動的是,依圖低調部署研發,完成了自主AI晶片“求索”的流片、釋出並商用,以“演算法即晶片”理念,提出 智慧密度的新理論,為AI場景化落地,提供座標參考系。
最近一次,由工信部、公安部及網信辦三部委指導主辦的“中國人工智慧高峰論壇”上,依圖AI晶片不僅獲得了AI創新之星,依圖也在首屆多媒體資訊識別競賽中,於11個任務中,斬獲10個A級,為所有參賽者中奪冠最多。
所以,依圖路徑、依圖模式,也是時候值得更多討論了。
這種模式在科技創業的歷史中並不陌生。先有垂直深度,然後平臺化遷移,打造技術更為全面、應用更加廣泛的大平臺。
但在AI歷程中,這樣既要保證深度又有兼顧廣度的事情,依圖之外,還無人做到。
所以聲紋之冠,或許還不是依圖實力的全部。
依圖之路,也值得上下求索。
你說呢?
— 完 —
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29829936/viewspace-2656591/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 網易 AI Lab 斬獲全球頂級聲紋識別競賽冠軍AI
- 不止於刷榜,三大CV賽事奪冠演算法技術的“研”與“用”演算法
- 奪冠!卓世AI斬獲全球頂會AAMAS 2024 CE 競賽冠軍AI
- PGC2023全球總決賽圓滿落幕,恭喜DNW戰隊奪冠!GC
- BAT 汽車賽道爭奪戰BAT
- 極鏈科技兩次奪冠Google AI地標識別大賽,推動國內識別檢索技術再進階GoAI
- 2019全球AI爭奪戰最新彙總AI
- 2022世界盃奪冠熱門最新 2022年世界盃奪冠分析奪冠機率出爐
- Monocle:2015年全球生活質量最高城市東京奪魁Mono
- 清華大學團隊與騰訊AI Lab專項合作奪冠FPS遊戲AI競賽VizDoomAI遊戲OOM
- 巴倫週刊:2014年全球最受尊敬公司排行榜 蘋果再次奪冠蘋果
- 全球十大白帽黑客團體排行:Google 奪魁、三支中國團隊入選黑客Go
- RSA 2021創新沙盒 | Apiiro公司緣何一舉奪魁?API
- 【AI競賽】TinyMind漢字書法識別挑戰賽開始報名啦!!AI
- 財富:2015年全球最受讚賞公司排行榜 蘋果谷歌奪得冠亞軍蘋果谷歌
- 2022世界盃最有可能奪冠的球隊 今年世界盃奪冠大熱門分析
- Cool Bands:2013年英國“最酷品牌”榜單 蘋果兩次奪冠蘋果
- 恭喜天翼雲“翼起飛”戰隊在CCF國際AIOps挑戰賽中奪得亞軍!AI
- 財富中文網:2013年全球最受讚賞公司排行榜:蘋果奪得6連冠蘋果
- 百度PaddlePaddle開源影片分類模型Attention Cluster,曾奪挑戰賽冠軍模型
- 雲知聲以“硬核”技術先聲奪人,AI解決方案加速落地AI
- 公司奪旗比賽-iOS題iOS
- Modelpress:2019年日本票房榜 《天氣之子》奪冠
- iFixit:2013年最難維修手機排行榜 HTC One“奪冠”
- 無聲杯 xss 挑戰賽 writeup
- 機器人也在踢世界盃?中國團隊還奪冠了?!機器人
- 中國統計資訊服務中心:2015年Q3中國手機口碑榜 蘋果奪冠蘋果
- 勇奪全球AI基準測試18項冠軍,中國廠商為何能霸榜?AI
- 用AI反制AI詐騙,合合資訊獲全球AI攻防挑戰賽金融場景賽道冠軍AI
- 百度PaddlePaddle開源視訊分類模型Attention Cluster,曾奪挑戰賽冠軍模型
- 提氣!阿里巴巴在全球人工智慧“世界盃”中奪冠阿里人工智慧
- SplashData:2013年度最糟糕密碼排行榜 “123456”奪冠密碼
- 2014年全球超級計算機排行榜 天河二號連續四年奪冠計算機
- 2018最具影響力Twitter人物 Taylor Swift意外奪魁Swift
- 奪冠在即!2022 OceanBase資料庫大賽12強集結資料庫
- AI預測2018世界盃 西班牙隊最有希望奪冠AI
- Infographic: 智慧手機霸權爭奪賽–資料資訊圖
- Nu1L戰隊再奪冠!賽博地球杯工業網際網路安全大賽線下決賽圓滿落幕!