科大訊飛:讓世界聽見AI的聲音

人工智慧學家發表於2018-08-14

640?wx_fmt=jpeg

來源:華為


懷揣著“讓世界聆聽我們的聲音”的夢想,科大訊飛依託世界領先的核心技術,引領智慧浪潮,服務億萬使用者,從中國語音產業的拓荒者一躍成為世界人工智慧產業的領軍者,而最初科大訊飛把語音作為切入點卻是源於偶然……


戳視訊,聽聽科大訊飛執行總裁、消費者事業群總裁胡鬱先生如何解讀。




源於偶然:讓機器開口說話


科大訊飛1999年成立的時候,手上只有一項技術就是語音技術,當時的目標是讓機器開口說話。


胡鬱笑談:


“當時我們並不知道,我們處於人工智慧的範疇,至少自己沒有清晰的概念。我們更加不知道的是,1999年恰恰是人工智慧的第二次冬天。就像華為任總以前經常講的一句話,華為要是知道通訊行業這麼難做,可能就不會做了。我們當時也是,如果知道人工智慧處於那樣的環境,可能就不會創業了。這既有巧合,又是冥冥之中的註定。”


“2003-2004年以後,人工智慧還不是特別熱,我們慢慢意識到我們做的恰好是人工智慧最關鍵的技術。”


人類的智慧相對於其他動物或者相對於機器,最重要的是認知智慧,而認知智慧的主要來源是人類對語言的掌握和對知識的表達,然後在這個基礎上進行邏輯推理和複雜的決策。以語音和語言為中心的認知革命,是人類智慧的最高水平,也是現在人工智慧所面臨的最大挑戰。


作為訊飛超腦的總牽頭人,胡鬱作出了這樣的詮釋:


“2014年,我們在業界第一次推出‘訊飛超腦’計劃,這不僅僅是一個口號。我們同時釋出了對人工智慧的定義,即運算智慧。機器從發明的第一天開始,就比人類強很多,比如會下圍棋的機器,就是機器運算智慧的表現。還有類人機器具有感知智慧和運動智慧,具體表現是機器能夠看到、聽到、感覺到周圍的世界。現在的類人和動物的機器已做得不錯了。但是,人類之所以能夠屹立在地球生物鏈的頂端,是因為人類的語言能力,我們稱為認知智慧。這是訊飛超腦計劃的一個目標,讓具備感知智慧的機器從能聽會說、能看會認,過渡到認知智慧,即能理解,會思考。”


當前,“訊飛超腦”利用大資料來進行訓練以提升相關演算法,這其中的“訓練”指代的並不是那種填鴨式的資料輸入和訓練,而是來自於真實應用場景的真實互動資料,讓系統能夠依據真實資料實現自主學習和提升,胡鬱稱之為漣漪效應,就像水滴入水面產生的漣漪一樣,隨著產品覆蓋面的不斷增加,資料量級也在快速攀升,進而帶來產品體驗的快速優化迭代,這一切的背後都依賴於“訊飛超腦”這個強大的人工智慧引擎。


科大訊飛在語音合成、識別、評測,翻譯等領域都擁有全球領先的核心技術。


640?wx_fmt=jpeg


2005年至2018年,在全球最高水平的語音合成比賽Blizzard Challenge中,科大訊飛取得13連冠,同時科大訊飛各項關鍵指標均名列第一。在國際機器翻譯評測IWSLT2014、NIST2015等大賽中科大訊飛連奪冠軍。


在過去6年中,科大訊飛的語音識別技術準確率從60.2%提升到98%以上。語音技術上的優勢為科大訊飛向人工智慧發展,同時落地行業與應用打下良好的根基。


訊飛在佈局當前的大資料人工智慧的同時,也在關心人工智慧發展的另一方面,即與人腦相結合,基於類腦計算,試圖找到人腦智慧的奧祕,發現其中的智慧動力學,進而真正讓機器具備像人一樣的智慧,同時不受人腦物理空間的侷限,以此來實現人工智慧領域真正的突破。


訊飛翻譯機,出境遊so easy


科大訊飛是真正把人工智慧的應用落地了。在2010年,科大訊飛開發了世界上第二個、中國第一個語音輸入法,僅次於谷歌,訊飛輸入法主打語音輸入,語音識別準確率超98%,同時支援22種方言的語音輸入。


640?wx_fmt=png


在2016年,科大訊飛釋出了第一個智慧終端產品訊飛翻譯機。


2018年4月又推出了訊飛翻譯機2.0,主打中文與33種語言實時互譯、方言翻譯和拍照翻譯,並獨傢俱備4G、Wi-Fi和離線翻譯模式。


翻譯機86%的使用者用於出境遊。考慮到使用者可能不會使用標準普通話,訊飛翻譯機同時搭載了方言和帶方言口音非標準普通話的識別能力,目前已支援粵語、四川話、東北話、河南話四大方言。


方言種類還在持續增加中,並能根據使用者的不同使用場景與用詞習慣,準確識別並給出最符合語境的翻譯結果,真正做到了落地實用。“可以說,訊飛翻譯機2.0是至今世界上銷量最好、好評度最高的手持式智慧翻譯系統。”


為了構建未來人工智慧產業生態體系,在2010年訊飛釋出了語音雲平臺。目前平臺上的開發者已經超過86萬,連線19億裝置,每日提供近46億次互動服務,數以百萬計的開發者正在藉助科大訊飛的核心技術開發智慧產品,服務於人們生活的方方面面。


2015年,科大訊飛進一步釋出了對人工智慧產業具有里程碑意義的人機互動介面——AIUI,重新定義了萬物互聯時代的人機互動標準。胡鬱說道:


“2017年,科大訊飛被宣佈作為首批國家新一代人工智慧開放創新四大平臺之一,旨在建成依託智慧語音的國家新一代人工智慧開放創新平臺。”



賦能公檢法、教育等傳統行業


智慧語音和人工智慧技術對傳統行業賦能方面,科大訊飛也做了很多嘗試,例如公檢法、教育等行業。


在公檢法領域,科大訊飛通過與最高法、最高檢開展創新合作。2016年在安徽開展的測試顯示,人工智慧判斷詐騙電話的準確率極高;人工智慧還充當起法庭書記員,經測試,智慧語音識別參與庭審取得實際效果,庭審時長縮短30%。


在教育領域,人工智慧在“改卷子”方面的能力就超乎了人們的想象。


640?wx_fmt=jpeg


在江蘇省的高考智慧閱卷驗證中,兩個不同的人工智慧語文作文閱卷分差小於7分,一致率達92.82%,比兩位老師的閱卷評分的一致率高出5%以上。


在湖南省研究生考試的智慧閱卷驗證中,兩個不同的人工智慧分別對英語作文進行閱卷評分,分差小於6分的一致率竟高達99.83%,比兩位老師的閱卷評分一致率高出了4%以上。


胡鬱表示,教育部考試中心正聯合科大訊飛建設人工智慧聯合實驗室,在教育領域醞釀著更多“黑科技”的誕生。


共建AI未來


科大訊飛與華為公司始終保持著緊密合作,雙方充分依託各自行業領域的長期積澱優勢,在電信平臺、智慧終端等領域建立了戰略合作關係,攜手推動語音及人工智慧技術的深入應用。


640?wx_fmt=jpeg


雙方合作在2010年建立了世界上第一個中文語音的開放雲平臺。雲端計算能力開放以後,眾多公司和開發者可以面向終端使用者的各種需求,開發各種各樣的產品,這就形成了生態的建設。


2018年5月,華為與科大訊飛簽署戰略合作協議,未來雙方將在公有云服務、ICT基礎設施產品、智慧終端、以及辦公IT四大領域開展深度戰略合作。


雙方還將面向未來開發創新AI語音應用,擴充全新行業市場,做大規模共享收益,共同做強人工智慧產業生態。


對於消費者市場,華為手機使用的技術中,有一部分是源於科大訊飛的智慧語音技術加持。華為手機還將科大訊飛的AI技術和能力內化為華為手機能力的一部分,為其帶來差異化的競爭優勢。


雙方將基於科大訊飛的語音識別、語音合成、訊飛聽見、訊飛翻譯等語音AI技術和能力,圍繞手機等智慧終端產品以及終端雲服務進行合作。


對於2B市場,華為在基礎設施、內部辦公產品等使用科大訊飛的技術與產品,雙方將基於訊飛引擎和華為雲資源,共同構築華為雲EI平臺。


面向未來+智慧的時代,胡鬱認為將來的人工智慧都要在雲上實現。由於雲端計算的資源消耗比較大,將來有可能會在端計算和邊緣計算上實現更好的人工智慧,也許很快成為技術上的突破口。人工智慧的應用也會更多地落地,真正解決問題。


我們有理由相信,未來華為和訊飛可以更好地依託自身優勢,結合產業發展,共同推動人工智慧生態體系的建設,為未來的AI生活增光添彩。


未來智慧實驗室是人工智慧學家與科學院相關機構聯合成立的人工智慧,網際網路和腦科學交叉研究機構。


未來智慧實驗室的主要工作包括:建立AI智慧系統智商評測體系,開展世界人工智慧智商評測;開展網際網路(城市)雲腦研究計劃,構建網際網路(城市)雲腦技術和企業圖譜,為提升企業,行業與城市的智慧水平服務。

  如果您對實驗室的研究感興趣,歡迎加入未來智慧實驗室線上平臺。掃描以下二維碼或點選本文左下角“閱讀原文”

640?wx_fmt=jpeg

相關文章