訊飛輪值總裁胡鬱:大資料是人工智慧產業落地的必要保障|BDTC 2019

AIBigbull2050發表於2019-12-19

【導讀】12 月 5-7 日,由中國計算機學會主辦,CCF 大資料專家委員會承辦,CSDN、中科天璣協辦的中國大資料技術大會(BDTC 2019)在北京長城飯店隆重舉行。

100+ 頂尖技術專家、1000+ 大資料從業者齊聚於此,以“大資料驅動智慧+”為主題,聚焦智慧時代大資料技術的發展曲線,圍繞大資料與社會各行業相 結合的最新實踐,進行了深度解讀和討論。

在主論壇上,科大訊飛聯合創始人、輪值總裁胡鬱發表了題為《人工智慧從技術到產業發展路徑》的演講。

訊飛輪值總裁胡鬱:大資料是人工智慧產業落地的必要保障|BDTC 2019

胡鬱是中國科學技術大學訊號與資訊處理專業工學博士,教授級高工; 國 務 院特殊津貼專家;科技部新一代人工智慧戰略諮詢委員會委員;科技部863類人智慧重點專案首席專家;語音及語言資訊處理國家工程實驗室執行 主任;中科院人工智慧產學研創新聯盟應用規劃組組長;中國科學技術大學兼職教授、博士生導師;中國人工智慧學會副理事長,會士;中文資訊學會的常務理事;湖畔大學二期學員。


演講核心觀點:在當前人工智慧技術發展進展下,深度神經網路 結合大資料成為技術和產業發展的必然路徑,發展過程中需要 結合產品創新和商業模式創新來獲取真實的應用資料,同時實現人工智慧應用落地,並將應用得到的商業回報繼續投入到核心技術研究中,實現產業和技術互相迭代、同步發展的漣漪效應。


以下內容為演講實錄:


很高興來到 BDTC,今天講講《人工智慧從技術到產業發展路徑》,特別是人工智慧和大資料 結合的最新進展。


人工智慧不斷進化

人工智慧在過去幾年中非常火熱,但凡是跟人工智慧沾點光的都會說自己是做人工智慧的,就像前幾年大家都說自己是做雲端計算的、做網際網路的、做大資料的一樣。


訊飛輪值總裁胡鬱:大資料是人工智慧產業落地的必要保障|BDTC 2019

但是在過去幾年當中,我們一直提出來要對人工智慧進行明確的分類,大家都知道世界上第一臺計算機被發明的目的是做人類不擅長做或者做得不好的方面,比如運算,計算機的特點是算得快、存得多,第一臺計算機的使命是為了分析炮彈在空中飛行的軌跡這樣複雜的問題,直到 2017、2018 年,炒得非常熱的 AlphaGo 戰勝李世石九段等,在利用人工智慧的方法方面並沒有太大的突破,都是利用人工智慧的運算能力。


但是為什麼人類和動物不擅長運算智慧呢?因為人類祖先在非洲大草原上要生存不需要計數,但是他們一定要眼觀六路,耳聽八方,一定要知道如何捕獵和逃跑。Nature 上有篇文章專門研究了動物捕食者和被捕食者的感知到運動的神經迴路,發現它們是一樣的。人和動物當年在非洲大草原上競爭,需要的是感知智慧和運動智慧。


機器在這方面的發展很快,感知智慧這兩年在語言和影像上不斷實現突破,運動智慧是向工業機器人和服務機器人方向大力發展。那麼這些方面是否就是人工智慧發展的最高目標?其實不是的。人類區別動物的一個重要方向就是人類有認知智慧,我們首次把認知智慧方向提出來,很高興現在很多研究團體也把感知智慧和認知智慧作為將來主要的研究方向。


人類的認知革命

訊飛輪值總裁胡鬱:大資料是人工智慧產業落地的必要保障|BDTC 2019

為什麼講認知智慧是計算機的研究方向?我們看個小故事,非常火的以色列年輕歷史學家 Yuval Noah Harari 寫了《人類簡史》這本書,提出人類歷史經歷了農業革命、工業革命、科學革命和技術革命,但是人類之所以區別於動物,其實是非常重要的基因上的突變。他發現,地球上原來的猿人有很多種,其中我們人類所有的祖先都屬於非洲的智人後代,而其他猿人都逐步被走出非洲的智人打敗,從此銷聲匿跡了。為什麼走出非洲的智人有這麼大的能力?所有猿人都會用火、用工具,但是非洲的猿人有什麼特點?


訊飛輪值總裁胡鬱:大資料是人工智慧產業落地的必要保障|BDTC 2019

研究表明,非洲猿人最大的特點是經歷了基因突變,他們大腦的顳葉轉化了一個小的組織,這個組織產生了語言,而正是因為語言的使用,非洲的智人可以非常好地描述周圍環境,特別是人類與生而來非常擅長的一個能力,叫做“八卦”,因為八卦,人類社會得以建立,因為八卦,我們研究了可以組織成更多的群眾。大家可以想象一下,現在的類人動物,比如大猩猩,一個群族只能有 50 頭,超過就要分家,沒有語言無法很好組織更大的社會活動。


另外一個非常重要的優勢是有了語言以後人類就有了夢想,人類可以創造宗教、創造經濟,所以他們也把這種革命叫做“人類的認知革命”,而計算機實現認知革命還有非常遠的距離。

訊飛輪值總裁胡鬱:大資料是人工智慧產業落地的必要保障|BDTC 2019


認知智慧包括:語言理解、知識表達、邏輯推理、最終複雜決策,認知智慧是現在人工智慧的最大挑戰,自然語言處理作為認知智慧的第一步得到非常多國際上大佬的 關注和支援,但同時也是現在人工智慧突破的一個攔路虎。


人工智慧的實現路徑

深度神經網路

訊飛輪值總裁胡鬱:大資料是人工智慧產業落地的必要保障|BDTC 2019


按研究方向和方式分類,我認為人工智慧主要分為三大類:第一種,是現在大家大說特說的深度神經網路,深度神經網路利用大資料、超級計算能力和非常複雜的模型結構,第一次實現了感知智慧、運動智慧的部分進展,特別是在感知智慧方面取得的突破尤其大。

但是這裡有一個小小的問題,大家有沒有思考過這些資料從哪裡來的?利用感知智慧和大資料智慧的方法實現人工智慧,需要大量真實的大資料,這點和人類的學習是完全不一樣的,人類的學習是小樣本學習,不需要太多大資料,特別是在語音和影像上面。

全腦模擬

訊飛輪值總裁胡鬱:大資料是人工智慧產業落地的必要保障|BDTC 2019

第二種人工智慧實現路徑,是由美國歐洲提出的“腦計劃”,這些提出者有一個想法,隨著超級計算機的進一步發展,對人腦理解更加深入,是否有可能像超級計算機模擬核爆炸全球氣象一樣模擬人類大腦中的所有拓撲結構和放電現象?因為人類大腦也就 1 千億個神經元而已,最新報導已經有人把果蠅甚至小白鼠神經系統完全還原出來,某天計算機如果完全可以模擬所有大腦的放電情況,我們是否就得了一個智慧?這個方向是腦科學的科學家提出來的,且不講這個方向是否能實現,但是得到這樣的系統似乎並不是我們現在利用電子計算機的方向。


智慧動力學

訊飛輪值總裁胡鬱:大資料是人工智慧產業落地的必要保障|BDTC 2019

第三種方案是我們正在做的。我們希望就像人類研究鳥類飛行一樣,最後人類研究出“空氣動力學”,造出比鳥更好的飛機,它不用像鳥一樣吃喝拉撒,但比鳥還快,因為飛機遵循鳥類羽毛空氣動力學的基礎理論。

隨著我們對人類大腦理解越來越深入,對人類大腦拓撲結構和學習機制理解更深,我們完全有可能發明一種“智慧動力學”的東西,它可以在學習人腦的學習機理、人腦結構後,與計算機的速度快、存得多的特點完美 結合在一起,產生強人工智慧甚至超人工智慧的可能性,這是我們的研究方向,後面講的很多產業應用是建立在大資料人工智慧基礎上的。


漣漪效應推動A.I.從技術向產業發展

訊飛輪值總裁胡鬱:大資料是人工智慧產業落地的必要保障|BDTC 2019

從 2006 年推出深度學習網路以來,推動產業發展取得了很大的成功,但是有一個關鍵點決定我們在大資料人工智慧中的成敗。訓練大資料人工智慧需要很多真實的大資料,很多情況下真實的大資料只能來自於真實的應用中,那麼問題來了:當你的人工智慧訓練還不夠好的時候,從哪裡得到真實的大資料?又有什麼樣的人去用它?這裡我們提出一個非常重要的設想,並且把它實施了,取得了很好的效果,我們叫它“漣漪效應”。這是什麼意思呢?


訊飛大資料能力總覽

當人工智慧演算法給業界和大眾使用時,演算法並非一瞬間就擴充套件到所有人,總是有些人先接觸,有些人後接觸,這些先接觸的人會持續地為人工智慧的演算法貢獻資料,利用這些資料不斷地提高人工智慧系統的效能,總有一天就像水波紋在水面擴散一樣,水波紋剛落下去時影響水面範圍比較大,但是錯誤率比較多,隨著系統越來越好,總有一個時刻水波紋還沒擴散到水面時趨近於零,人工智慧正確率已經達到非常高的高度,實現大量人員使用的保證,所以我們講深度神經網路、大資料,將應用產品和人工智慧 結合在一起是非常重要的。

訊飛輪值總裁胡鬱:大資料是人工智慧產業落地的必要保障|BDTC 2019


科大訊飛的大資料能力可以分為四個層面,首先是大資料資源,即我們透過各種產業和業務獲得的真實應用資料,再往上是大資料能力平臺,再往上是業務大資料,各個業務中,教育、醫療、政法、智慧城市裡都有這樣的大資料,最上面一層叫大資料業務,就是在廣告與推薦、在徵信等各個方面利用大資料,完全可以成為一種虛擬的業務來實行。


訊飛輪值總裁胡鬱:大資料是人工智慧產業落地的必要保障|BDTC 2019


科大訊飛有一套 Odeon 平臺,將大資料方面,包括資料的清洗、資料的挖掘、資料的標籤系統,從收集、儲存、計算、服務形成了閉環 。在大資料人工智慧基礎上,2004 年推出了訊飛超腦計劃,希望實現從“能聽會說”到“能理解,會思考”的轉變過程。


訊飛輪值總裁胡鬱:大資料是人工智慧產業落地的必要保障|BDTC 2019


在新一輪基於神經網路的過程中,我們發現有兩層放大器的效果,第一層,現在的人工智慧不僅包括語音、影像、自然語言處理,它們都統一到一個框架上,就是深度神經網路,把深度神經網吃透了,這些核心技術會產生非常大的平臺性提升。在這些核心技術基礎上,我們又能與各個行業 結合,包括消費者、教育、醫療、政法和智慧城市。


AI 產業發展的兩大方向

將來人工智慧會在哪兩方面應用到人類社會中?我們把其中一個方面叫做“自然互動智慧”,大家想象一個乞丐他不識字,但是他可以按照你的要求去辦事,你給他 5 英鎊,他可以幫你買一盒煙,他可以用視覺、聽覺、嘴巴跟你交流。將來每個機器都有自然互動的能力。還有一個方面是文字發明以後產生很多專業,所以人工智慧有一個應用領域是研究專業行業大資料和專家系統,專家系統可以幫助很多行業解決行業裡最稀缺的資源問題,最稀缺的資源就是專家。

今天從 3 個案例分享科大訊飛大資料的應用方向:

應用案例一:

所聽即所見,即“訊飛聽見”系統。在漣漪效應助力下,從一開始語音識別不好用,到 2010年首次在手機上實現了語音識別的系統,經過 3-4 年的發展,成為世界上第一個中文能夠突破實用技術的門檻。到了 2015 年,能夠識別更多型別的語音並且上屏。

這中間使用了很多基於大資料的人工智慧技術,比如麥克風陣列聲學處理和語音處理融合的技術,引入基於影像處理的因素,並融合了更多專業性的演算法、自然語言處理的知識。

訊飛輪值總裁胡鬱:大資料是人工智慧產業落地的必要保障|BDTC 2019


在世界上最高水平的 CHiME 語音識別大賽上,訊飛包攬四項識別冠軍。在各種各樣的噪聲干擾下,原來系統的識別率非常低,經過處理以後我們把識別率提高到百分之百。在漣漪效應的助力下,使用人數不斷增加,錯誤率不斷下降,真正由人產生的大資料幫助訊飛語音識別邁過了實用化的門檻。

最終,訊飛面向一系列消費者的產品落地,包括“聽見”網站、手機  APP、錄音筆、辦公本、全球唯一一個全離線語音轉文字系統。

應用案例二:

智學,是教育領域一個非常重要的應用點。教育領域利用人工智慧的方法輔助教學是最近幾年的熱點,也是一個剛需。以教育為代表,醫療、安全、政務、金融,都需要利用產業的大資料、專家系統和機器學習深度神經網路演算法來共同建立新一代的專家系統。


訊飛輪值總裁胡鬱:大資料是人工智慧產業落地的必要保障|BDTC 2019


這中間應用到了影像識別技術,在影像領域,訊飛先後做了手寫線上識別、離線識別,和針對自然環境下拍照內容的識別。在國際最高水平 ICPR MTWI 測試中,訊飛獲得單字識別、版面分析、公式識別三項冠軍。在頂會 ICDAR 2019 的多項評測中訊飛也獲得冠軍。


訊飛輪值總裁胡鬱:大資料是人工智慧產業落地的必要保障|BDTC 2019


在教育中還需要用到自然語言處理的能力。在自然語言能力處理上有模擬人類大腦的神經元系統DNN,有模擬大腦的感覺性記憶和短時記憶 RNN-LITM,還有模擬人類大腦視覺分析層等演算法。


訊飛獲得的最新獎項是在 2018 年國際語義評測的數學問答競賽中在代數、幾何和應用領域獲得第一名。國際上最高水平的 SQuAD 上,訊飛的機器閱讀水平在兩項評測標準中超過人類水平。


在全球首個醫師資格考試中,訊飛利用理解機器人學習醫院的教科書和知識,並應用在醫學資格考試上。為什麼能做醫學資格考試?這要從  2013 年開始,國家科技部和 863 計劃做一個高考機器人,希望這個高考機器人學習數學、語文、地理、歷史的題目之後參加高考,並最終能夠考上一本大學,考上清華北大。一開始大家都覺得這非常難,但是經過 5 年多不懈的努力,現在專案第一期已經結束,我是這個專案的 863 首席專家,最後機器人數學考了 120 分,語文考到90 分,地理和歷史專案考到四五十分。利用認知能力,智醫助理在滿分 600 分的醫學資格考試中獲得 456分 ,而 360 分就及格了。


核心技術在教育領域會有什麼用處?我們可以看到,它們可以讓卷面批改完全實現自動化,先掃描試卷和學生答題內容,之後進行識別,根據識別的結果用人工智慧的演算法, 結合原來老師評分的經驗和知識,最後形成一個能夠自動生成考試作業成績的系統。


大資料教育的人工智慧系統還能幹什麼?中國幾千年的教育夢想是”因材施教”。現在,人工智慧系統能夠根據自動批改的結果,即後臺大資料和知識圖譜的知識點,來判斷學生對哪些知識點掌握得不夠,根據這些知識點再生成出需要的作業,而不是所有學生都是千篇一律的練習題。使用了這個系統以後,學生作業負擔降低了  30%,學生的學習興趣也得到了很大的提高。


在整個教育大資料中,現在訊飛圍繞老師、家長和學生的需要,在教、學、考、評、管的很多方面推廣人工智慧和大資料的平臺,相信再過幾年,我們就會看到在中國越來越多的學生是透過個性化的、針對性的學習來提高能力,學生將摒棄題海作業戰 術,而是利用學生自身的差異來完成這個工作。我們相信,這樣的機會一定能夠改造教育的現狀,並讓中國有更好的未來。


AI+大資料是科技創新型公司的必然選擇

綜上所述,大資料和人工智慧的 結合是科技創新型公司必不可少的一條路徑。我認為科大訊飛不是一家移動網際網路公司,而是一家科技創新型公司,就像美國的 Facebook、亞馬遜和 Google 一樣,因為當你做核心技術時,要保證技術在全球最先進的,在過去 20 年當中,訊飛的很多技術,包括語音技術、人工智慧技術都在國際上最高水平的比賽中獲得了很好的成績,有的更是突破了中文在全球的門檻。

第二條,作為一家企業,其必要條件是要能夠找到合適的產品創新和商業模式創新,能夠獲得巨大的利潤。

第三條,要把獲得的利潤持續不斷投入到核心技術創新中去。

最後一條,訊飛原來做中文時是有優勢的,因為語言保護了我們。現在隨著國際形勢的變化,我們被迫要去做全球所有的語言處理,現在我們已經走在這條道路上,相信再過 3-4 年就能夠保證我們在全球的近 50 個語種中實現非常好的核心技術突破。

就像機械時代的航空發動機一樣,人工智慧是資訊時代的航空發動機,我們有信心把人工智慧做到最好。

在這個過程中,科大訊飛的人工智慧和大資料業務會緊密 結合,BDTC 釋出的大資料趨勢報告也顯示,人工智慧和大資料至少在現在以及將來的 10 年中將是緊密不可分的。

最後,相信訊飛一定能夠取得更好的成績,也能夠更好地反哺訊飛在大資料方面的成果。



Q&A:

Q:從技術到引領消費者,您原來是管花錢的,後來是管掙錢,這個過程中技術肯定還是不能丟的,那麼您是如何很好地把握角色的轉換並堅持初心的?

A:我覺得有幾個方面轉換的因素。第一個,我發現做研究跟做產業有相似的地方,做研究有一個非常重要的能力,就是對前景預測的能力,要做什麼領域的研究,這需要對這個領域將來的發展有非常透徹的瞭解且有自己的想法,這樣才能跟上歷史的步伐,而不是被它甩開。

做產業也是一樣,當做一個具體的事情和方向時,首先最重要的是思考戰略方向是不是對的,戰略方向主要是來源於你對產業趨勢預先的判定 。就像我剛才提到的,我們為什麼把人工智慧分成感知智慧、認知智慧,為什麼用大資料人工智慧方法來做,為什麼要提出我們的“智慧動力學”,都是對將來很多事物發展、產業發展、產業規律發展做出洞察,同時要調整方向去應對。我覺得這是相同的部分。

第二,也有不同的地方,當我們做教育時,每個老師都希望自己發明一個技術有 1000 個地方都可以用,用得越多越好。但是做產業時會發現,不能因為你的技術能夠用在 10 個方向,就把10個方向全做了,這是不行的。當你有一個技術時,除了要判斷技術創新以外還是否有商業模式創新和產品創新的地方,還要用你自己的技術或者並不是你發明的技術,集中所有能量在最短時間能夠突破的一個方向上,才能夠實現我講的技術創新的那四個步驟。這是不一樣的地方。

最後一點,我認為做研究和做產業,特別是核心技術產業,有一點是都要做到的,就是要能夠耐得住寂寞,要能夠十年磨一劍,板凳能坐十年冷,要厚積薄發。因為這和網際網路的風口、移動網際網路的風口是不一樣的概念,它像爬山一樣,要慢慢積累知識不斷前行,最後要成為浪潮本身,而不是衝浪型的企業。就像我們講的,每次個人 PC 的浪潮中 ,那些真正成為浪潮本身的是什麼?是晶片、是技術軟體、是基礎雲端計算的架構、大資料的架構。所以這兩年一定要耐得住寂寞,埋頭苦幹,厚積薄發。



嘉賓簡介:

胡鬱,科大訊飛聯合創始人,輪值總裁。中國科學技術大學訊號與資訊處理專業工學博士,教授級高工; 國 務 院特殊津貼專家;科技部新一代人工智慧戰略諮詢委員會委員;科技部863類人智慧重點專案首席專家;語音及語言資訊處理國家工程實驗室執行 主任;中科院人工智慧產學研創新聯盟應用規劃組組長;中國科學技術大學兼職教授、博士生導師;中國人工智慧學會副理事長,會士;中文資訊學會的常務理事;湖畔大學二期學員。






來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946223/viewspace-2669393/,如需轉載,請註明出處,否則將追究法律責任。

相關文章