高文院士:從“鄉村教師”到人工智慧掌舵者的40年科研路

演算法與數學之美發表於2018-09-18

成為一名工程師,是高文從小以來的夢想。在那個物質匱乏的年代,懷著對夢想的執著,高文從初中開始,便和周圍的朋友一起玩無線電、擺弄收音機。憑藉著這份單純的執著,從哈爾濱工業大學計算機應用博士、東京大學電子學博士,到IEEE Fellow、全國政協委員,再到中國工程院院士,高文一路走了下來。

 

大學教育與計算機相關領域科研,是他幾十年來的生活。榮譽等身,卻依舊腳踏實地。這背後,是他幾十年如一日的思考、實踐,攀向高處同時面向未來的堅持。

 

640?wx_fmt=jpeg


30年漫漫科研路

 

上世紀70年代,在大連一座海島上的小學,高文開啟了他的教學生涯。彼時不足20歲的高文站在講壇前,依舊有些青澀。

 

對於高文來說,教課只不過是“上山下鄉”裡要從事的工作之一,除此之外,他還兼職挑水、種莊稼、施肥。但是對於閉塞小島上的學生們來說,這可能是唯一一種獲取知識的途徑了。

 

剛剛闊別高中不久的高文,深知一位優秀老師對於學生的重要意義。而高中老師對自己的循循善誘,不僅激發了高文對待知識的熱情,還讓他懂得了“一位好老師真正的樣子”。這也是他多年教師之路上內心責任感的源泉。

 

慢慢地,高文逐漸融入了島上村民的生活。不僅擔負起教書育人的責任,其它各項工作也開展得有聲有色,到村裡當廣播員搞宣傳,去大隊當電工,為老鄉修收音機和鐘錶。

 

短短几年,高文與村民結下了深厚情誼,以至於高文主動放棄了擺在自己前面回城打工名額。後來,高文還是回到了家鄉大連,進入一家生產電冰箱的工廠裡做學徒。這段經歷,也成為了高文日後重要的人生轉折點。

 

工廠裡的師傅以生產電晶體為主,對計算機有大致的瞭解。在高文準備填報大學志願的時候,師傅們紛紛建議他報考計算機專業。儘管計算機在當時還並不普及,但是人人都有一種“前途不可限量”的感覺。

 

聽從了師傅們的建議,高文在23歲那年,成功考入了哈爾濱科技大學計算機專業。因為年齡在班裡偏大,高文很難交到朋友,便一門心思將全部精力用在了學習上。這也使他以第一名的身份完成了79級的考試,並在跟學校申請後,以優異成績完成了78級的考試。平日裡刻苦好學的高文僅用了3年就完成了本科學習。

 

1985年,高文進入哈爾濱工業大學攻讀碩士學位。在導師的推薦下,高文進入日本東京大學訪問研修。當時東京大學的科研環境比國內要先進很多,之前許多隻能在文獻裡看到的操作,現在也可以親手操作。

 

儘管各項條件比國內領先不少,但高文卻陷入沉思。“什麼時候國內能達到這樣的科研條件?什麼時候中國的學術水平可以跟國外比肩?”在日本求學的高文生活得並不輕鬆,面對高昂的生活壓力,他不得不一邊學習一邊打工。只不過,高文的業餘工作是幫別人程式設計而不是刷碗。

 

良好的天賦和好學的性格使高文在班上成績十分突出,也令他的日本導師念念不忘,甚至在高文學成回國後,他的日本導師專程造訪哈工大,提出讓高文回到日本再讀一個醫學博士的想法。如果同時拿到醫學和工學兩個博士學位,對於當時的中國來說,可以說是十分罕見。

 

後來,高文再次回到日本,準備走一條工學醫學跨界的學術之路。只不過,在計算機專業順風順水的高文,面對活生生的動物,卻有暈血的問題。高文不得不放棄了學醫的想法,轉而繼續攻讀電子工學博士學位,這也意外為他開啟了人工智慧研究的一扇門。

 

在讀第二個博士學位的後期,高文進入日本一家有名的電信公司,從事人工智慧研究。1991年,高文在哈工大的博士聯合副導師李仲榮病重,在病榻前鄭重地把哈工大一個新的做計算機應用的博士點託付給高文。

 

面對導師的請託,高文放棄了日本公司優厚的待遇,決定回國接手這一新成立的博士點。原因在於中國和國外先進水平的差距,讓高文深感痛心。回國做好一個先進的計算機博士點,也算是為國家發展盡一份綿薄之力。

 

剛剛成立的博士點一無所有,高文不得不帶領團隊主動籌措科研經費。無論是發展模式還是發展前景,都令他有一種“摸著石頭過河”的感覺。在他看來,探索與挫折都是理所應當,因為所有開創性的工作需要的都是:動腦子、下功夫

 

他不說一句渲染成就的話,履歷卻透露光彩:不管是科研,還是教學,都在高文的“確立目標、堅持行動、自然而然”中一點點爬坡。他也欣慰於能在對的時間回來,參與進國家計算機行業高速發展與資訊化浪潮之中,為建設科技強國培養人才、做好研究。


從無到有實現國際主流標準

 

高文研究的領域涉及人工智慧、模式識別與多媒體計算、視訊編碼與分析、計算機視覺等等。主持了20多個國家級科研專案,發表頂級學術論文200篇,上過他課的本科生不計其數,他帶過的博士也有百餘人。

 

研究成果的達成,不僅來自高文的研究興趣和努力,更來自國家發展的強烈需求,AVS就是一個典型。

 

AVS標準是《資訊科技先進音視訊編碼》系列標準的簡稱,是我國具備自主智慧財產權的第二代信源編碼系列標準,也是數字音視訊產業的共性基礎標準。通俗來講,“AVS是希望能夠把視訊編碼得比較小,進而降低傳輸、儲存成本。”

 

高文近二十多年的工作大都圍繞影象、視訊處理領域展開,AVS只是其中的一部分。2002年6月,數字音視訊編解碼技術標準(AVS)工作組成立,高文擔任組長。他的研究方向聚焦在兩個點:一是對影象、視訊的理解,二是影象壓縮、編碼。

 

AVS的產生主要源於國家的兩個需求:一是國家希望有創新的東西,二是解除一些困境。我國一直強調自主創新,沒有自己的創新產品,就只能做一些外圍的東西。技術競爭中,專利的東西佔據比較有利的產業位置。

 

AVS起步的時候,國際上,MPEG標準體系已經建立了十餘年,並得到廣泛應用。但高昂的專利收費嚴重阻礙我國相關產業的發展,國家對核心技術、自主智慧財產權的渴望越來越強烈。在這樣的背景下,2002年的“DVD專利案”,也就是第二個需求中的“困境”,成為了推動AVS產生的導火索。

 

對此,高文帶領數字視訊編解碼技術國家工程實驗室風雨兼程,在完全沒有舶來品,完全自主創新的堅持下,實現了目標。在發展過程中,AVS也遇到過一些困難,但高文帶領團隊一路堅持了下來。這樣的成果,如果沒有對做事的信仰,定然是堅持不下來的。也正是因為對創新的執著態度,AVS才等到了現在這開花結果的時刻。

 

作為中國擁有自主智慧財產權的標準,AVS對我國數字化音訊、視訊相關產業的發展無疑是個福音。AVS通過這樣的開放共贏機制,可以吸引、聯合許多單位共同參與,使得標準最終效能達到與國際標準相當的水平,成為國家必備標準。

 

AVS也是我國從“製造大國”向“創新性國家”轉變的成功範例。在技術多元化與經濟全球化的國際大背景下,AVS標準已經成為國際上三個主流標準之一,並獲得了國內外所有主流音視訊解碼晶片廠商的支援。今後新出的數字電視機和機頂盒幾乎都將內建AVS解碼功能,AVS以獨特的方式進入市場、進入家庭,進入我們的生活。


數字視網膜:應對公共安全的顛覆性技術

 

在智慧城市建設中,城市大腦是不可缺少的一個決策支援系統。它的目的,就是把所有的感測器,不管是頭像、視訊或其他方方面面聲音的,各種各樣的資料全都彙總到城市的語音系統,最後由計算得出一個結果,去驅動對應的響應。

 

640?wx_fmt=jpeg

中國工程院院士高文在CCHI 2018作題為《類腦視覺計算》的報告

 

現階段智慧城市建設的現狀是“有眼、有腦”,但作為“眼睛”的攝像頭功能過於單一使得“腦強眼弱”,其根源在於傳統監控攝像機網路所採用的技術體系是為儲存而不是分析設計的。儘管近期有些智慧攝像頭具有車牌或人臉識別功能,但是這種單純強調“邊緣計算”的方案仍然無法解決“眼腦合一”的問題。

 

高文認為,現在的系統必須進行進化和演進,必須向人學習,做人工的視覺系統。這樣使得現在單一功能的攝像頭儘快把它淘汰掉,換成多功能、多模式的攝像頭,一個攝像頭可以做編碼,還可以做識別等等。

 

人類視覺系統經過千百萬年的進化,使得我們的眼睛和大腦高效有機聯動實現視覺認知。其中,眼睛負責感知光訊號,完成視覺神經編碼,然後經過視神經網路將編碼傳導給大腦視覺野,最終形成認知。

 

儘管我們對人類系統的完整模型與工作流程的科學發現尚未最終完成,但這並不會完全影響我們對其進行功能模擬。與人類視覺系統相比,現有人工視覺系統則是由攝像頭負責採集光學訊號,轉換成數字訊號後經壓縮傳遞給計算機進行處理,包括特徵提取與識別、分析等。人類視覺系統與人工視覺系統最大的差別在於效率,包括認知效率和系統認知單位能耗比。

 

為了提高人工視覺系統的認知效率,解決目前阻礙智慧城市系統功能快速演進的難題,在對人類視覺系統演進路徑成因分析的基礎上,高文提出了借鑑人類進化了數十萬年的視覺系統之“人類視網膜同時具有影像編碼與特徵編碼功能”這一特性,研究與設計數字視網膜(digital retina),使之具有統一時間戳和精確地理位置,能同時進行高效視訊編碼和緊湊特徵表達的聯合優化,並有效支援雲端大規模監控視訊分析與快速視覺搜尋等功能。

 

具體來說,除了常規的視訊編碼以外還要做特徵編碼、組塊編碼、時空編碼。數字視網膜基於現有系統,攝像頭不需要換,只需要更換攝像頭後面的晶片,在晶片上做整合,最後就能達到這個功能。

 

整個數字視網膜實際上包含了三種核心技術:基於背景模型的場景視訊編碼、視訊特徵的緊湊表達、視訊編碼與特徵編碼的聯合優化

 

與傳統監控視訊技術體系相比,數字視網膜具有高效能、高效率、可伸縮、隱私保護、可軟體定義等幾大特點。

 

我國已明確提出“到2020年,基本實現全域覆蓋、全網共享、全時可用、全程可控的公共安全視訊監控建設聯網應用”,但是如果沒有重大技術突破,數千萬攝像頭根本無法實現“全網共享”的實時資料匯聚,更不可能實現“全時可用”的聯網分析識別,“資料大”變不成“大資料”,巨大潛在價值無法發掘。

 

數字視網膜是應對上述挑戰的一種可行的顛覆性技術發展方向。因此,高文認為應加大在數字視網膜相關基礎理論、方法與關鍵技術的研究,並佈局與推進相關標準制定、晶片與硬體實現、支撐軟體開發與軟硬體開源社群,最終目標是構築服務於智慧城市的“慧眼”,並與城市大腦一起來支撐城市的精細化運營和動態管理。


人工智慧,未來已來

 

隨著人工智慧越來越成為民間熱詞,人工智慧時代是否已經來臨也成為一個頗為流行的問題,作為人工智慧領域的行業專家,高文也總會在不同場合被問到這個話題。

 

在高文看來,“今天產業界都覺得人工智慧大風來了,趕快前進不要掉隊。但是如果你冷靜下來想想,人工智慧在研究方面還是有很多問題沒有解決。比如,人工智慧方法現在主要的不足,是機器學習的理論還很初級,很多好結果是靠大資料訓練出來的,與人舉一反三的學習能力和創造性思維相比還相差甚遠。”

 

雖然有很多不確定性,但是高文仍看好人工智慧的發展機遇。“人工智慧總體來說,不管你是否接受,不管你是否看好,這件事就要發生了。我們現在要做的是,如果這件事發生了,我們怎麼去應對它。”

 

而面對人工智慧、面對高速發展的科技帶來的不確定,高文覺得,一方面要知其所以然,另一方面也要開闊眼界,保持開放,望向未來,讓技術服務於更巨集大的人類福祉。做好眼前事,也更要著眼大目標。


本文部分內容參考自:

《大氣方能成大器——訪中國工程院院士高文》,北京大學官網,2011-12-10

《高文:行向高處》,《人民政協報》,2017年12月18日

《高文:智慧城市的最新發展——數字視網膜》

∑編輯 | Gemini

來源 | 德先生

更多精彩:

☞  哈爾莫斯:怎樣做數學研究

☞  祖克伯2017年哈佛大學畢業演講

☞  線性代數在組合數學中的應用

☞  你見過真的菲利普曲線嗎?

☞  支援向量機(SVM)的故事是這樣子的

☞  深度神經網路中的數學,對你來說會不會太難?

☞  程式設計需要知道多少數學知識?

☞  陳省身——什麼是幾何學

☞  模式識別研究的回顧與展望

☞  曲面論

☞  自然底數e的意義是什麼?

☞  如何向5歲小孩解釋什麼是支援向量機(SVM)?

☞  華裔天才數學家陶哲軒自述

☞  代數,分析,幾何與拓撲,現代數學的三大方法論

640?wx_fmt=png

演算法數學之美微信公眾號歡迎賜稿

稿件涉及數學、物理、演算法、計算機、程式設計等相關領域,經採用我們將奉上稿酬。

投稿郵箱:math_alg@163.com


相關文章