科學匠人 | 艾美工程獎背後的微軟人

微軟研究院AI頭條發表於2017-12-21

mmbizgif?wxfrom=5&wx_lazy=1


編者按:“科學匠人”系列文章又和大家見面啦!揭祕“入夥”研究院的最佳途徑,講述研究院裡典型與非典型的研究員成長故事,希望可以給大家的職業選擇帶來一些啟迪。


今天我們給大家介紹的是視訊壓縮標準HEVC的“幕後英雄”——微軟亞洲研究院主管研究員許繼徵,講述他“開放”、“跨界”的研究故事。


2017年10月25日,美國電視界的最高獎項艾美獎將本年度的工程獎頒發給了一個名為“視訊編碼聯合工作組”的團隊,以表彰其在開發高效視訊編碼(HEVC)國際標準方面所取得的成就。


HEVC(High Efficiency Video Coding)也被稱作H.265,是為最新一代高解析度視訊而設計的視訊壓縮標準,有“4K 時代的解碼標準”之稱。相比上一代技術H.264,它可以使1080P視訊內容的壓縮效率提升一倍左右,這意味著傳輸的視訊內容質量更高,網路頻寬更節省。目前,這一技術標準已被全球大多數超高清電視分發系統和終端所採用。


那麼這個“視訊編碼聯合工作組”又是個什麼組織?其實,它是由來自ISO、國際電信聯盟以及國際電工委員會的專家組成,微軟、蘋果、諾基亞、高通、三星、索尼弗勞恩霍夫協會通訊技術研究所、華為、聯發科等多家企業也都是工作組的主要貢獻者。微軟亞洲研究院更是有專案組從標準制定伊始就全力支援。微軟亞洲研究院與HEVC之間有哪些不得不說的故事?還是請HEVC標準制定的“幕後英雄”、微軟亞洲研究主管研究員許繼徵來跟大家聊一聊。


640?wx_fmt=png&wxfrom=5&wx_lazy=1


們在微軟做研究,讓你的視訊體驗更流暢

1999年,許繼徵便以實習生的身份加入微軟亞洲研究院,隨後成為員工並一直工作至今,是研究院迄今為止任職時間最久的實習生入職員工。不僅如此,他對待研究也十分專一,精專於數字視訊相關的技術工作。從2003年許繼徵就開始參與部分H.264的標準制定,並且在2010年全力投入HEVC的標準制定。


隨著高解析度電視、手機、電腦等裝置的不斷湧現,視訊領域得到了蓬勃而快速的發展,這為電子公司和視訊裝置製造商提供了難得的發展機遇,也為如何打破不同視訊編碼之間的壁壘提出了挑戰。期間,視訊編碼技術標準的發展經歷了從MPEG-1、MPEG-2,到MPEG-4 Part2、 MPEG-4 Part10/H.264,再到HEVC/H.265的漫長過程。


“視訊標準是業界所有大公司都會涉及的內容,所以需要大家一起來做。”2013年1月,在視訊編碼聯合工作組的努力下,代表最前沿視訊壓縮技術水平的HEVC正式成為國際標準。“在技術研究的過程中,微軟有40多項專利技術被HEVC所採納,並且在‘螢幕視訊編碼標準’這個子專案上挑起了大梁。在和螢幕視訊編碼標準相關的6項關鍵技術中,有5項出自微軟亞洲研究院之手

0?wx_fmt=png

螢幕視訊編碼框架


“所謂‘螢幕視訊編碼’其實很好理解。”許繼徵解釋道,”過去我們常講的視訊就是攝像機拍攝出來的,比如電視臺、網路視訊等節目,但其實現在有越來越多視訊並非來自傳統的攝像機拍攝,而是由機器生成的,比如電腦、手機裡的遊戲等等,它們完全不受攝像機的物理限制,可以很簡潔,也可以很複雜,而且經常是超高解析度的視訊。為了更好地對這些視訊進行編碼和解碼,專門的‘螢幕視訊編碼標準’便應運而生。”


螢幕視訊


值得一提的是,許繼徵團隊將微軟搜尋的相關技術應用到了螢幕視訊編碼中,讓視訊編碼的效率提高了上千倍。這一技術的應用源於HEVC組織方為解決螢幕視訊編碼問題而發起的一次“技術徵集”,在與微軟內部的多個團隊溝通、學習後,許繼徵借鑑了搜尋領域技術發明的基於雜湊的運動搜尋,創新性地解決了高效螢幕視訊編碼這個問題,使得HEVC在螢幕視訊編碼的速度更快、效能更好、效率更高。


經過團隊的努力,微軟的螢幕視訊編碼方案在眾多公司的編碼方案中脫穎而出,成為唯一一個比基準方案更快並且在編碼效率上遠超其它方案的方案,相關技術也成為了螢幕視訊編碼標準參考模型的原型。許繼徵自然而然地成為了HEVC螢幕視訊編碼標準的編委和標準組織裡相關技術小組的聯合主席,團隊裡的李斌研究員也擔任了參考軟體開發小組的聯合主席。在今年3月份,獨立的第三方測試驗證了HEVC螢幕視訊編碼標準在技術上的飛躍——對典型的螢幕視訊,新的標準比HEVC的基礎版本能再節省超過80%的頻寬,遠超當初標準計劃的50%的目標


如今,HEVC技術標準已被全球大多數超高清電視分發系統和終端所採用,各類電子裝置僅用很小的頻寬或容量,就能獲得更好的視訊輸出質量。許繼徵舉例說,“現在小到機頂盒、智慧手機、電視,大到地面數字廣播系統、電視臺都採納了HEVC。”HEVC已經成為工業界影響力最大的技術之一,幾年之間就從技術標準層面,推動了整個產業的進步。隨著機器產生視訊的廣泛應用,我們也期待螢幕視訊編碼標準會成為一個更成功、應用更廣泛的標準,或許下一個艾美獎就會頒給這樣一個針對新型視訊的編碼標準。而學術方面,許繼徵團隊的一篇關於螢幕視訊編碼的文章在上週更是斬獲了Visual Communication and Image Processing會議的最佳論文獎


0?wx_fmt=jpeg


?wx_fmt=png


Open Research讓研究的路越走越寬

通過HEVC的研究,為整個行業樹立標準,在許繼徵看來是一件特別自豪、有成就感的事情。而這種由國際標準組織牽頭,通過幾十家公司共同努力,在統一的平臺用統一的資料公開地就一個技術問題進行良性競爭,更是意義非凡 。


過去,不同的企業和研究機構或多或少都存在“閉門造車”的現象,很多研究領域非常封閉,資料、原始碼不公開等等導致了不少技術在論文中寫得高階大氣,但是很難在實際中真正地使用起來,最終成為無用的炫技。而一些領域秉承開放研究(Open Research)的理念,把資料和原始碼公開,讓更多人可以去驗證、去探索、去嘗試,這樣也更容易把技術工業化、產品化,從而促進業界能發展得更快。如今日新月異的AI領域,便是開放研究的受益者。


多年參與國際標準制定的許繼徵,對開放研究的精神頗有感觸。他說:“開放與合作並行,恰恰能夠讓研究的路越走越寬,也會更有力地促進行業以及企業自身的發展。”事實上,微軟一直都在積極擁抱開源,2016年9月的GitHub報告顯示,微軟已在這一全球最大的程式碼託管網站和開源社群上擁有16419位開源貢獻者,成為GitHub上排名第一的開源貢獻者。


0?wx_fmt=png

2016年9月,GitHub報告顯示微軟已擁有16419位開源貢獻者


而過去幾年間,微軟亞洲研究院也釋出了不少重要的開源專案,如深度學習領域的微軟認知工具包CNTK圖資料庫GraphView軟體無線電專案Sora等等,研究員們對於開放研究也抱有極大的熱情。


?wx_fmt=png


跨界,多積累,所有經歷都是財富


許繼徵加入微軟亞洲研究院已有近20年時間,談起被研究院牢牢吸引的原因,他表示,微軟亞洲研究院不僅僅是一個可以通過技術影響整個工業界的廣闊平臺,而且它的研究方向涉及各個領域,對於研究人員知識面的擴充非常有利,每個人都可以和不同方向的同仁協作從事跨領域的有趣研究,嘗試各種可能性,碰撞出不一樣的火花


就像在螢幕視訊編碼技術標準的研發中,正是基於對微軟搜尋領域技術的瞭解,才使得許繼徵能通過借鑑其原理來攻克新的技術難關。因此,他建議有志於加入微軟的朋友,“一定要對其他領域也保持好奇心。沒有人知道其它領域什麼時候會促進、激發你在本領域的研究。”


同樣,許繼徵認為研究員在某個領域擁有深厚的積累也非常重要。這種積累不僅來源於成功的專案,也可以從挫折中獲得。他坦言,在微軟亞洲研究院將近20年的工作時間中,並非每個專案都一帆風順,在技術中遇到的困難和阻礙在他看來卻都是寶貴的財富


0?wx_fmt=jpeg

許繼徵(前排中間)和團隊成員


2003年,許繼徵和團隊開始研究當時業界特別看好的可伸縮視訊編碼技術,但後來由於工業界的軟硬體沒有達到可以適配的程度,與H.264標準的結構也不太相容,最後研究成果雖然也在標準徵集方案中名列頭籌,卻沒最終落地。“現在來看,這一研究成果還是有些超前了。”面對技術未能廣泛應用的失望,許繼徵看到了結果的另一面,“不過通過這個專案,我們也積累了很多經驗,包括怎樣參與這些標準化組織的工作,怎樣更有效地溝通,怎樣在組織內良性競爭等等,這些其實都為日後做好HEVC專案打下了很好的基礎。”


在微軟,許繼徵多年如一日躬耕於數字視訊標準研究這方沃土,也用這種方式最廣泛地影響著整個業界。


業餘之時,許繼徵還是一名忠實的慢跑愛好者,他說,跑步和做研究其實很像:一方面都需要持之以恆;另一方面不能急於求成——跑步著急容易傷到膝蓋,而做研究著急就會打擊自信心。做研究和慢跑都無法給你一時的快感,而需要用耐心去慢慢積累,進而取得更大的成就。



你也許還想


 科學匠人 | 純然卓然,不忘芸生

 科學匠人 | 四力合一,獨立思考是研究的“祕密武器”

 科學匠人 | 看微軟亞洲研究院如何識人、用人、育人


640.png?

感謝你關注“微軟研究院AI頭條”,我們期待你的留言和投稿,共建交流平臺。來稿請寄:msraai@microsoft.com。


640.jpeg?




相關文章