科學匠人 | 艾美工程獎背後的微軟人
編者按:“科學匠人”系列文章又和大家見面啦!揭祕“入夥”研究院的最佳途徑,講述研究院裡典型與非典型的研究員成長故事,希望可以給大家的職業選擇帶來一些啟迪。
今天我們給大家介紹的是視訊壓縮標準HEVC的“幕後英雄”——微軟亞洲研究院主管研究員許繼徵,講述他“開放”、“跨界”的研究故事。
2017年10月25日,美國電視界的最高獎項艾美獎將本年度的工程獎頒發給了一個名為“視訊編碼聯合工作組”的團隊,以表彰其在開發高效視訊編碼(HEVC)國際標準方面所取得的成就。
HEVC(High Efficiency Video Coding)也被稱作H.265,是為最新一代高解析度視訊而設計的視訊壓縮標準,有“4K 時代的解碼標準”之稱。相比上一代技術H.264,它可以使1080P視訊內容的壓縮效率提升一倍左右,這意味著傳輸的視訊內容質量更高,網路頻寬更節省。目前,這一技術標準已被全球大多數超高清電視分發系統和終端所採用。
那麼這個“視訊編碼聯合工作組”又是個什麼組織?其實,它是由來自ISO、國際電信聯盟以及國際電工委員會的專家組成,微軟、蘋果、諾基亞、高通、三星、索尼弗勞恩霍夫協會通訊技術研究所、華為、聯發科等多家企業也都是工作組的主要貢獻者。微軟亞洲研究院更是有專案組從標準制定伊始就全力支援。微軟亞洲研究院與HEVC之間有哪些不得不說的故事?還是請HEVC標準制定的“幕後英雄”、微軟亞洲研究主管研究員許繼徵來跟大家聊一聊。
1999年,許繼徵便以實習生的身份加入微軟亞洲研究院,隨後成為員工並一直工作至今,是研究院迄今為止任職時間最久的實習生入職員工。不僅如此,他對待研究也十分專一,精專於數字視訊相關的技術工作。從2003年許繼徵就開始參與部分H.264的標準制定,並且在2010年全力投入HEVC的標準制定。
隨著高解析度電視、手機、電腦等裝置的不斷湧現,視訊領域得到了蓬勃而快速的發展,這為電子公司和視訊裝置製造商提供了難得的發展機遇,也為如何打破不同視訊編碼之間的壁壘提出了挑戰。期間,視訊編碼技術標準的發展經歷了從MPEG-1、MPEG-2,到MPEG-4 Part2、 MPEG-4 Part10/H.264,再到HEVC/H.265的漫長過程。
“視訊標準是業界所有大公司都會涉及的內容,所以需要大家一起來做。”2013年1月,在視訊編碼聯合工作組的努力下,代表最前沿視訊壓縮技術水平的HEVC正式成為國際標準。“在技術研究的過程中,微軟有40多項專利技術被HEVC所採納,並且在‘螢幕視訊編碼標準’這個子專案上挑起了大梁。在和螢幕視訊編碼標準相關的6項關鍵技術中,有5項出自微軟亞洲研究院之手。”
螢幕視訊編碼框架
“所謂‘螢幕視訊編碼’其實很好理解。”許繼徵解釋道,”過去我們常講的視訊就是攝像機拍攝出來的,比如電視臺、網路視訊等節目,但其實現在有越來越多視訊並非來自傳統的攝像機拍攝,而是由機器生成的,比如電腦、手機裡的遊戲等等,它們完全不受攝像機的物理限制,可以很簡潔,也可以很複雜,而且經常是超高解析度的視訊。為了更好地對這些視訊進行編碼和解碼,專門的‘螢幕視訊編碼標準’便應運而生。”
螢幕視訊
值得一提的是,許繼徵團隊將微軟搜尋的相關技術應用到了螢幕視訊編碼中,讓視訊編碼的效率提高了上千倍。這一技術的應用源於HEVC組織方為解決螢幕視訊編碼問題而發起的一次“技術徵集”,在與微軟內部的多個團隊溝通、學習後,許繼徵借鑑了搜尋領域技術發明的基於雜湊的運動搜尋,創新性地解決了高效螢幕視訊編碼這個問題,使得HEVC在螢幕視訊編碼的速度更快、效能更好、效率更高。
經過團隊的努力,微軟的螢幕視訊編碼方案在眾多公司的編碼方案中脫穎而出,成為唯一一個比基準方案更快並且在編碼效率上遠超其它方案的方案,相關技術也成為了螢幕視訊編碼標準參考模型的原型。許繼徵自然而然地成為了HEVC螢幕視訊編碼標準的編委和標準組織裡相關技術小組的聯合主席,團隊裡的李斌研究員也擔任了參考軟體開發小組的聯合主席。在今年3月份,獨立的第三方測試驗證了HEVC螢幕視訊編碼標準在技術上的飛躍——對典型的螢幕視訊,新的標準比HEVC的基礎版本能再節省超過80%的頻寬,遠超當初標準計劃的50%的目標!
如今,HEVC技術標準已被全球大多數超高清電視分發系統和終端所採用,各類電子裝置僅用很小的頻寬或容量,就能獲得更好的視訊輸出質量。許繼徵舉例說,“現在小到機頂盒、智慧手機、電視,大到地面數字廣播系統、電視臺都採納了HEVC。”HEVC已經成為工業界影響力最大的技術之一,幾年之間就從技術標準層面,推動了整個產業的進步。隨著機器產生視訊的廣泛應用,我們也期待螢幕視訊編碼標準會成為一個更成功、應用更廣泛的標準,或許下一個艾美獎就會頒給這樣一個針對新型視訊的編碼標準。而學術方面,許繼徵團隊的一篇關於螢幕視訊編碼的文章在上週更是斬獲了Visual Communication and Image Processing會議的最佳論文獎。
![?wx_fmt=png](https://i.iter01.com/images/007a0ec6e60ba5eaa504d1b2341eeaf5d3212355651e5b0781a792384898d575.png)
通過HEVC的研究,為整個行業樹立標準,在許繼徵看來是一件特別自豪、有成就感的事情。而這種由國際標準組織牽頭,通過幾十家公司共同努力,在統一的平臺用統一的資料公開地就一個技術問題進行良性競爭,更是意義非凡 。
過去,不同的企業和研究機構或多或少都存在“閉門造車”的現象,很多研究領域非常封閉,資料、原始碼不公開等等導致了不少技術在論文中寫得高階大氣,但是很難在實際中真正地使用起來,最終成為無用的炫技。而一些領域秉承開放研究(Open Research)的理念,把資料和原始碼公開,讓更多人可以去驗證、去探索、去嘗試,這樣也更容易把技術工業化、產品化,從而促進業界能發展得更快。如今日新月異的AI領域,便是開放研究的受益者。
多年參與國際標準制定的許繼徵,對開放研究的精神頗有感觸。他說:“開放與合作並行,恰恰能夠讓研究的路越走越寬,也會更有力地促進行業以及企業自身的發展。”事實上,微軟一直都在積極擁抱開源,2016年9月的GitHub報告顯示,微軟已在這一全球最大的程式碼託管網站和開源社群上擁有16419位開源貢獻者,成為GitHub上排名第一的開源貢獻者。
2016年9月,GitHub報告顯示微軟已擁有16419位開源貢獻者
而過去幾年間,微軟亞洲研究院也釋出了不少重要的開源專案,如深度學習領域的微軟認知工具包CNTK、圖資料庫GraphView、軟體無線電專案Sora等等,研究員們對於開放研究也抱有極大的熱情。
![?wx_fmt=png](https://i.iter01.com/images/007a0ec6e60ba5eaa504d1b2341eeaf5d3212355651e5b0781a792384898d575.png)
許繼徵加入微軟亞洲研究院已有近20年時間,談起被研究院牢牢吸引的原因,他表示,微軟亞洲研究院不僅僅是一個可以通過技術影響整個工業界的廣闊平臺,而且它的研究方向涉及各個領域,對於研究人員知識面的擴充非常有利,每個人都可以和不同方向的同仁協作從事跨領域的有趣研究,嘗試各種可能性,碰撞出不一樣的火花。
就像在螢幕視訊編碼技術標準的研發中,正是基於對微軟搜尋領域技術的瞭解,才使得許繼徵能通過借鑑其原理來攻克新的技術難關。因此,他建議有志於加入微軟的朋友,“一定要對其他領域也保持好奇心。沒有人知道其它領域什麼時候會促進、激發你在本領域的研究。”
同樣,許繼徵認為研究員在某個領域擁有深厚的積累也非常重要。這種積累不僅來源於成功的專案,也可以從挫折中獲得。他坦言,在微軟亞洲研究院將近20年的工作時間中,並非每個專案都一帆風順,在技術中遇到的困難和阻礙在他看來卻都是寶貴的財富。
許繼徵(前排中間)和團隊成員
2003年,許繼徵和團隊開始研究當時業界特別看好的可伸縮視訊編碼技術,但後來由於工業界的軟硬體沒有達到可以適配的程度,與H.264標準的結構也不太相容,最後研究成果雖然也在標準徵集方案中名列頭籌,卻沒最終落地。“現在來看,這一研究成果還是有些超前了。”面對技術未能廣泛應用的失望,許繼徵看到了結果的另一面,“不過通過這個專案,我們也積累了很多經驗,包括怎樣參與這些標準化組織的工作,怎樣更有效地溝通,怎樣在組織內良性競爭等等,這些其實都為日後做好HEVC專案打下了很好的基礎。”
在微軟,許繼徵多年如一日躬耕於數字視訊標準研究這方沃土,也用這種方式最廣泛地影響著整個業界。
業餘之時,許繼徵還是一名忠實的慢跑愛好者,他說,跑步和做研究其實很像:一方面都需要持之以恆;另一方面不能急於求成——跑步著急容易傷到膝蓋,而做研究著急就會打擊自信心。做研究和慢跑都無法給你一時的快感,而需要用耐心去慢慢積累,進而取得更大的成就。
你也許還想看:
感謝你關注“微軟研究院AI頭條”,我們期待你的留言和投稿,共建交流平臺。來稿請寄:msraai@microsoft.com。
相關文章
- 手柄漂移背後的科學原理
- MIT教授Tomaso Poggio演講與專訪:智慧背後的科學與工程MIT
- 自然語言處理背後的資料科學自然語言處理資料科學
- 美國國家科學委員會:2020年科學與工程指標指標
- 美國國家科學基金會:2018年科學與工程指標報告指標
- Cortana小娜失敗背後,微軟的傲慢與偏見微軟
- 美國國家科學委員會:2022年科學與工程指標報告指標
- 開源科學工程技術軟體系列文章
- 從百度、微軟出走的AI大牛都去哪了?世界華人AI精英流向圖的背後微軟AI
- 從百度、微軟出走的AI大牛都去哪了?世界華人AI精英流向圖的背後……微軟AI
- 中國軟體出口十強企業的背後:科學的管理配合高效能的開發工具
- 2020年“科學探索獎”獲獎名單公佈 最年輕獲獎人僅30歲
- 818個人的努力《逃離塔科夫》漢化組專訪——背後的故事
- 爭議「監控」頭環背後:駐中 MIT 科學家撤回美國,重整國內市場戰略|專訪 BrainCo 創始人MITAI
- 微軟聯合創始人艾倫生平:熱愛音樂 與蓋茨爭執後離職微軟
- 《怪物獵人:世界》背後潛藏的真實生態學
- 如何打造美妝爆品——國貨美妝品牌崛起背後的數字哲學
- 淺談美顏演算法:美顏SDK的“背後”演算法
- 蘋果軟體工程師講述“安全碼自動填充”功能背後的故事蘋果軟體工程工程師
- 入侵美國空軍:60人黑客小隊拿下29萬賞金的背後黑客
- 為什麼科學需要更多的研究型軟體工程師? - nature軟體工程工程師
- PS5 DualSense 手柄 Polygon 評測:全新的美學與人體工程學Go
- 統信組建安全聯盟背後,國產作業系統不只是學微軟作業系統微軟
- HBO在艾美獎上超越了Netflix(附原資料表)
- hover 背後的數學和圖形學
- 電視學院:2022年第74屆艾美獎排名 Hulu拿到58項創紀錄
- 人臉識別背後:可怕的不是技術
- TGDC | 探索人臉藝術背後的技術
- 美國國家科學基金會:2020年全球科學與工程指標報告 中國科技實力迅速提升指標
- 業界分析:微軟收購貝塞斯達背後藏有什麼乾坤?微軟
- 盈利背後,美團渴望第二曲線
- 走進AI科學之美AI
- 京東榮獲“中國智慧科學技術最高獎”——吳文俊人工智慧科學技術獎人工智慧
- 月薪30-50K的大資料工程師們,他們背後是如何學習的大資料工程師
- 開源筆記軟體 Joplin 背後的故事筆記
- 一人身兼數職,自學程式設計美術,這款Steam好評如潮的作品背後有哪些故事?程式設計
- 探究美顏SDK產業背後的“顏值經濟”產業
- 從軟體工程師轉型到資料科學家 我是這樣走的軟體工程工程師資料科學
- 2018北京市科學技術獎勵大會隆重舉行,華勝天成榮獲科學技術獎