作為圖森未來演算法部的掌舵人,除了活躍在知乎之外,他很少在公眾面前,講述他自己的故事。為什麼選擇PhD?為什麼選擇做無人駕駛?作為圖森未來首席科學家,他工作的價值觀又是什麼?我們一起聽聽這個大男孩,自己說。
前10年:保送浙大、港科大直博、百度IDL、CMU
這個標題開的很大,頗有“你的同齡人正在甩開你“的味道。但其實你會發現,他並沒有”甩開“誰,只是比普通人更”幸運“,更早一步找到了自己的興趣所在。可就像蝴蝶效應一般,這從來不是什麼偶然事件。
雖然的確在大一的時候,他並沒有想好到底要做什麼。這樣的”沒有想好“在現在看來,其實都是那個年紀自帶的屬性。本科透過計算機競賽被保送進浙江大學的他,一開始就很明確計算機這個方向,也就自然而然將本科前兩年的時間,放在了ACM競賽上,直到拿到當年的亞洲區域賽金牌後,競賽這件事對他來說,才算告一段落。
正式接觸機器學習,源於他自己的一個愛好。乃巖喜歡攝影,他說自己是一個生活的記錄者,喜歡用拍照的方式,來記錄平凡的生活,並以不同的視角來觀察這些平凡。不過,俗話說攝影窮三代,單反毀一生。一開始預算有限的他,買不起昂貴的相機,就開始研究怎麼利用所學壓榨出硬體的最後一份潛力。很快,乃巖就發現當時最先進最流行的數字影像處理技術叫稀疏表示,這也是後來機器學習中的一個分支。正是這份源於興趣的原動力,冥冥之中將他推向了機器學習。而真正引他入門的,便是後來對他影響很深的導師,張志華教授。
張志華教授那年剛從UC Berkeley回國,一直從事機器學習和其在資料探勘、計算機視覺中的應用。回國之後,張志華教授在浙江大學開設了一門數值分析課,從沒有系統性接觸過機器學習的乃巖,帶著好奇,去選聽了張教授的課。他或許也不知道,命運在那天,就埋下了種子。
那節課之後,乃巖對資料分析產生了濃厚的興趣,張教授在機器學習方向的建樹,也讓乃巖對這片未知的領域,更加著迷。現在,他也常常用張志華教授的話來告誡所有新人:讀博應該是源於自己對未知問題的興趣,而絕不是迫於家庭期望或逃避工作進入社會的現實。讀博是興趣與好奇心的perfect match.
因為假使沒有興趣作自我驅動,讀博的這段經歷,將會非常痛苦。幸運的人,靠的不光是天賦,所以幸運才選擇了他。
本科畢業之後,他順利申請到香港科技大學電腦科學與工程專業的直博機會。並在博士三年級,就完成了4篇計算機視覺頂會的一作論文。乃巖當時的博導楊瓞仁(Dit-Yan Yeung)教授,在研究上一直強調論文topic的重要性,並且也會給予學生充分的自由去尋找自己感興趣的topic。
如此一來,乃巖在博士前兩年,接觸了很多看似和現在不相干的工作。但恰恰是這些不相干,拓寬了他的視野。他做過資料探勘的推薦系統、也嘗試過Bayes圖模型的研究,雖然並不深入,但這些嘗試在後來的科研過程中,都起到了很大的幫助。最直接的影響便是他的畢業論文。
一次無意中,他看到一篇關於稀疏表示在目標追蹤工作相關的文章,可乃巖覺得這篇文章中的工作並沒有做透,很多關鍵的本質原因並沒有解釋清楚。而他之前在Bayes圖模型上的研究經歷,恰好可以給予一個不同的視角來解決這篇工作中的不足。於是他在博二下學期,基於他發現的問題,開始了研究。最後將把Bayes矩陣分解運用到了目標追蹤上來。就像開枝散葉一般,乃巖在目標追蹤領域的研究逐漸更深入,論文的產出也自然變成了水到渠成的事情。
他說他相信,播下去的種子,早晚會開花。
另一邊,Dit-Yan Yeung教授還非常鼓勵乃巖儘量出去看看外面的世界,而不是一直呆在學校這個象牙塔裡。所以在博士階段的最後一年,他去百度IDL實習,又到CMU交流訪問。他說讀博的4年間,最後的兩段經歷,帶給他的觸動才是顛覆性的。
在IDL實習期間,他參加了ImageNet發起的挑戰賽ILSVRC,這項比賽的目的在於,在給定的資料集上,評估參賽者在幾項視覺識別挑戰任務中,其演算法的準確性。
ImageNet在學界被稱為深度學習熱潮的關鍵推動者之一,它最早源於2009年,由史丹佛大學電腦科學系教授李飛飛,在CVPR2009的一篇論文中提出的大規模資料集專案。也是挑戰賽ILSVRC的開端。2012年,深度學習第一次在ImageNet比賽中展現了遠超傳統方法的實力,這樣深度學習才漸漸走入主流計算機視覺研究的視野。正因為這場比賽,眾多 ImageNet 挑戰賽的參與者發展成了創業公司,這其中包括後來被Google收購的DNN Research。
兩年後,乃巖和他當時在IDL實習期間的夥伴參加了這項比賽,並獲得了不錯的成績。這是他第一次真正深入接觸到做計算機視覺技術的人的想法中。原來思考問題的方式可以如此不同,評判工作好與不好的角度也跟在實驗室裡完全不一樣。
同樣地,在CMU的半年訪問,又在他科研的道路上,留下了厚重的一筆。後來他在他的博士總結裡這樣說道,CMU的每個老師想的是怎樣做有影響力的研究,怎樣做十年、二十年後還會讓人記得的研究,而並不是非理性地去追求頂會論文的接收數量。
在他親身體會到如此純粹的科研態度、接觸到工業界真正做計算機視覺人的想法之後,至此,他的科研道路才正式開啟。
首席科學家:不畏懼做No One
對科研的純粹,讓乃巖認識了擁有同樣對未知領域具有敬畏之心並且想要用科學技術解決實際問題的侯曉迪。侯曉迪,圖森未來CTO,博士畢業於加州理工大學計算與神經系統專業。
和曉迪的認識,源於人人網。乃巖在人人網上看到當時曉迪的工作,覺得很感興趣,兩人就聊了起來。直到現在回想起來,乃巖說只有用“冥冥之中註定”來形容他們的創業過程,因為真的太神奇了。一個大家都感興趣的研究領域、幾個想法一致的夥伴,在“公司”這個實體還並不存在的時候,他們就開始了創業。
所以當問到他為什麼要創業的時候,乃巖說他沒有考慮太多,“我只是想發揮我的能力和特長,做的開心就好”。
但是一開始,團隊必須要經歷一個No One的過程。解決問題本來就是這個團隊的初衷,也是他們一直以來信奉的工作態度。沒有人知道他們,那就想辦法讓別人知道。2016年初,從沒有做過檢測分割任務的乃巖,帶領幾個實習生和北美同事一起,在當時國際上最大的自動駕駛場景下的計算機視覺演算法評測資料集KITTI和計算機視覺語義分割資料集Cityscapes上打破十項無人駕駛領域世界紀錄。
這些成績對於別人來說意味著什麼,我們無從而知。而對於乃巖來說,最大的意義並不是在技術上積累了多少,而是從那個時間點開始,他對所有未知都不再畏懼。“任何事情只要我們想去做,我們一定可以做成”。
自動駕駛行業本身就是會遇到很多新的問題,這和做科研很像。每天都要不停去學習新的知識來解決新的問題。很多人把我們做的事情比作是登月,乃巖卻有他自己的看法“Apollo登月計劃,成功了6次就名垂千古,但是對於自動駕駛來說,我們要保證10000次裡也不能失敗一次。從這個角度來說,自動駕駛是比登月更有挑戰的事情。所以這個事情做好了,我們真的是可以被歷史記住的。”
用正確的方法做正確的事
受博士期間實習和交流訪問經歷的影響,讓乃巖看到一個好的實習或是工作的地方,帶給人的影響是非常大的。不論是當年和他一起實習的同僚,還是當年的mentor,現在都已成為各大明星AI公司中,獨當一面的負責人了。所以到現在,當他的角色反轉,變成一個mentor的時候,他也希望每一個在圖森未來實習或者工作的同學,都能有自己的收穫。“我們希望大家是雙贏的狀態”。
所以乃巖一直在他的團隊,推行1對1的導師制度。通常,他和團隊會給新人一個2-3個值得去做的topic,大家在討論之後,選擇最終的topic進行工作。在這裡,最優秀的實習生曾經用1年半的實習時間,發了4篇論文。而平均來看,每一位在這裡實習過一年的同學,都會有至少一篇科研論文的產出。乃巖說這是一個很自然的過程,“如果一直在正確的方向努力,產出是必然的,我也希望離開圖森的同學,在5年10年之後,回過頭來看,也會像我感激MSRA和IDL一樣,感激在圖森的經歷”。
正因如此,為了給所有在圖森未來實習或者工作的同學,創造一個正如當年IDL或者CMU那樣的環境,面試的篩選門檻自然也很高。“我不會創造一個平庸的環境,大家應該一起為公司的成長負責。”乃巖如是說。
除了竭盡全力創造一個好的科研環境,他最大的職責在於確保團隊的行進方向是正確的。避免浪費時間最關鍵的步驟是,決定什麼事情不做。選擇最有價值和前途的事情遠比做事情本身更重要。如果一個技術花了3個月做完發現沒有用,他說他會覺得很自責。“我最大的責任是幫助大家減少戰略上的愚蠢,我不喜歡用所謂hard working去彌補內心的不安,盲目努力是沒意義的”。
如何減少戰略上的愚蠢?要做到這件事,就不得不提到Research taste這個詞。這個詞,是他讀完《禪與摩托車維修藝術》這本書之後總結的。(傳送門:https://zhuanlan.zhihu.com/p/86026116)乃巖認為,taste代表的就是一個人對於自己關心的某個領域最頂層的認知以及發展趨勢,它完全貫穿於一個好的研究者的工作中。他們往往都是用最簡單的方法解決最本質的問題,沒有刻意的包裝。作為一個公司的首席科學家,他希望帶給團隊的,也正是這樣的訊息:提出正確的問題,用正確的方法解決問題。
而盲目努力,這裡大可理解成一些看似很辛苦,實際沒有任何產出的996。乃巖自己是一個work life balance的工作者,除了工作,他還是一個骨灰級滑雪愛好者,更對飛行展現出極大的興致。經常可以看他在朋友圈po滑雪或者飛行的照片,就會好奇科學家為什麼會有時間做這些,還都做得非常不錯。乃巖的解釋是,如果用正確的方法去做了正確的事情,自然可以減少無謂的加班,去成就自己的其他愛好。
乃巖負責的演算法組,團隊年齡平均25歲。這一代職場人擁有和父輩非常不同的成長經歷,所以他們對於自己的工作會更有想法,更聰明,也更直接。面對“自己是如何管理好這樣年輕的團隊”的問題時,乃巖沒有思考太久,就說了兩個字:信任。
"人多了之後,每個人都會有自己想做的事情,但是我會確保讓大家在目標一致的情況下,給予他們充分的自由,這也是我博士老闆Dit-Yan Yeung教會我的”他補充道。乃巖非常重視職場中“人”的因素,所以在人才選拔上他坦言自己更偏好於年輕人,因為他們更加“think out of box”。
CV崗位過熱了嗎?
最後,引用知乎上這個熱議的問題,作為這篇的結尾。
競爭的激烈難免帶來焦慮,這些焦慮,有來自外界的,也有來自同齡人的。乃巖也說自己會在一些特定時期感到焦慮,他說只有當自己看不清楚問題的本質時,才會感到焦慮,但是即便這樣,這個過程也不會持續太久。因為這些問題最後都會被分解成:
1.問題是什麼?
2.問題涉及到的範圍是什麼?
3.它的輸入輸出是什麼?
4.如何建立評價標準
5.解決問題
乍一聽起來,可能有點一頭霧水。乃巖說這就是做博士研究的步驟,同時也是做任何事的方法論。解決問題是所有環節的最後一步,真正重要的是定義清楚第一步。
那麼,我們再回頭看看這個問題。CV崗位過熱這個問題的本質是什麼呢?我們更願意這樣定義這個問題:能夠幫助公司業務產生價值的人,還是非常稀缺。
為什麼這麼說?
The Hype Cycle早就將這個過程定義的非常清晰,任何事物的發展都會經歷從誕生、過熱、泡沫、重來、實際產生價值的5個不同階段。所以的確,現在CV這個領域的賽道看似已經擁擠不堪,但真正那些可以最終給公司帶來價值人,卻鳳毛麟角。
如此,這個問題的答案就非常明朗了。
對於普通人來說,是,的確存在盲目湧入賽道的現象;
而對於金字塔頂尖人才來說,則贏者通吃。
那麼,如何從容不迫地去面對來自外在環境的壓力?乃巖用洋蔥打了一個比方。最核心的是修煉自己的內功,就像是洋蔥的最裡面,這裡麵包含了一些基本的素質,例如好奇心、自驅力、分析和邏輯能力;中間一層則是針對問題的一些基礎,例如對於資料的敏感度,Coding和數理的基礎等等,所謂行業應用,像是人臉識別、自動駕駛等等,才是最外層的。無論外部的應用如何改變,核心的基礎才是最值得花時間去攻克和討論的。
所以,或許所有正在擔憂CV崗位是否過熱的人都可以這麼問問自己的內心,現在自己在什麼位置,以及自己即將或者可以到什麼位置。修煉自己的內功,才是以不變應萬變的重中之重。畢竟,我們有理由相信,播下的種子,早晚都會開花。
雖然我們的校招行程已經全部結束,但是招聘還一直進行中。乃巖從面試官的角度,也給了一些建議。除了紮實的背景知識和程式碼能力之外,以下也是我們的考察重點:
A.presentation的能力。這是很多學生最容易忽視的一點,而恰巧也是面試過程中,非常重要的一點。如何將自己的research透過一個更容易讓人信服的形式展現出來。這其中包括了如何展現清晰的思考邏輯,如何分配詳略和重點,如何運用語言等等。在之前的面試過程中,經常有候選人一上來就說“用了XXX網路”,而忽略了對前因後果有條理的表述,這是很減分的。這也是一個需要長期培養的能力,也希望大家儘早準備。
B. 面試者應該儘量保持開放的心態,不要過於defensive。通常我們在面試環節,會循序漸進安排3-4個比較有挑戰的問題,以此來發現候選人在過去的工作中是否有一些不足的地方。這個時候,如果可以大方承認工作中的不足,可以接受面試官的質疑,這點我是比較欣賞的。
C. 主觀能動性。這一點的考察,主要是看候選人在面對不會的問題時,是否有積極的思考,而不是遇到不會的問題就直接放棄,哪怕回答不完全正確都沒有問題。我會在面試過程中,給面試者提升和引導,面試的過程是一個互動的工作,我希望面試者不是機械性地回答問題。
以上,就是這一期的全部內容,祝願大家都能在校招季,收穫自己的dream offer啦!