在完成 RoboMaster 2018 總決賽和參與 Mavic 2 釋出會後,我離開了在大疆創新的崗位,8 月 27 日開始在卡內基梅隆大學的機器人學院攻讀機械工程和機器人學的博士學位。
讀博士這件事,想法一直都有。2015 年碩士畢業前去西雅圖參加 ICRA2015,順路跟著導師李澤湘到他年輕時的好基友沈向洋先生家做客。導師站在沈向洋先生的豪宅前開玩笑地說:「看一下以後奮鬥的目標。」而逛了一圈,我印象最深的是他書房裡最顯眼的位置掛著的博士學位證書。Doctor of Philosophy in Robotics,這是這位人生贏家最讓我羨慕的地方。2016 年,帶領大疆的智慧導航團隊保障 Phantom 4 順利釋出以後,我覺得我已經清楚瞭解了多旋翼的控制和智慧導航相關的技術,這個領域不再有開創性的研究問題需要被探索了,我就有了去讀博士的想法,找一些更有挑戰性的機器人學問題去探索。2016 年中我開始做大疆創新在我心中最牛逼最激動人心的新專案——RoboMaster,為此把讀博士的夢想耽擱了兩年。2018 年終於是個好時機讓我開啟人生的下一階段了。
這是一個非常瘋狂的想法,但是我能夠感受到內心的召喚,願意為此突破一些障礙。比如後來每次有人和我談起沈向洋作為華人圈最成功的高管的種種事蹟的時候,我首先想到的總是我站在他的博士學位證書前感受到的羨慕和嚮往。比如在刷朋友圈的時候看到科技新聞,相比起成功融資、成功上市的企業家的新聞,我還是從心底更佩服那些在科研工作上做出成果的科學家的新聞。尤其是現在這個時代,機器人學的未來該何去何從,尚未有定論,亟待科學家們的探索,這是需要探索和夢想的年代。雖然我在公司裡有一些進展順利的專案,但是科學上的挑戰不多,而且公司裡面專心科研的機會非常少,還是要回到學術機構才能比較高效專心地展開工作。
另外在大疆的樹蔭下待久了,容易滋生自己很牛逼的心態。因為導師和大疆的成功,我也狐假虎威地跟著老闆們接觸了一些以前只在新聞上看過的名人,也接待了很多學術界和工業界的傳奇人物來參訪大疆。但是這都不是我自己的能力所能達到的,我想靠自己的科研學術能力去讓別人認可我。很多人年輕時都懷抱著改變世界的理想,我比較幸運的是已經和一些很厲害的人蔘與了一件改變世界的事情,因此對這個理想早已釋懷。比起改變世界來說,做好自己更難。
2016 年底抱著試一試的心態我開始了第一次申請。由於 RoboMaster 和公司其他專案繁重,我沒考 TOEFL 和 GRE,只改了改簡歷、寫了寫文書申請了加州大學伯克利分校(加州大學伯克利分校可以不需要提交 TOEFL 和 GRE 成績)。因為我的研究生導師在加州大學伯克利分校有很強的影響力,所以 2017 年 2 月我拿到錄取通知,可以在 17 年秋季入學。
和大疆的同事以及妻子商量以後,覺得 17 年不是一個去讀博士的好時機,他們都以為我 16 年只是隨便申申,所以並沒有準備好。我的工作交接不出去給別人,老婆也沒做好跟我一起去美國的準備。所以我和伯克利溝通了一下之後,把 offer 推遲到了 18 年再入學。
在拿到伯克利的錄取前後,我也受邀到卡內基梅隆大學的機器人學院介紹大疆的無人機技術和 RoboMaster 這個機器人教育專案。所以 2017 年的 3 月,我首先在卡內基梅隆大學機器人學院做了一次 seminar,然後去加州大學伯克利分校參加給博士學生組織的校園開放日。
兩個地方給我的感覺是截然不同的。3 月的加州伯克利陽光溫暖和煦,四處充滿著生機,加州大學伯克利分校作為世界科技中心的主要學術機構之一,人們都在興奮地討論人工智慧、自動駕駛和區塊鏈;而 3 月的賓州匹茲堡冷風刺骨,街道透出衰敗的氣息,卡內基梅隆大學作為鏽帶區復興的唯一希望,人們顯得更加謹小慎微。雖然有不少科技公司在匹茲堡開設分支辦公室,但大部分卡內基梅隆大學的學生都會在畢業之後去矽谷,而加州大學伯克利分校的學生們已經在宇宙中心了,我想這讓他們的學術科研以及生活的方方面面都有不同的思考。
兩相比較下來,我發現我更想去卡內基梅隆大學讀博士。
卡內基梅隆大學機器人學院的很多教授和學生非常熱情地歡迎了我。他們知道我是做什麼的,我在大疆的工作已經幫助到了很多機器人學院的人,甚至有人知道 DJI SDK 是我主導並架構的專案。在機器人學院負有盛名的 Field Robotics Center,遍地都是大疆 M100 和 M600 飛行器,至少三個科研和創業專案以大疆飛行器為核心。一個機器人學院的學生驕傲地給我展示了他的工作,他在 M100 上增加了鐳射雷達,通過呼叫 DJI SDK 中控制飛行器的 API,實現自動橋樑巡檢,他說奧巴馬離任總統之前來卡內基梅隆參觀的時候也看過他的專案。在機器人學院的官網上,一臺由 M100 改造的空中機器人和很多其他卡內基梅隆造出來的著名機器人被展示在了一起。
而在另一邊的加州大學伯克利分校,人們對我的態度不慍不火,很少有人聽說過大疆這家公司。拋開多旋翼飛行器不說,我參觀了很多伯克利的實驗室,但是沒有看到什麼特別令人驚奇的機器人專案。
他人的態度不應該作為做出選擇的依據,既然我決定離開國內的人脈圈和大疆優越的環境去讀博士,就應該做好從零開始的心理準備。我這樣說,只是結合我的觀察和感受,思考了這樣一個問題:兩個地方人的態度,反映了他們思維方式和做事方式的不同。
加州大學伯克利分校的計算機專業和卡內基梅隆大學的計算機專業都很強,不分伯仲。兩個學校的計算機專業對自己學校機器人方向的研究卻有著不同的影響。在我看來,伯克利的計算機專業和矽谷周圍偏軟體網際網路的環境吸收走了資源,一些本可以研究機器人的優秀人才都去做純軟體方面的科研工作了,工作的目的多半也是為了到矽谷創業。電腦科學非常契合人們對個人英雄主義的追求,一個人單槍匹馬發明了一個演算法或者一個軟體工具解決了一個重要的電腦科學問題、開辦了一家公司,這是非常常見的,而且很容易受到媒體和社會的關注。在伯克利參加校園開放日的時候,有一個 session 是教授們輪流上臺講自己的 research 來吸引學生,好幾個教授在介紹的過程中都會說啊你看我這個工作已經創了業融了資,或者說啊我這個工作雖然充滿了蛋疼的數學但也是能創業的……
和電腦科學領域的研究不同,機器人是綜合性學科,不能用電腦科學領域的思路去研究,鮮有人能單槍匹馬做一個機器人出來,大家必須一起合作。後來沈向洋在他的一篇文章裡也談到了這一點:
…… 麻省理工大學每個人都是一頭虎,而卡內基梅隆大學出來的都是一群狼。我們很少單打獨鬥,都是一個團隊一起做一個大專案,卡內基梅隆大學最出名的都是大專案。所以卡內基梅隆大學成功的地方是培養了很多大的 IT 公司 CTO 級別的人物,很多學生在工業界更加成功。
做大專案就意味著成果不那麼容易出,而且大家需要花很多時間進行工作的討論和同步。另外機器人相關的大專案一定需要工程師和科學家的協作,由工程師製作基本的機器人平臺,機器人科學家在上面進行科研探索。卡內基梅隆大學有非常完善的工程師和科學家協作的制度,甚至進行教學工作的教授就分研究型和工程型兩類。機器人學院雖然架構在計算機學院下面,但是計算機學院並沒有非常強勢地把控機器人學院的研究方向,機器人學院在人類做機器人的歷史上功名赫赫,能夠持續地吸引優秀的人才。更重要的是,機器人學院跨學科交叉的制度吸收了很多 ECE 和 meche 的學生一起進行科研。
因為卡內基梅隆大學的協作制度和做大專案的能力,他們和工業界的聯絡非常緊密。他們能很快把握工業界的動向,很快地把一些工業界的產品用到科研當中,比如大疆的 Matrice 飛行器。而加州大學伯克利分校則沒有這樣的協作機制,機器人專案也基本僅由最強勢的 EECS 專業把控,很少能組織起背景豐富的交叉型團隊。
這麼說並沒有輕看伯克利的意思,相反我相信伯克利可以讓精英更精英。我只是認為,機器人是狼群做的事情。獨立去做研究的話,和辛湜、賈揚清這樣優秀的伯克利學生比起來,我在工業界淺嘗輒止的背景和程式設計能力,更像一匹狼,在伯克利應該是很難做出什麼成績的。所以我想再申請一次,去卡內基梅隆大學。
另外,一些和學術不相關的東西也影響著我。匹茲堡作為上世紀美國工業重鎮的歷史總是讓我時不時聯絡起我的家鄉——中國的工業老城山西太原。太原和匹茲堡一樣在國家發展的過程中有重要的地位;一樣是受益於煤炭和鋼鐵;一樣也在國家發展進入新階段以後城市的發展出現了停滯。我能在匹茲堡的街道上嗅出一些在太原街上也有的氣息,讓我感覺很熟悉。
4 月份我回太原的家裡探親,整理小時候看過的百科全書時隨手翻了翻,在某一頁赫然看到一個機器人被註明是卡耐基梅隆大學的機器人學院所研發。我這才驚訝地發覺,雖然現在完全不記得,但是可能十幾年前當我立志想做一個科學家的時候,曾經被機器人學院所激勵過。
2017 年 4 月 11 日,王小波逝世 20 週年。我買了張佳瑋非常推崇的《萬壽寺》來看,又從前言裡瞭解到,王小波曾在匹茲堡大學陪他的妻子讀書,他當時的好朋友、也在匹茲堡大學學習的丁學良後來成為了香港科技大學的社會科學教授,我在香港科技大學讀書的時候也聽過丁學良教授的課。想必匹茲堡這個地方深深影響了他們寫作的方式和對世界的看法。
作為一個懷念並堅持童年理想的人,一個喜歡歷史、社科和文學的人,很容易被這些冥冥之中的聯絡牽引起來。大家都想去矽谷,但我很想在匹茲堡這個地方多待一待,看看機器人產業如何讓這個老城復興。
2017 年 6 月,在參加完 ICRA2017 之後,我寫了這篇文章《未來的機器人未來》。其實有些讀者應該很明顯地看出我在這篇文章裡表達的個人傾向了。如果去伯克利的話,多半是會按照深度神經網路和增強學習的方法去做一些東西,但是我更想跟隨傳統的路線。17 年的申請季,我重新申請了卡內基梅隆大學。
在寫《未來的機器人未來》前後,我也一直在瞭解深度神經網路和增強學習,一方面是瞭解這個研究領域,一方面也為 2018 年舉辦 RoboMaster AI 挑戰賽做準備。在《RoboMaster AI 挑戰賽科研思路淺談》這篇文章裡我講了一些自己的思路和想法,遺憾的是,半年過去,我、我的 RoboMaster 團隊、RoboMaster AI 挑戰賽的參賽學生,都沒有實現出增強學習控制的機器人。我自己做深度增強學習,有一種說不清道不明的失敗感:演算法非常難收斂、variance 很大、極其 sensitive,隨便改個引數結果會大相徑庭、修改引數沒有什麼理論依據。最近有一篇文章《呵,我復現一篇深度強化學習論文容易嗎》,很好地描述了復現一些深度增強學習的痛苦之處。讓我感到特別不適的是,機器人系統的精髓——能量的轉化和系統的建模——在深度增強學習裡毫無用處。機器人上電和磁轉化為動能、力帶來的運動對外產生力,我們面對的是一個複雜但是一切可知的系統。但是在深度增強學習裡這些都用不到,我們調整引數或者調整神經網路的層,參考依據居然不是牛頓運動定律。進入 2018 年,圈內出現的質疑聲越來越多,比如《【AI 幽靈】超 90% 論文演算法不可復現,你為何不願公開程式碼?》、《這裡有一篇深度強化學習勸退文》、《深度學習勸退文》。感覺世界上除了伯克利 BAIR 實驗室的人,其他人都復現不出深度增強學習演算法。
雖有質疑,但是每隔一段時間,伯克利和 OpenAI 都還是能拿出一些看起來效果非常驚豔的工作。不過,因此強行說 DRL 就能做出傳統方法做不出來的東西,就有點不合適了。比如說最近 OpenAI 的新作像人手一樣:OpenAI 用打 DOTA 演算法,教機械手「盤核桃」,如果用傳統方法來做,也是能做的,總計算量也差不多:用外部攝像頭計算出木塊的位姿,然後根據牛頓運動定律和尤拉方程列出動力學微分方程,再解個優化問題算出連續轉動的施力點,接著計算每個手指提供施力的角度和方向,然後移動每根手指(後面這幾步,在我導師的書 A Mathematical Introduction to Robotic Manipulation 裡都明確地寫了該怎麼做)。這些過程中要解一些非常繁瑣的優化問題,但是如果能拿到 OpenAI 訓練神經網路所用的計算量,解優化問題也不是太麻煩的事情。而且大家一說傳統方法就覺得是有模型的,所以不容易擴充套件。但其實從物體的外形計算出合適的施力點這個過程,在傳統的方法裡本來就是無模型的凸優化問題(可參見 @ 戴泓楷的工作),不見得比 DRL 的方法差到哪裡去。所以現在業外人士,包括業內人士的態度都變成了:方法 A 做出了不錯的效果,推測覺得方法 B 做不到,就說明方法 B 完全不能用,方法 A 是人類的未來。但是就沒有人用方法 B 做過同樣的事情啊,連對比都沒有。而且 OpenAI 這個機械手盤核桃,讀了論文發現實驗中 50 次平均成功 13 次,這麼低的成功率為什麼能被用來證明方法 A 就好到是人類的未來呢……
我應該還會繼續關注這個領域,但是不想也不再有機會去伯克利去弄明白這件事。17 年人工智慧的浪潮繼續高漲,大量的申請人想擠進 BAIR 實驗室去做深度學習,伯克利的祕書說 17 年的申請人數量是 16 年的好多倍,我放棄了 offer 就拿不到了。不過好在後來順利拿到了卡內基梅隆大學的 offer。
我將加入卡內基梅隆大學機器人學院的 Biorobotics lab,跟隨 Howie Choset 教授進行科研,繼續沿用比較傳統的機器人學家分析問題的方法和思路。非常巧合的是,前兩天在 Mavic 2 宣傳文裡我談到的給 Mavic Pro 頒發「年度空中救援機器人」的組織,同時也把「年度地面救援機器人」頒發給了 Howie Choset 教授團隊做的機器蛇。https://www.zdnet.com/article/snakebot-named-ground-rescue-robot-of-the-year/ 這種機器人在狹小空間內搜尋救援有非常大的優勢,同時也能引出很多有價值的科研問題和方向。
基於我在工業界的背景和卡內基梅隆機器人學院緊密結合工業界的傳統,未來我會繼續研究可以適用於多旋翼飛行器和地面機器人的通用控制和規劃技術,同時也會關注機器人系統架構的標準化工作。我希望能夠通過博士期間的學習和科研工作,回答一些更大的問題:機器人應該儘量模仿生物還是超越生物?是否存在顯性表現群體智慧湧現的演算法?真正的機器人學習是怎樣的正規化?我不想盲從人工智慧熱潮,我相信真正的人工智慧、超越人類智慧的智慧,應該是從我們對物理世界的規律、能量轉化的利用和現實世界抽象的數學中湧現出來的。
雖然卡內基梅隆的很多人已經認識我,但是就像卡內基梅隆大學博士田淵棟學長說的那樣:
不要在優越感中停止自己的腳步。名利於人最可怕的莫過於此,分明剛剛啟程,但歡呼聲讓你覺得已然衝線,本來要萬里長征,卻變成了百米短跑,接受完了鮮花之後,就再也看不見遠處的風景。其實境界到了或是未到,只有自己知道。跋山涉水,風餐露宿,鼓掌的是別人,度化的是自己。
我需要不斷讓自己做好「雄關漫道真如鐵,而今邁步從頭越」的心理準備。也希望未來在卡內基梅隆不會得到太多科研和教育以外的關注。
對於年輕的科研工作者來說,在哪裡展開科研工作的博士階段是一個非常重要的選擇,我不知道自己關於伯克利還是卡內基梅隆的選擇有沒有做對,多年以後回頭再看也許會後悔,可能那個時候大家都已經轉向了深度增強學習的研究,深度增強學習也在工業界得到了廣泛的應用,但是至少最開始的時候我有一個我自己堅持的想法,沒有隨波逐流。
我在大疆從事的最令我自豪的工作之一——RoboMaster,之後會繼續以顧問和裁判長的身份參與,幫助這項比賽走向國際。過去幾年中有很多高中生、大學生在參加完 RoboMaster 的比賽、冬令營和夏令營之後也受到卡內基梅隆和其他一些美國大學的青睞,未來我會繼續在美國幫助他們,也會給 RoboMaster 圈子裡的同學繼續提供職業發展的建議和諮詢。
過去的五年,我在大疆經歷了一段英雄輩出的時代,得以有幸和一些全國甚至全世界最優秀的工程師合作,並向他們學習了很多經驗,沒有和他們共事的經歷也沒有我現在能夠得到的讀博士的機會;同時在大疆也得到很好的平臺和資源專心做機器人教育事業,通過 RoboMaster 機甲大師賽幫助了新一代工程師的成長,並且為他們的故事所感動,去讀博士不是這項事業的結束,而是另一種形式的延續。我相信大疆創新在未來依然是中國最有競爭力的消費電子、機器人和製造業企業。公司內一些正在孕育的新技術和新專案一定會在接下來的很多年中持續重新整理人們對中國製造和創新的看法。RoboMaster 作為我口中的「大疆下一個創新」、被媒體描述成「大疆第二次創業」的專案,也會持續開花結果,帶給人們緊張激烈的機器人比賽,也帶給下一代年輕人更開闊的未來和可能性。我深深感謝過去經歷的這一切,感謝合作過的每一個人,我們都會在世界各地繼續努力,「聚是一團火,散是滿天星」。
我也非常感謝我的妻子 @Lexi M。在別人都已經安頓下來的年紀,還要換個生活方式繼續挑戰自我,這對我的家庭也是一個巨大的挑戰。妻子從一開始就非常支援我去走上這條新的道路,給我出主意,並且願意為了我調整自己的職業發展方向、經歷離別和生活方式的改變。人生得一知己足矣,而對我來說我同時得到的是知己、朋友、親人和愛人,對此感激不盡,只能用一生的努力去報答。
最後,用我非常欣賞的哈爾濱工業大學機器人隊的隊訓作為結尾,希望在未來的幾年自己能夠一直被這句話所激勵:極限尤可突破,至臻亦不可止。
知乎文章連結:https://zhuanlan.zhihu.com/p/41313724?utm_source=wechat_session&utm_medium=social&utm_oi=28147256918016&wechatShare=2&from=timeline&isappinstalled=0