採訪 | 四月
撰文 | 四月
過去五年,阿里在全球人工智慧的激烈賽道上悄然跑進了第一梯隊,背後一群以達摩院稱號對外示人的科學家群體愈發神秘撩人。
這是一群野心勃勃的科學家,親手打破旁人豔羨的舒適區,踏入充滿禁忌的未知地,只為尋覓更廣闊的舞臺。他們一生都致力「求證」,或於學術理論,或於技術價值,並願意承擔隨之而來的冒險和境遇窘迫。
這五年,阿里經歷了人工智慧技術長征的發端與突圍,而他們,也經歷了一場巨大的冒險與自證。
初見之時,你或許會訝異他們滔滔不絕地談起「買單」、「落地」、「規模化」等商業味濃厚的字眼,全然沒了學究氣,仿若一位身居一線的創業者心心念念……
直到你聽說過那段既艱難又幸運的歲月,一切便了然於心——唯有越瞭解真相,才會變得越務實。
人生的絕妙之處也在於此,改變他們的不是早年風光的求學路,也並非當下所擁有的物質地位,而是源於一次又一次被質疑和誤解後的絕地「自證」——不同於象牙塔裡、試驗檯前的公示推理和模擬驗證,商業場上的「自證」需要拿出實實在在的業務指標和實際效果,正如阿里辦公區裡那句隨處可見的標語——「NO DATA,NO BB」。
強壓之下的「自證」氛圍造就了科學家們近乎苛刻現實的技術價值觀。
待繁務卸下,他們重拾赤子之心,沉浸於演算法公式和理論推理的樂趣。但人生並不總有自由浪漫的時刻,更漫長的是披荊斬棘的孤獨與煎熬。
透過和近十位阿里巴巴人工智慧科學家的對話與交流,本文試圖還原阿里打造人工智慧技術體系的荊棘路,以及路途中科學家們的內心征途。
1 . 既艱難又幸運
多年以後,遇上北京的霧霾天,漆遠沒準依然會想起那個加班的春節——西大望路的阿里媽媽會議室裡,一桌人戴著口罩開著會,工位上的空氣清淨機呼呼作響,窗外是望不到對面樓的霧霾天。
回國前,漆遠已經在腦海中羅列過一連串的適應清單,以備回國後的各種挑戰,而「迷霧危機」大概是被遺漏的最重要的一條,它不僅來自於北京的天氣,還包括那個大膽的決定。
漆遠曾走過一條無數理工男夢想的坦途:31 歲麻省理工大學博士畢業,39 歲成為一流大學終身教授,定居美國,擁有寬敞明亮的實驗室和獨棟別墅,一位美麗的太太以及兩個可愛的孩子,一年兩次固定的長假足以讓他兼顧工作和生活的完美平衡。
直到一次大膽的決定,漆遠親手打破了這種平衡。在拒絕谷歌、Facebook、百度等公司的邀約後,漆遠決定歸國到杭州工作,選擇了當時看起來「最沒有技術範兒」的阿里。
2014 年 9 月 19 日,時任阿里巴巴合夥人的王堅帶著漆遠來到紐交所,共同見證了阿里巴巴的上市,7 位敲鐘人全是阿里電商的買家和賣家,卻沒有一位是科學家。
面向華爾街,這家彼時市值 2400 億美金的公司並不滿足被定義為一家「電商公司」。他正在謀劃一個嶄新而宏偉的「想象力故事」,以便讓公司在未來獲得更強勁的增長動力。
他明白,前沿技術會是這個故事的主角,緊接著 iDST(資料科學與技術研究院 Institute of Data Science & Technologies)宣佈成立,漆遠和金榕成為早期創始人。
但彼時彼地,故事聽起來不免有些冒險主義——中國網際網路市場仍處在模式創新的初級階段,一家以商業利益為本的企業憑什麼打造技術驅動的研究院?國內幾乎沒有任何成功的營運模式可以參考。
未知的挑戰首先降臨到了早期創始人和研究機制身上。
漆遠,現達摩院金融智慧實驗室 負責人
加入阿里後,漆遠接到的首個任務是打造一套大規模機器學習平臺,落地到淘寶的廣告平臺阿里媽媽。他清楚地記得,當時手裡攥著兩千萬特徵,14 天的資料。由於資料量太少,他計劃積累到半年資料後再啟動。
同時,他還提交了一份申請數千臺伺服器的計劃。這並不是一筆小數目,直到現在一塊英偉達的計算卡仍然要價 2000 美金,計劃討論後就被否決了。
等了半年,伺服器仍沒有撥下來,巧婦也難為無米之炊。「當時沒有 GPU 叢集,整個集團都沒有」,漆遠說道,「同事們認為,『你們這幫教授老師過來,基本不懂業務,也不懂技術』」。
秀才遇到兵,有理說不清。漆遠的團隊陷入了不能「自證」的悖論裡:沒有 GPU 叢集,如何證明自己的演算法和技術高效?不能證明自己的演算法和技術高效,如何爭取到 GPU 叢集?
漆遠曾試圖據理力爭,僵持狀態幾近半年,「團隊一度走在解散的邊緣」。
金榕是 iDST 的另一位創始人,美國密歇根州立大學終身教授,曾獲得過美國國家科學基金會獎(漆遠也獲得過該獎)——有超過 200 位諾貝爾獎得主都獲得過這個獎金的資助。