下沉、重聚、歸位背後,是一位學者轉身業界帶領阿里iDST建立技術「影響力」的四年

微胖發表於2018-01-06

撰文 | 李九喻 王藝

編輯 | 劉燕

兩個月前,在杭州阿里巴巴西溪園區的一間會議室裡,機器之能見到了阿里巴巴 iDST 院長金榕。

金榕風風火火地進來,在會議桌靠近門口的一側坐下。他說話很快,由於長期在美國求學工作的原因,句子中夾雜著英文。事實上,iDST 院長這個位置是金榕在產業界的首次亮相。此前,從卡內基梅隆大學博士畢業的他在密歇根州立大學教書多年,並已是該校終身教授。

自 2014 年加入資料科學與技術研究院(Institute of Data Science and Technologies,簡稱 iDST )以來,金榕教授所做的一系列工作,就是讓類似「人工智慧驅動企業增長」的技術方案落地。

過去幾年,BAT 試圖通過在研發上的大手筆投資以及收購,企圖在短時間內找出自身產品與服務和人工智慧技術的結合點。然而急於部署人工智慧,這並不是明智的選擇,因為往往公司內部的技術人員不能夠準確評估人工智慧的商業價值。在另一方面,紙上談兵的人工智慧創業公司層出不窮,這使其領域內公司的商業價值水分增加。

行業的窘境與金榕過去幾年的經歷不謀而合。從西雅圖到杭州、從帶博士生到帶團隊、從提升論文 benchmark 到完成部門目標,這位嚴謹的學者在過去幾年經歷了一次次對技術商業應用認知上的衝擊。

經歷教授到院長身份轉變的金榕,向我們闡述了一個前沿技術團隊在阿里巴巴尋求突破的過程,以及對如何發揮團隊自身價值的實踐領悟。

連線人工智慧的業務和技術線

與 2017 年營收 1582.73 億人民幣、近 5 萬全球員工和 56% 營業額增長相呼應, iDST 需要接觸龐大的業務生態圈。其中包括阿里旗下的 8 家線上購物平臺—— LAZADA、阿里巴巴、alibaba.com、AliExpress、淘寶、天貓、聚划算和飛豬;以及關聯業務——螞蟻金服、阿里媽媽、高德地圖、UC 瀏覽器、優酷土豆以及菜鳥物流。單螞蟻金服一項,其支付寶業務就滲透全球了 30 多個國家,覆蓋 5.2 億使用者,使用者人數接近北美人口的總和。

僅憑上述資料,我們就不難理解為什麼阿里巴巴能夠吸引諸如前亞馬遜最高階別華人科學家任小楓等頂尖技術人才的加入。

面對企業內部務實的作風,iDST 團隊梳理了幾個著重點:檢索、語音、語義、影象、視訊和模型優化。同時也提出了目前側重的四個人工智慧技術應用方向(如下圖):

下沉、重聚、歸位背後,是一位學者轉身業界帶領阿里iDST建立技術「影響力」的四年


在計算機視覺領域,一個典型應用產品「拍立淘」,是金榕團隊用深度學習開發出來的拍照購物神器。通過精準識別實拍圖,使用者可以使用拍立淘通過圖片搜尋幾乎所有淘寶商品,從網紅堅果、新款電子產品、夏季連衣裙、進口手辦到歐款木製傢俱。

從技術層面上來講,拍立淘的深度模型將使用者的查詢圖片、點選圖片、和未點選圖片構建成一組特徵學習框架,利用深度卷積網路提高搜尋精確度。金榕的團隊還利用遷移學習將該模型應用在其他領域中。在過往線性遷移的基礎上,團隊演算法引入隨機傅立葉函式,利用非線性學習方法提高系統的魯棒性。目前該遷移模型在谷歌 Open Images 資料庫的 Top

10 準確度達到了 57.91%,高於直接使用 Open Images 資料訓練的 GoogleNet V3 的 53%。

下沉、重聚、歸位背後,是一位學者轉身業界帶領阿里iDST建立技術「影響力」的四年

拍立淘使用者介面展示


根據金榕介紹,拍立淘資料庫中包含超過 10 億個商品,以及 1400 萬日活躍使用者。這組資料規模到底有多大?學界熟知的 ImageNet 資料庫大概儲存了 1500 萬張照片,而拍立淘每一天上傳的圖片就比這個要多。「我們研發了快速高精度的檢索索引技術使得海量的資料分析成為可能。」

另一個值得一提的是組合優化技術,金榕向我們講述了 3D 裝箱優化技術的應用。目前阿里巴巴旗下的菜鳥物流一直在運籌優化上尋找突破點。其中一個問題是如何使用表面體積最小的箱子,依照最優的次序放置、打包物品,從而降低運營成本。阿里的模型將待打包的物品尺寸輸入 Deep-Q 模型,計算出所需的最小容器,再用強化學習找到最佳的打包方式。目前利用這個方法可以節省 5% 的包裝消耗。

下沉、重聚、歸位背後,是一位學者轉身業界帶領阿里iDST建立技術「影響力」的四年

5% 看上去不是一個很大的比例,但僅在 2016 年的雙11購物節,阿里巴巴就產生了 6.57 億筆物流訂單。這也就意味著每年能節省近 3285 萬件訂單的打包成本。與此同時,阿里巴巴在倉儲以及配送的技術優化也非常出色。統計資料顯示,在 2013 年雙 11 的快遞平均送達時間是 9 天,到了 2016 年則縮減至 3 天半。

在 2017 年的雙 11,他們將這樣的技術從倉庫遷移到資料中心,研發的資料中心資源分配技術,能夠將分配率拉昇到 90% 以上,在部分業務中節省一半伺服器,並以 2 秒的速度鎖定異常機器,命中率達到 94%。

除此之外,免喚醒地鐵語音購票機、國家人工智慧開放平臺城市大腦、聊天機器人阿里小蜜等,這些專案的很多核心技術都是來自於 iDST。

這是金榕口中的技術「影響力」。「在公司裡,你用技術可以影響到上億使用者的生活。」金榕說,「而在學界很難做到類似的影響。在學校你也許工作很久,最後的結果僅僅是將某個 benchmark 提升 5%、10%。」

對科學家來說,企業的海量資料就像是一個開放式的遊樂場,提供了學者在學校工作難以實現的可能性。

前沿技術團隊尋找價值與突破的過程

這顯然不是一路坦途。

儘管 4 年前,阿里巴巴成立 iDST 時對技術研究目標野心滿滿。那時候,iDST 很快就組起了一個 30 人左右的團隊,聚集了眾多曾在研究方面頗有建樹的專家,包括現任院長金榕、現螞蟻金服首席資料科學家漆遠等。

成立初期,iDST 承接了包括建立超大規模 GPU 機器學習叢集、機器學習平臺 PAI、以及幫助聚划算進行商品排序提高運營效率等任務。然而,iDST 的出現並沒有受到業務線的歡迎,技術沒有順利落地成為最大「衝突」。

當時,在業務線同事們的眼中,這些科學家是「不懂市場、不懂商業化的人」。

金榕講到一個例子。在幫助聚划算進行商品排序的過程中,科學家們很自然地想要將價效比更高、更划算的商品放在前面,也確實有效地增加了營收。但由於較為便宜的商品佔據了相對明顯的位置,整個聚划算的使用者群開始向三四線城市傾斜,用金榕的話說,「聚划算產品的價值都變了。」

 「這不是科技可以解決的問題,你把 GMV(一定時間段內的成交總額)提高了,但卻改變產品本身的定位。」對於到底怎樣做才是有價值的,金榕很困惑,他說,「可能沒有人有確切的答案。」

他慢慢地意識到,從整個集團的角度而言,科技並不只是計算數字的工具,而是要真正和場景結合起來,把業務做好。他認為,如果團隊對場景沒有清晰的認識,和業務脫節,那麼在阿里,iDST 的技術將永遠沒有辦法產生價值。

2015 年 7 月開始,他們決定走到到業務中去。金榕帶領一隊人馬進入搜尋事業部、漆遠到螞蟻金服、一些從事語音方向的研究人員到阿里雲。

他們從手邊事做起,也開始扮演關鍵先生的角色,「我們無條件地來幫忙做產品。」金榕回憶道。搜尋事業部的產品新版本由於一個 Bug 沒有解決而遲遲不能上線,金榕團隊幫忙排查原因發現,是技術人員將公式 A/(B+C)寫成了 A/B+C。「你不要小看這件事情。」金榕說,排查像這樣的細微問題,最考驗一個人對程式的感知能力。新版本上線那麼多行程式碼,肯定不能從頭開始一行一行地看、一行一行地查,對「哪些資料不太對勁兒」的敏銳嗅覺是查出這個 Bug 的關鍵所在。

但在深入業務的過程中,團隊的一些成員因為不適應而離開,「當你自己都還在尋找價值的時候,你是很難說服別人進來跟你一起並肩作戰的。」金榕說。

他坦言,那時候團隊的動盪,讓他有些自責。在金榕心裡,這些人是他一手招進來的,他應該讓他們付出的智慧得到應有的回報。

走出過渡期,「要做人工智慧技術最底層的創新」

「現在來看,每個人都是自己人生的主人,每個人都要對自己負責任。」金榕說。而他和他領導的iDST也走出過渡期。

馬雲提出「大中臺、小前臺」戰略,讓各個業務線在一個強大的、動態的「中臺」支撐下,僅用幾個人手就能搭建起穩定的前臺服務。

這有些類似專案制與產品制的區別。專案制隨著業務的爆發,所需人力也隨之爆發,且專案間的經驗很難複用、累積。產品制更輕、更巧、更專,只需對不同的專案需求做少量定製化,在成本方面更加可控,在技術方面也能有所積累。

由此,2017年 3 月,在集團組織部大會上,阿里巴巴 CTO 張建鋒明確要讓分到各個業務線上的 iDST 成員重聚,並強調了 iDST 的定位——成為阿里巴巴集團面向未來的 AI 研發核心力量。

 現在,阿里巴巴的 AI 研發「大中臺」放在 iDST,通過呼叫介面的方式供業務線使用,通過阿里雲向外部輸出。目前,iDST 在西雅圖、杭州、北京、矽谷都有分部。海外部門側重於基礎研究,杭州團隊側重應用研究,他們克服約 1 萬公里的地理距離、15 個小時的時差,互相協調數百人的團隊工作。

金榕開始設計 iDST 的核心技術目標,要做人工智慧技術最底層的創新。

「一個公司要在市場上獲得地位,沒有黑科技怎麼可能。你用的都是跟大家一樣的東西,那市場為什麼選你?」金榕認為,團隊有實力創造出一種學習模型,能夠在實操業務層面比當前從實驗室中走出來的模型表現更優。

金榕有點像是一個深度學習的挑戰者。在他看來,由於深度學習技術發展到現在,各種模型、框架已經被封裝得很好,工程師們更多的是「拿來用」,很少有人會真正對技術背後的原理進行思索。

另一方面,金榕說,現在的深度學習技術,最可怕的地方在於,你不知道它不能做什麼,不知道它的邊界在哪裡。沒有人知道某個模型在某個具體任務上為什麼好用,為什麼不好用。如果不好用的話,那就換一個模型繼續嘗試。而現在的學術評價體系促使大家更多記錄成功,「很少有論文的主題是寫一件事情是如何失敗的,」金榕說,「這很糟糕,很多聰明人在試同樣的錯。」

金榕希望改變這樣的局面,真正地從底層技術驅動創新。

2017 年雲棲大會上,阿里巴巴宣佈成立達摩院,瞄準未來突破性技術的研究。也許,阿里巴巴這樣一家電商公司強化技術的決心,會給金榕更多時間和信心。「如果所有的商業公司不能容忍技術自身的發展規律,那麼我認為,今天的一切都不可能發生。」

對海外優秀技術人才的吸引力,也在提升。阿里巴巴在卡內基梅隆大學舉辦校招,座無虛席,即便不打算加入的學生,也想多瞭解一些。與幾年前相比,國內網際網路公司的人才競爭力正逐年遞增。與 BT(百度、騰訊)和 FLAG(Facebook、LinkedIn、Amazon、Google)相比,阿里巴巴這家公司的情況究竟是怎樣的?

我們向校招現場的學生做了個小調查:

下沉、重聚、歸位背後,是一位學者轉身業界帶領阿里iDST建立技術「影響力」的四年

資料顯示,27% 的學生對阿里的平臺影響力有信心,58% 的學生在 BAT 裡更青睞阿里巴巴,而這其中選擇 1-3 年內回國的人高達 42%。

正在 CMU 攻讀博士後的杜同學和金榕有過短暫交談,他告訴我們,除去留在美國還是回國的選擇,是否選擇阿里巴巴取決於專案本身,以及領導團隊的默契。當我們詢問金榕在尋找什麼樣的人才時,他說,「擁有良好的踏實感與商業好奇心是技術人才在業界成功的必備品質。」

這更像是金榕轉換軌道經歷 iDST 變化之後的總結式感悟,「(做技術的人)也要對業務有理解,能夠沉下心來理解商業運作模式,否則一切努力只是個人一廂情願。」

然而,平衡業務需求和技術研發之間的銜接關係,是商業化公司的長期挑戰,煥發新生後 iDST 的征程仍然漫長。下沉、重聚、歸位背後,是一位學者轉身業界帶領阿里iDST建立技術「影響力」的四年

相關文章