CSDN專訪:吃喝玩樂背後的黑科技

美團技術團隊發表於2018-12-30

大家好,我是美美,很高興又和大家見面了,前不久,CSDN旗下AI科技大本營的楊麗記者走進美團,全面瞭解美團在AI領域所做的一些探索與實踐。AI雖已進入開花階段,但應用於美團這麼複雜的場景,仍然任重道遠。


很多人都會發現日常生活已經越來越離不開美團了,這個網際網路平臺涵蓋了吃、住、行、遊、購、娛……能幫我們做很多事情,非常接地氣。黃色的美團外賣騎手,橙色的摩拜單車,還有美團和大眾點評的Logo……會不時出現在各個角落,已經成為我們熟悉的城市風景線。

可這些與科技的關係,大家就不一定都那麼清楚了。

我們注意到,美團點評的上市招股書中不僅多次提到科技,而且將科技放到了非常核心的位置:“我們相信科技將使人們的生活更加美好……我們用科技連線消費者和商家……通過先進的大資料人工智慧技術助力服務行業。”

美團創始人王興本人也在今年公開演講中特別強調:“到了網際網路的下半場,我們要從使用者需求驅動,轉向使用者需求和核心技術雙輪驅動。”

根據公開資訊,公司產品技術研發團隊現在已經超過1萬人,最近一個季度的研發投入同比翻番,達到20億元。據我們所知,這兩個數字在整個業界都是排在前列的。這麼大規模的研發團隊,都在做什麼呢?AI又在其中發揮著怎樣的作用呢?

近日,帶著這個問題,CSDN走訪了美團AI技術團隊。

美團AI全圖

美團點評辦公區位於朝陽區望京,具體包括幾棟樓,連很多員工都搞不太清楚。從恆電大廈、科創大廈到旁邊的賓士大廈、施耐德大樓、銳創大廈,還有更遠的數碼港、太極大廈,都入駐了美團點評大大小小的工位、會議室,還有實驗室。

“在美團做AI,有一個非常大的優勢,就是資料和應用場景豐富,可以把各種各樣的前沿技術用到實際產品中,改善億萬人的生活。要把幾億消費者與數百萬生活服務商家高效地連線起來,AI有很多用武之地,因此比較大的業務部門中的技術團隊,都有從事AI的同學。” 美團點評技術委員會演算法通道主席何仁清,用下面的大圖向我們介紹了整個公司AI應用的情況。

CSDN專訪:吃喝玩樂背後的黑科技

整體上,美團演算法團隊正在構建的AI相關技術囊括了語音、視覺、自然語言處理機器學習知識圖譜等。以美團/大眾點評App搜尋、推薦為核心,面向外賣配送的策略、排程演算法、定價系統,延伸到無人配送的自動駕駛、智慧耳機裡的語音識別人臉識別,再到連線使用者端的客服系統,連線商家端的金融體系、供應鏈系統也匯聚了美團點評正在構建的龐大知識圖譜……

就拿大家最熟悉的美團外賣來說,看起來非常簡單,和科技好像沒什麼關係。但是,美團外賣一天要完成約2000萬訂單,而且大多集中在幾小時高峰時段,及時排程50多萬騎手小哥按照最優路線工作,為了保證都市上班族都能及時吃上溫熱而不是冰冷的飯菜,還需要將配送時間控制在30分鐘內……這可不是一件容易的事情。

事實上,為了完成這一高難度的技術任務,何仁清帶領的美團配送演算法團隊開發了目前世界上超大規模、超高複雜度的多人多點實時智慧配送排程系統。“29億次”,這是美團智慧排程系統高峰時每小時的路徑計算次數。

CSDN專訪:吃喝玩樂背後的黑科技

做能落地的AI,對人才求賢若渴

美團獨特的AI落地場景和挑戰,對優秀人才也形成了獨特的吸引力。從今年整體來看,美團吸引了不少AI高手的加入,他們要麼是畢業於國內外知名學府,如清華北大、CMU、UCSD等,要麼是來自Google、微軟、騰訊、阿里、百度等網際網路巨頭公司。

目前,整個公司從事人工智慧的演算法工程師(含實習生)已經超過1000人,可是,這還遠遠不能滿足需求。

為了吸引AI人才,美團首次聯合主辦AI Challenger全球挑戰賽,兩個主賽道的資料集和命題設定,一個是由無人配送團隊負責的“無人駕駛視覺感知”,另一個則由美團點評AI平臺部NLP中心負責的“細粒度使用者評論情感分析”,後者也是本次挑戰賽報名最火的賽道。歷時3個多月的AI Challenger全球挑戰賽也於近日落下了帷幕。

組建僅兩年的無人配送部門,已發展到了百人以上,甚至給出了2018年擴張至200人規模的指標,其中大部分都是AI方向。如今,新年將至,足見人才招聘的壓力。

而NLP中心今年2月正式組建,不過數月,團隊已超40人,主要成員均來自阿里達摩院、MSRA、騰訊(微信)、百度NLP等業界知名的AI團隊。隨著明年來自清華、北大、中科院、上海交大等高校的優秀博士、碩士畢業生的加入,NLP中心的團隊規模還將進一步擴大。

同樣求賢若渴的還有何仁清的美團配送方向的策略和演算法團隊。他的團隊從構成上主要分兩類:一類是有著過硬運籌學背景的工科人才,還有一類是有過機器學習、定價系統方面經驗豐富的計算機人才。

目前在美團,演算法工程師已經在排在後臺、前端之後,成為第三大技術群體,而且還在迅速擴張中。

探索AI未來之無人配送

美團的演算法工程師面臨著一個共同的問題:在複雜多變的真實場景下,如何在快速發展的業務中利用演算法提升效率效益。除此之外,以無人配送為代表的新技術探索部門還承擔了更多的工作:從零到一建立系統、資料、業務。

現在,無人配送開放平臺已經完成了雄安新區、首都鋼鐵園、深圳聯想大廈等多地的測試運營,印證了美團無人配送開放平臺進行片區規模化運營的可行性。

今年7月,美團還發布了無人配送開放平臺,希望集合政府、高校、企業三方力量一起實現這個偉大夢想,現已吸引了包括清華大學、加州伯克利大學、北京智慧車聯產業創新中心、華夏幸福、Segway等近20家國內外合作伙伴的加入。

“我們已經克服了很多在技術、運營,以及裝備製造、生產加工等供應鏈上遇到的挑戰,才走到了今天。”美團點評首席科學家、無人配送部總經理夏華夏提到。

CSDN專訪:吃喝玩樂背後的黑科技

左:可在城市道路低速自動駕駛的無人配送車;右:主要用於園區內送外賣的無人車

無人駕駛技術的落地是世界難題,但美團配送末端物流“小輕慢物”的特點,則提供了一個很好的場景。從去年年底開始,原來擔任美團外賣總架構師的夏華夏就開始全身心投入到無人配送這個專案上,在他看來,無人配送從技術上講非常複雜,對各類人才的需求很大。不僅包括感知、定位、地圖、規劃控制等,也包括作業系統、嵌入式計算、嵌入式程式設計等偏核心的東西,同時還涉及硬體的整合,包括感測器、汽車底盤、車身的機械結構,也有大資料儲存、雲端模擬的系統。此外,在運營方面,還需要跟物業地產公司、各地政府完善無人駕駛方面的各種規章標準。

構建大規模的餐飲娛樂知識圖譜——美團大腦

美團點評平臺上匯聚了圍繞生活服務方方面面的海量資料,比如商戶資訊、菜品資訊、景點資訊、使用者評價等等。如何從這些資料中提煉出有價值的知識,從而進一步幫助人們提升生活便利性,助力餐飲娛樂產業升級呢?

今年5月,美團NLP中心開始構建大規模的餐飲娛樂知識圖譜——美團大腦。美團點評作為中國最大的線上本地生活服務平臺,連線了數億使用者和數百萬商戶,蘊含著豐富的日常生活相關知識。在建的美團大腦目前有23類概念、16億實體、486億三元組,對比Google的Knowledge Graph 700億三元組和微軟的Satori 500億三元組,美團大腦的知識關聯數量級可以說是世界級的了,未來一年預計會突破千億規模。

NLP中心的核心帶頭人,是此前曾就職於Facebook、微軟亞洲研究院的王仲遠博士。作為美團大腦專案的負責人,他向我們介紹,美團大腦會充分挖掘關聯各個場景資料,用AI技術讓機器“閱讀”使用者評論,充分理解使用者喜好,構建知識關聯,從而形成一個“知識大腦”。相比於深度學習的“黑盒子”,知識圖譜具有可解釋性,在美團跨場景的多個業務中應用性非常強,目前已經在搜尋、金融、商家運營等場景中驗證了知識圖譜的有效性。王仲遠博士還談到,深度學習知識圖譜技術近年來都有很大的發展,並且存在互相融合的趨勢。在美團大腦的知識構建過程中,也會使用深度學習技術進行知識挖掘,從而用知識助力業務,實現智慧化的本地生活服務,幫助每個使用者“Eat Better,Live Better”,這也是美團點評的企業使命。

王仲遠博士同時是大眾點評搜尋智慧中心負責人。搜尋是大眾點評App上使用者進行資訊查詢的最大入口,是連線使用者和資訊的重要紐帶。使用者搜尋的方式非常多樣,搜尋場景也非常細分和豐富,並且對接業務種類多,流量差異大,為點評搜尋帶來了巨大挑戰。而解決這些挑戰的方法,需要升級NLP技術,進行深度查詢理解以及深度評價分析,並依賴知識圖譜技術和深度學習技術對搜尋架構進行整體升級。

據王仲遠博士介紹,在NLP中心以及點評搜尋智慧中心兩個團隊的緊密合作下,短短5個月,點評搜尋核心KPI在已經較高的基礎上又有大幅提升,是過去一年半漲幅的五倍之多,提前七個月就完成了全年的目標。

從大方向來看,知識圖譜正成為影象、自然語言處理之後又一個新的值得關注的技術領域。2018年8月Gartner公佈的關於AI技術成熟度曲線顯示,知識圖譜自然語言生成聊天機器人等技術將逐漸得到公眾的關注。

CSDN專訪:吃喝玩樂背後的黑科技

除了搜尋推薦外,美團大腦正在應用於SaaS收銀系統專業版。從使用者角度來說,美團大腦可以閱讀每一條評論,充分理解使用者對商家的感受;從商家角度來說,美團大腦能夠歸納總結使用者評價,從而發現商家在市場上的競爭優勢/劣勢、使用者對於商家的總體印象趨勢、商家菜品的受歡迎程度變化。另外,通過細粒度使用者評論全方位分析,細緻刻畫商家服務現狀,並對商家提供前瞻性經營方向。這些智慧經營建議將通過美團SaaS收銀系統專業版定期觸達到各個商家,智慧化指導商家精準優化經營模式。

美團大腦與美團金融平臺也正在緊密合作,利用知識圖譜中的社群發現、標籤傳播等方法來對使用者進行風險管理,能夠更準確的識別逾期客戶,以及使用者的不良行為,從而大大提升信用風險管理能力。在反欺詐場景中,知識圖譜已經幫助金融團隊在案件調查中發現團伙欺詐案件,還可在已有的反欺詐規則上進行推理預測。

與此同時,王仲遠團隊也正在構建國內領先的商業化分散式圖引擎系統,支撐千億級別知識圖譜的實時圖查詢、圖推理,根據不同業務定製化支援子圖加速,加速大規模分散式圖計算。

目前,王仲遠負責的NLP中心隸屬於基礎研發平臺的AI平臺部,而該部門由美團CTO羅道鋒兼任負責人,足見美團對AI的重視。基礎研發平臺還在負責構建整個公司統一的雲端計算大資料機器學習平臺,其中包括GPU叢集的構建。從實際情況來看,單純的CPU已無法滿足美團日益飆升的海量資料的運算處理。9月底,機器學習平臺剛剛完成了數千塊GPU叢集的搭建。而美團的大資料平臺也已經積累了總計幾百PB的海量資料。

面向業務的AI平臺

如果說基礎研發平臺的AI平臺部奠基了美團公司研發AI技術的基礎實力,那麼美團首席科學家張錦懋領導的美團平臺演算法與資料研發部就承擔了另一個重要角色:連線公司內各個業務場景對於AI技術的全方位需求。

在組織架構調整後,張錦懋的團隊目前劃歸於由美團平臺、點評平臺、服務體驗平臺部等部門組成的使用者平臺。實際上,從2016年起,張錦懋的團隊,從組織上來講,越來越強調構建一種面向業務AI需要的平臺能力。因此,他們幾乎與公司內部所有的業務部門都打過交道:“除了做業務,也要有一個技術積累的團隊。我們一方面有直接深入到業務線,響應業務線相關AI需求的專案團隊,另一方面也有偏向底層基礎能力的團隊,(演算法方面)如語音、影象、NLP、機器學習、使用者畫像等。”

CSDN專訪:吃喝玩樂背後的黑科技

在張錦懋看來,如果美團想要形成一個在技術上有重要競爭力的平臺,一定是以AI為主導,資料為基礎,並做到行業最佳水平。除了配送、排程這種單點上的演算法,實際上還需要一個不斷迭代、演進的系統。這個系統同時也需要人和業務共同迭代,能夠讓業務人員與演算法工程師配合起來,形成一個業務的閉環。接下來才可能突破一些關鍵技術點:因此,除去傳統的機器學習感知層的視覺、聽覺等演算法方面的工作,構建以海量資料為基礎,可以在業務端持續迭代演進的系統也是這個團隊的關鍵性工作。

AI未來:長期有耐心

在美團,大家最常說的兩句話,一句是“以客戶為中心”,一句是“長期有耐心”。雖然外界AI很火,但美團技術團隊對AI這件事有自己比較清醒的認識。

公司的業務團隊離客戶更近,之前其實對AI的態度並沒有特別積極,因為落地確實有很多難點,而技術團隊也做好了長期死磕的準備。以智慧排程系統來說,雖然已經成為一種行業趨勢,但何仁清還是更多看到了困難:“在推行智慧化系統方面,整個公司的決心是比較大的。但是這個事情落地時候還會遇到很多問題需要解決,特別是線下的一些阻力、企業客戶需要適應、利益上的變動等。”

目前,包括阿里菜鳥、京東都在試圖用無人駕駛技術解決物流上的問題。相比載人車輛來講,美團無人配送雖有著落地的優越性,但也有無人駕駛技術的複雜性,勻速20公里/時的無人配送車,在國內人流密集的大城市內行駛仍具有很高挑戰性。談及對無人配送部門未來的規劃和期待時,夏華夏很冷靜:“我們的預期是有的,但也沒有非常嚴格的Deadline。希望在三五年內首先達到在無人配送場景上的落地。”

隨著技術能力的不斷增強,張錦懋明顯感覺到今年的業務合作關係、信任度相比此前,發生了很大的改變,大家都對新技術更加重視了。當然,AI應用於美團這麼複雜的場景,仍然任重道遠。“如果沒有一個好的平臺、好的系統,這個工作的挑戰是非常巨大的。現在我們還處於剛剛起步的狀態。” 張錦懋在採訪最後這樣表示。

正如美團點評CTO羅道鋒在今年AI Challenger大賽啟動儀式上所分享的:

我們對AI的投入很堅決,希望依靠技術提升我們的業務,服務更多消費者和商戶。不過也要看到,AI現在雖然已經進入開花階段,但還在早期。我們目前擁有更大量的資料、更強的算力,做的是超高維空間的擬合,現在應用的AI技術還是弱人工智慧,我們離強人工智慧還有很遠的距離,解決真實問題仍然面臨不少艱鉅的挑戰,這是一件需要長期有耐心的事情。

相關文章