對話美團AI視覺專家:GPU計算平臺全面升級,AI效率提高百倍

dicksonjyl560101發表於2019-09-18
2019-09-18 17:19:34


對話美團AI視覺專家:GPU計算平臺全面升級,AI效率提高百倍


對話美團AI視覺專家:GPU計算平臺全面升級,AI效率提高百倍

不知不覺間,AI已經滲透到了生活的方方面面,甚至包括我們所熟知的餐飲外賣。

從商家的選單錄入、招牌識別、到促銷時AI自動生成的廣告首圖優選、外賣騎手的身份驗證……美團的AI視覺能力已經滲透到其業務的方方面面。

對話美團AI視覺專家:GPU計算平臺全面升級,AI效率提高百倍

▲美團視覺影像中心影像影片組負責人魏曉明

近日,智東西來到美團北京總部,與美團視覺影像中心影像影片組負責人魏曉明進行了一次深度對話,全面地解讀了美團的視覺AI能力、美團視覺AI平臺發展歷程、與美團視覺AI背後的“發電廠”。

一、從選單錄入到AI選圖,AI無處不在

魏曉明說,與其他很多企業不同,美團的AI技術有著強烈的業務導向特色。

當前,美團的AI技術主要分為四大類,分別為:基於AI的語音/語義理解技術、基於AI的視覺處理技術、基於運籌學為主的配送排程最佳化、以及基於自動駕駛相關的無人配送技術。

對話美團AI視覺專家:GPU計算平臺全面升級,AI效率提高百倍

▲美團AI視覺佈局

魏曉明是美團視覺影像中心影像影片組負責人,有著超過9年視覺領域研發和技術管理經驗,此前曾經就職於佳能研究院和三星研究院。

魏曉明2015年加入美團後,主導了超過50個AI視覺專案。在採訪中,魏曉明分別從商戶、騎手、使用者、平臺四個角度,對於美團的典型AI視覺應用場景進行了介紹。

對話美團AI視覺專家:GPU計算平臺全面升級,AI效率提高百倍

▲AI選單拍照錄入

對於商戶而言,美團AI能夠讓其透過拍照錄入選單,透過文字檢測、語義分割、視覺關係學習等技術抽取紙質選單上的結構化資訊,讓商戶選單錄入的時間由小時級降至一分鐘以內。

對話美團AI視覺專家:GPU計算平臺全面升級,AI效率提高百倍

▲AI招牌識別

隨著OCR技術的不斷髮展,選單識別、招牌識別等細分場景成為了當前OCR領域的研究熱點。在今年的 ICDAR 2019 上,美團主辦了業界首箇中文門臉招牌文字識別比賽(ICDAR 2019 Robust Reading Challenge on Reading Chinese Text on Signboards),並公開的業界首個真實場景招牌影像資料集。

此外,商戶的證件資質認證、騎手的刷臉認證、使用者所使用的AI菜品識別小程式、廣告首圖優選、騎手抽檢等等應用背後,都有著美團AI視覺的加持。

對話美團AI視覺專家:GPU計算平臺全面升級,AI效率提高百倍

魏曉明說,當前,美團的技術人員有上萬人,美團AI視覺中心也有幾十名員工,並且團隊規模仍在不斷擴充套件當中。

二、GPU計算平臺全面升級,效率提高百倍

美團的AI視覺團隊從2015年開始建立,為美團各項業務提供AI視覺能力(比如影像稽核、智慧選圖等),2015-2016年可以看作是美團AI視覺平臺的第一個發展階段。

隨著集團內部對於AI算力的需求飆升,2017年,美團進行了企業層面的計算平臺全面升級,將從CPU為主的計算平臺升級為以英偉達GPU為主的叢集化AI計算平臺,2017-2018年可以看作是美團AI視覺平臺的第二個發展階段。

對話美團AI視覺專家:GPU計算平臺全面升級,AI效率提高百倍

在升級為以英偉達Tesla V100 GPU為主的叢集化AI計算平臺後,美團AI在文字檢測、人臉識別、商品識別的離線訓練(Training)環節能夠達到上百倍的效率提升。

而在應用推理(Inference)方面,當前,美團基於英偉達Tesla P4 GPU + TensorRT的搭配能讓計算效率提高數十倍。而且,美團目前使用的是FP32精度,未來如果使用英偉達T4 Tensor Core GPU進行FP16精度的推理計算,效能將進一步提升。這種低時延、高實時性的計算效能對於使用者與配送員的體驗非常重要。

對話美團AI視覺專家:GPU計算平臺全面升級,AI效率提高百倍

舉個例子,為了保障使用者的安全,當前美團日活的70萬名騎手都已經全面覆蓋了“刷臉認證”功能。但是這項功能為騎手多增加了一道驗證工序,對於效率與體驗都有影響。

因此,為了保證騎手的人臉比對效率,美團使用了基於GPU並行+TensorRT的方案進行大規模人臉比對的騎手身份驗證。相比於基於CPU方案,這套方案可以加速20倍以上,速度的提升能讓外賣小哥“刷臉認證”的過程更快捷、體驗更優秀。

魏曉明說,當前,美團伺服器叢集的AI視覺服務的日均呼叫已經達到了上億次。

三、美團AI的下一步

2018年,結合美團的計算平臺升級,美團AI視覺得到了超大規模的落地,覆蓋了上文提到的選單識別、人臉認證、刷臉支付、廣告生成等眾多集團內部應用場景。


對話美團AI視覺專家:GPU計算平臺全面升級,AI效率提高百倍

▲美團在CVPR2019-FGVC6商品識別比賽獲得第二名

從2019年開始,美團的AI視覺團隊已經不僅僅只支援集團內部的AI需求,還逐步在國際大型比賽上進行發聲。2019年,美團AI視覺團隊在CVPR、ICME等視覺屆知名比賽上都取得了Top3名次。

魏曉明認為,當前AI演算法依舊在快速迭代的過程中。對於美團這種大型平臺來說,持續對TensorFlow、Caffe、MXNet等多個深度學習框架進行迭代能夠提高計算並行化效率,對於美團特定AI場景的最佳化十分重要。

下一步,美團AI視覺團隊還將對影片理解、門店數字化、無人配送系統等更多AI場景落地進行擴充。

結語:AI應用全面爆發,實時性要求不斷提高

隨著AI應用的爆發,眾多企業都在進行AI計算平臺的升級,尤其是涉及刷臉認證、拍照資訊檢索等實時性要求較高的AI推理應用,傳統計算平臺已經不能滿足需求。

不知不覺間,AI已經逐漸滲透到了我們生活的方方面面,在你不經意間,也許已經享受到了AI帶來的生活便利。





來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29829936/viewspace-2657480/,如需轉載,請註明出處,否則將追究法律責任。

相關文章