雲中生智,智領前沿——雲端賦能下企業AI落地

京東科技開發者發表於2020-10-09

當前,大資料、物聯網、人工智慧雲端計算等智慧技術手段已經逐步成熟,並迎來“核聚變”發展態勢,萬物互聯、萬物互通的時代悄然而至,創新驅動發展,“智慧+”成了新引擎。

8月17日,“雲中升智,探索基於機器學習的AI業務最佳化實踐”京東智聯雲開發者社群技術沙龍在南京舉辦,來自京東英特爾的六位技術專家為參會者帶來了一場知識盛宴。

本期技術沙龍聚焦“機器學習”與“計算機視覺”,揭秘京東 AI 在智慧零售、智慧物流、智慧金融等領域的生態佈局與解決方案,講解京東拍照購、以圖搜圖、智慧鑑黃等技術的實現原理, Intel如何有效將 AI 部署到邊緣端。同時,展示基於容器技術的開發測試流水線的最佳實踐。

雲中生智慧 

— 探索基於機器學習的AI業務最佳化實踐 —

01

陳勇&馬廷衛

探索產創雲AI開發服務平臺

解讀基於 DevOps 的開發測試最佳實踐

今年,京東雲將智慧產業創新聚焦南京,將京東雲智慧產業華東區域總部落戶在南京,並在南京正式釋出“產業創新雲”。“產業創新雲”(以下簡稱“產創雲”)是基於京東自有的人工智慧、物聯網、雲端計算等技術能力,圍繞容器、開發測試流水線、微服務等雲原生技術構建的一站式支撐平臺。

來自京東雲的高階架構師陳勇及京東雲高階架構師馬廷衛,現場介紹了產創雲平臺的價值及支援政策,併為開發者解讀產創雲容器叢集及資源管理,解讀基於容器的 DevOps 的開發測試流水線最佳實踐。

產創雲從全雲化的技術架構上提供了IaaS資源、PaaS平臺以及SaaS應用,並將京東區塊鏈、AI、IoT相關的技術整合在此,開發者可以基於相關的技術,透過SDK在平臺上開發自己的產品。除此之外,產創雲圍繞產業鏈的研、採、供、銷、服五個階段,圍繞產品創新、產業孵化、產業加速、規模銷售,還有持續運營、可迴圈的幾個階段,助力創新企業發展,打造智慧產業叢集。

在產創雲的平臺架構設計上,京東雲設計了三個中心,包括資料的接入、技術的接入,中間圍繞軟體的生命週期,從軟體前期的需求、設計再到測試,再到部署。

為了幫助企業節約開發、測試、部署的時間,完成持續整合和部署,京東智聯雲設計了基於容器的CI/CD的開發測試流水線,藉助Kubernetes叢集服務,建立以容器為單位的開發測試部署流程,簡化了環境搭建的步驟,提高了資源利用效率和開發測試部署的速度,降低了遷移的成本。

02

宗婷婷

打造智慧商業體,解讀京東 AI 全景圖

大資料、區塊鏈人工智慧、資訊保安以及雲端計算被認為是數字經濟時代的五項核心技術。五大技術相互融合,共同推動數字新經濟的高速度高質量發展。在此趨勢下,京東作為以技術驅動、資料智慧為核心的科技企業,堅定地朝著技術轉型,致力於打造一個包括智慧零售、智慧金融、智慧保險、智慧城市、智慧醫療等在內的全球領先的智慧商業體。

京東智聯雲資深雲端計算佈道師宗婷婷,在現場為開發者解讀了京東 AI 在各個產業的生態佈局、京東 AI 各類落地場景和解決方案,並提供京東智聯雲對 AI 開發者的支援方案。

在五項核心技術中,雲端計算在數字經濟時代裡面承擔了整個產業的作業系統的角色,它是承載一切資源、能力、基礎和連線的大的業務平臺。而京東超級電商成就了超級雲,超級雲反過來又輔助超級電商。

在此基礎上,依託於京東集團範零售豐富的場景、洞察能力和技術沉澱,京東將具有產業屬性的AI能力全盤輸出,賦能夥伴,成就客戶。

智慧零售

智慧零售分為兩大部分:線上零售和線下零售。線上零售圍繞京東商城,包括以圖搜圖、拍照購、AI稽核、智慧客服等方案。其中,智慧客服作為京東非常成功的線上場景,提供一整套的解決方案,包括客服人工的智慧處理,後臺的各種客服大腦、大資料分析等一系列的服務。

比如有一個客戶想要發起一次客服活動,首先要進行前臺的預判,透過描述事情的嚴重程度和型別,結合客戶本身的資料,以及購物的資料,智慧客服會進行預判,決定把你分到人工客服還是AI輔助,還是完全AI客戶。

image.png

智慧供應鏈是零售企業的核心,決定了企業的競爭能力。傳統模式下,採銷人員要依靠資料和自身的經驗完成商品選擇、採購計劃制定、價格制定、庫存管理等複雜工作。隨著電商規模的迅速擴大,如果不能進行精準高效的供應鏈管理,不僅會降低零售企業的競爭力,更會造成包括上游製造企業在內的行業效率降低。京東從消費者洞察作為原點,藉助大資料和人工智慧技術的應用,融合過去14年的零售經驗積累,與各方合作伙伴一起,打造敏捷、智慧、開放的智慧零售供應鏈。

image.png

智慧物流

京東的智物能流是一個完整的體系,無人倉解決進貨、揀貨、包裝等環節,無人車主攻城市環境下的最後一公里配送,無人機則鎖定鄉村配送。

無人倉作為全新一代智慧物流技術,其核心特色體現為資料感知、機器人融入和演算法指導生產,可以全面改變目前倉儲的執行模式,極大提升效率並降低人力消耗。從商品入庫、儲存揀貨、包裝、分揀、裝車的環節都無需人力參與,搬運機器人成了無人倉的主角。京東於2017年在上海打造中小型無人倉,單倉的產能超過20萬單。2018年進入無人倉裝置的常態化和規模化應用的一年,大量的智慧化裝置在物流的倉庫開始應用。

除此之外,京東擁有多場景無人智慧產品,如末端配送機器人、巡檢機器人、干支線自動駕駛貨車、服務機器人等。作為智慧物流體系的重要一環,末端的京東配送機器人自2017年在人大、清華、浙大、長安幾所高校就開始進行配送實驗,未來還會在全國各地的封閉式園區、校園,類似於生態城這種開放式的城市道路配送,並邁向普通社會化道路,解決城市配送最後一公里難題。

智慧金融

京東智慧金融服務將傳統的風控體系智慧化,依託京東龐大的使用者和交易量資料以及關聯外部合作伙伴洞察資源,在註冊、登入、營銷、交易等多個核心場景建立標籤和策略,其全魔方產品,能夠實現對申請欺詐、信用欺詐、賬戶盜用、洗錢、羊毛黨、虛假交易及黑產等行為的防範。

智慧保險

在保險方面, 京東安聯已經嘗試利用大資料及人工智慧,來改變傳統核保理賠的方式。另外,京東安聯將逐步使用AI機器人替代傳統客服,一個機器人的成本相當於人工成本的10分之一,AI技術部署演算法越多,它的學習能力越強,成本也就越低。

同時京東安聯也正在嘗試透過一系列的技術手段,最佳化保險交易的各個環節,使產品更簡單易懂,流程變得更為順暢。

image.png03

於偉

看得見的AI,計算機視覺的原理及最佳實踐

作為人工智慧最火熱的細分領域之一,無論是智慧零售還是智慧物流,都離不開計算機視覺技術的應用。來自京東人工智慧業務部研究員於偉,在現場以京東智慧零售場景為基礎,向開發者解讀人工智慧在視覺領域的技術原理,並介紹了京東拍照購、以圖搜圖、商品識別、智慧鑑黃等計算機視覺技術的最佳實踐。

如下圖所示,京東現有計算機視覺技術的概覽可以分成五部分,由上至下分別為,文字識別、人體、人臉、影片和影像。

image.png

在智慧零售中,依靠領先的視覺演算法、海量的有效資料、穩定的服務架構,京東計算機視覺技術在多模態購物、內容稽核、創新應用、Neuhub開放平臺四個場景中得到了成功的運用案例。

拍照購

首先是多模態購物——拍照購,拍照購的應用場景分為京東雲APP及拍照購小程式,作為幫助導購的索引以SDK的形式快速整合到其他的應用當中。

其中,拍照購主要面臨商品形變、商品拍攝角度不同、商品包裝不同、商品狀態不同、商品類別不同等技術挑。計算機視覺技術的目的就是要消除目標商品與拍攝商品的不一致性,將不同場景下的相應商品對應起來。拍照購的框架分為線上及線下兩部分,涉及商品主體完整度判別、商品清晰度判別以及優質透底圖的判別等步驟。

除此之外,拍照購可自動定點陣圖像的商品主體,給出商品主體框座標、檢測置信度、類別等資訊,覆蓋裙裝、上衣、下衣、鞋子、數碼、食品、美妝、圖書、藥品、綠植等24個品類,並支援多商品主體檢測,可輸出多個商品主體,區分不同商品主體的顯著性。

內容稽核

內容稽核的出發點主要是為了規避公安系統的風險事件的發生,提高圖片質量,提高使用者體驗,以及降低人工成本。

智慧鑑黃,可以自動識別黃圖、性感、低俗和正常圖片,是圖片內容合規稽核的重要組成部分,減少人工成本,提高稽核效率,具體流程如下圖所示.

image.png

依託電商場景海量豐富的資料,京東的智慧鑑黃準確率高達99%,可根據業務自身進行配置,自定義閾值,靈活度高,可支援對電商,社交,影片等多場景進行安全稽核。

與上述方法類似,京東的內容稽核場景還包括特定人物識別、刀具槍支稽核、牛皮鮮識別以及不適圖識別等場景。

04

張星

人工智慧部署到邊緣裝置

英特爾® Movidius™ VPU全解讀

計算機視覺深度學習正在成為我們日常生活中的數十億裝置的標配。讓裝置具備類似於人類的視覺與智慧,是計算領域的下一波重大進步。英特爾® Movidius™ VPU可以有效的將人工智慧技術部署到物聯網裝置邊緣端。

來自英特爾物聯網事業部VPU平臺應用工程師張星,為開發者介紹了Myriad X 和第二代神經計算棒,解讀了英特爾® Movidius™ VPU 特性、能力以及應用場景,並分享英特爾邊緣計算產品的最佳實踐案例。

Myriad X是英特爾Movidius最新一代的VPU,它是一款低功耗的SoC,可以用在高能效圖象處理、計算機視覺深度學習的裝置裡面,包括服務機器人、監控攝像頭、可穿戴裝置、無人機、AR-VR頭盔和智慧家居裝置等。相比上一代產品Myriad 2,Myriad X多了一個神經計算引擎(Neural Compute Engine),這是一個整合在晶片上的DNN加速器。有了這個加速器,深度學習推斷吞吐量可以達到1TOPS,也就是每秒超過1萬億次運算,理論峰值可以達到4TOPS。英特爾Movidius VPU的微小尺寸和優越的每瓦特計算效能極大的滿足了廣大使用者對計算機視覺深度學習在終端裝置上的需求。

image.png

當下,大部分開發者已經有了經過訓練的網路模型,但是由於推理平臺能力有限,只能把網路模型的一部分放到推理平臺之上,又或者想要提升終端效能但不知道該如何選型,以及目前使用的人工智慧框架不被英特爾的產品支援,無法匯入到Movidius或者FPGA平臺。

而OpenVINO正是為解決如上問題所推出的,它是一個高效能計算機視覺深度學習視覺應用開發的工具套件,能夠支援英特爾平臺的各種加速器,包括CPU、GPU、FPGA以及Movidius的VPU等,支援異構計算,並可幫助開發者把已經訓練好的網路模型部署到目標平臺之上進行推理操作。

隨後,張星向開發者介紹了英特爾第二代神經計算棒——NCS2。英特爾NCS2基於英特爾Movidius Myriad X視覺處理單元(VPU),並得到英特爾 OpenVINO工具包的支援,與上一代神經計算棒相比效能更優,能夠以可負擔的成本加快深度神經網路推理應用的開發。同時,英特爾NCS2支援深度神經網路測試、調整和原型製作,可以幫助開發者進入實際應用的量產階段。

近年來,京東不斷運用深度學習度量學習等 AI 領域知識最佳化自身電商平臺,讓其從冷冰冰的系統不斷成長為越來越懂使用者的智慧購物助手。

05

陳東東

基於機器學習的智慧營銷人貨匹配技術

來自京東人工智慧業務部演算法工程師陳東東,在現場展示了機器學習在人貨匹配中的核心應用,包括使用者需求預測、使用者及商品網路相似度學習,使用者商品匹配學習,並對度量學習基本方法及其在電商平臺的應用進行介紹。

人貨匹配模型

人貨匹配模型是指在一個確定場景任務下,計算使用者與商品的匹配程度 。經典的應用場景包括智慧廣告投放、智慧客服排程、使用者需求預測等。

假設需要預測一位使用者是否會購買產品。方案一為利用客戶的歷史資料做0/1分類,但是該方案沒有考慮到商品的特點;方案二在方案一的基礎上將使用者的歷史行為資料結合商品的屬性做一個分類,但是該方法在開始的時候就將使用者和商品進行了特徵的串聯,由於使用者和商品來自不同的空間,所以直接串聯是不太合適的,於是京東AI將方案二進一步最佳化,在同一個公共子空間計算使用者和商品的匹配程度。

如下圖所示,假設分別對使用者和商品透過兩個深度神經網路投影到一個公共子空間下,而後訓練資料透過一些簡單的距離計算方式判別使用者和商品之間的匹配程度。當模型訓練過後,把距離透過一個F函式,F函式將距離轉化為0到1的機率,用這個值表示使用者對商品的購買機率。再基於這個機率構造一個損失函式,這樣訓練完模型之後,就可以得到對購買機率的一個預測值。

image.png

與前兩種方法相比,京東AI的方案可以使得Embedding有意義 ,可以加入商品相似度的資訊,利用使用者的加購、收藏等更多的標記資訊,同時能對新品表示出更好的泛化能力。

那麼相似的商品是如何學習的呢?

如下圖所示,假設已經事先知道商品X和Y之間是比商品X和Z更相似,也就是X和Y之間的距離比X和Z更小。這種情況下,京東同時把三個商品透過共享權重的深度網路,得到三個向量,然後直接在得到的Embedding的空間去約束它們之間的距離關係。這就要求X和Y相似商品之間的距離至少比X和Z的距離小於Margin β,基於這樣的Margin loss去加入到約束裡面,更好的學習網路I。

image.png

可能有人會問了,如果我已經知道兩個商品是相似的,為什麼還要重複的再加一個網路去學習?這裡有一個很重要的一點,如果來的是一個新的品類,你並不知道這個新的品類和哪些商品是相似的,如果你學習了這樣的網路,把這個新品透過這個網路就可以很好的得到它的Embedding,就可以計算它和原來的相似性。

深度度量學習

度量學習也叫作相似度學習。度量學習旨在學習一個恰當的相似性(距離)度量,使相同類別樣本之間的相似度增大(或距離減小),不同類別樣本之間的相似度減小(或距離增大),從而實現提高分類器的判別能力、改善匹配及聚類效能等目的。而深度度量學習則是利用深度神經網路去學習距離度量的表示。

深度度量學習主要關注兩個問題:損失函式如何設計以及怎樣對樣本進行取樣。

image.png

雖然看起來是比較簡單的loss,但是這裡面產生了大量的變體。第一類變體主要集中於DIJ怎麼去計算,最基本的是用歐式距離計算DIJ,還有曼哈頓距離、餘弦距離,或者卡方距離計算DIJ。

Triplet-style loss它的輸入是針對三元組,在變換之後的空間裡面要求兩個相對更近的商品之間的距離,比兩個沒有那麼近的距離小於一個margin α,基於這樣的loss去求網路的引數

image.png

在分享最後,陳東東向開發者介紹了當前度量學習的熱點——如何更好地擴充套件度量空間。他認為,一種是生成虛擬樣本,雖然沒有見過測試集樣本,但是可以基於已有的訓練集生成更多的樣本,可採用生成式的方法生成樣本,也可以用幾何的方法生成樣本;另一種是整合學習的方法,可透過輸入資料、輸出標記、模型引數生成多樣性,擴充套件度量空間。

此次活動吸引了200名開發者的到場參與,大家從雲端計算人工智慧、IT運維等專業領域,暢談智慧時代的熱點和產業趨勢,並高度評價此次活動。

相關文章