探索新零售時代背後的技術變革

個推開發者發表於2018-12-20

原文網址 : https://juejin.im/post/5c1b399ee51d4530734860d8

隨著線下場景佈局的不斷髮展，以及線上技術的持續推進，一個真正屬於新零售的時代已經來臨。

走完了廣州、成都、北京、深圳等四大城市後，個推技術沙龍TechDay於上海完美收官。來自京東到家、個推、億咖通、Pinlan的技術大咖們，在上海站的現場，為大家解析並展示了新零售時代下的新技術。

《大資料時代，使用者畫像實踐與應用》
葉政君個推大資料分析師

使用者畫像，即使用者資訊的標籤化，本質上來說，使用者畫像是資料的標籤化。常見的使用者畫像體系有三種：結構化體系、非結構化體系和半結構化體系。非結構化體系沒有明顯的層級，較為獨立。半結構化層次有一定的層級概念，但是沒有過於嚴格的依賴關係。在電商行業中，較多的企業會選擇半結構化的使用者畫像體系進行應用。以一個簡單的三級結構化標籤為例，一級標籤有基本屬性和興趣偏好，並且由此可以延伸至二級標籤和三級標籤，具體到哪些屬性、興趣。

在畫像建設方面，開發者們可以參考一些通用的做法，如標籤體系設計、基礎資料收集和多資料來源資料融合、實現使用者統一標識、構建使用者畫像特徵層、畫像標籤規則+演算法建模、對所有使用者進行演算法打標籤和畫像質量監控等。

個推使用者畫像構建的整體流程，可以分為三個部分，第一，基礎資料處理。基礎資料包括裝置資訊、線上APP偏好資料和線下場景資料。第二，畫像中間資料處理。處理結果包括線上APP偏好特徵和線下場景特徵等。第三，畫像資訊表。表中應有四種資訊：裝置基礎屬性、使用者基礎畫像、使用者興趣畫像和使用者其它畫像。同時，使用者畫像的構建需要技術和業務人員的共同參與，避免形式化的使用者畫像。

在進行使用者畫像構建的過程中，個推主要運用到的技術有資料儲存、實時計算、機器學習和深度學習。

而使用者畫像的應用則包括：精準營銷、使用者分析、資料探勘、服務產品、行業報告以及使用者研究。

針對新零售時代下，APP的運營者對於使用者畫像的需求，個推依託多年推送服務的積累和強大的大資料能力，推出了使用者畫像產品“個像”，為APP開發者提供豐富的使用者畫像資料以及實時的場景識別能力。

同時，個推獨有的冷、熱、溫資料標籤，也可以有效分析使用者的線上線下行為，挖掘使用者特徵，助力APP運營者篩選目標人群。同時，個推還可以為APP提供定製化標籤，滿足APP運營者在使用者數字化管理方面的需求。

在實踐中，定製化標籤的整合也有一定的難度，個推會結合雙方的資料，對其進行建模分析，輸出定製化標籤。總的來說，個推不僅有通用的標籤維度，也有定製化標籤的輸出能力。

舉兩個使用者畫像在個推業務中的典型應用：第一，精準推薦，APP的運營者可以通過個像提供的性別、年齡層次、興趣愛好等標籤，分別展示不同的內容給使用者，以達到精準化運營，千人千面。

第二，使用者聚類，處理客戶提供的使用者資料，補全使用者畫像，最終進行使用者聚類分析。

《即時物流場景下的機器學習實踐》
莊學坤達達-京東到家物流演算法團隊Leader

即時物流作為新零售的“水電煤”，在新零售模式中處於基礎核心環節，解決的是商品的配送效率問題。達達-京東到家作為國內即時物流的領先平臺，在這方面進行了大量的技術探索與積累。與傳統物流模式相比，即時物流場景下的配送具有更高的複雜度，具體表現為以下四點：1. 訂單型別多樣化；2. 時效性要求更高；3. 配送騎士的運力難以掌控；4.送達目的地複雜多樣。而即時物流形式中存在的問題和挑戰，也可以總結為四個部分：高度動態的物流訂單、配送成本的動態性、訂單派發需要兼顧公平與效率、騎士自由搶單的管理。

現如今，新的演算法模型層出不窮，演算法可以選擇的自由度較高。但是在實踐中，資料決定了機器學習的上限，而演算法只是儘可能逼近這個上限。一個成功而實用的演算法體系，必須非常重視特徵工程。開發者研發一套優秀演算法體系的前提，是獲取到優質的、具有精確特徵的資料。達達結合自身的配送場景，積累了海量而精確的配送場景特徵集合。

沒有最好的演算法，只有某種場景下最合適的演算法。在獲取到特徵資料之後，即時物流場景所應用的機器學習體系可以分為四層：基礎資料層、特徵工程層、演算法模型層、業務應用層。開發團隊還需要根據業務的應用場景，對不同的演算法模型進行技術選型，比如線性模型擅長處理高維微觀特徵，非線性模型則擅長處理較低維的巨集觀特徵，而在路徑規劃與排程當中，傳統的運籌學模型動態規劃等可能更加合適。

最後，更加通用的AI可以由兩部分組成，第一部分是深度學習(DeepLearning)，解決端對端的學習問題；第二部分稱之為強化學習(Reinforcement Learning)，允許更加通用的學習架構。如果這兩個部分結合到一起，就可以變為一個非常通用的學習演算法。達達智慧供需調控系統的設計中，借鑑了AlphaGo的思路，充分發揮了這種模式的優勢，使得調控效率的效果和自動化程度同時獲得了大幅提升。

《使用智慧對話機器人增強新零售服務鏈》
孔曉泉吉利集團Ecarx演算法專家

與以往的零售方式不同的地方在於，新零售的過程中，沒有商超反饋和中間鏈條，企業需要直達顧客。這會使得一個to C企業，在客服和相關支援等方面，花費更多的成本，並且承擔很大的壓力。而使用智慧對話機器人提供新零售的服務鏈，則可以減少使用者的等待時間，提高使用者體驗，並且極大地減低公司的客服成本。智慧對話機器人應用最多的領域是線上客服，其次是智慧問答，如智慧醫療等。

從技術角度來說，人機對話的流程是：語音識別（ASR）、基於文字的方式進行自然語言理解（NLU）、通過理解到的意圖或實體進行對話管理（DM）、自然語言生成（NLG）和語音合成（TTS）。

企業可以選擇Rasa Stack作為構建智慧對話機器人的基礎，它是一款開源的、基於機器學習的、為開發者和公司設計的機器人，智慧性較高。由於對話機器人的軟體開發難度很高，自然語言的理解需要很多元件的配合，而Rasa Stack的優勢是完全的資料控制、自行擴充、自定義模型和完全的自驅動，並且其背靠德國的Rasa Technologies GmbH，有一定的發展保障。

Rasa NLU能夠提取使用者的意圖和相關的實體，這相當於把使用者千奇百怪的、非結構化的、長短不一的資料轉化成結構化資料。Rasa NLU的特色是基於 pipeline 的工作模式，擴充套件能力強，並且支援多種語言，如英語、德語、中文、日文等，RASA NLU還內建多種演算法和配置，如MITIE、CRF、Embedding等。

RASA Core則是一個對話管理體系，如下圖所示，圖中的每一個箭頭都代表資料的流動。

Rasa Core的特性是資料驅動、擴充套件能力強、支援多種Policy協同工作、內建多種演算法和配置，並且支援Interactive learning.

實際上，強化學習不僅是一種框架，它還提供了演算法和配置，但是具體的做法和引數調節，還需要在實踐場景下進行確定。另外，互動式學習能夠很快地測試到，使用者所得到的回覆是否正確，並在錯誤的情況下，進行相應的更改。

《AI賦能營銷數字轉化轉型》
李澤洲 Pinlan聯合創始人兼CTO

當前，線下營銷正在從以零售商為中心，轉化成以購物者為中心的形式。而在這其中，機器視覺的落地，也對整個零售行業的轉變起到了很大的推動作用。

計算機視覺是一個跨學科的領域，涉及到如何使計算機從數字影象或視訊中，獲得高層次的理解。硬體和演算法的進步均催生了大量計算機視覺的應用落地。

在深度學習進入到計算機視覺的領域之前，計算機視覺技術主要被應用於影象處理、特徵檢測和匹配以及運動估計。

隨著深度學習網路的發展，傳統的神經網路很難被單純地應用到計算機視覺領域。影象的緯度很大，而人的觀察方式是對影象當中的某個區域性資訊，進行認真的觀察之後，才會逐漸地觀察到全域性資訊。

機器學習的流程是資料採集、資料預處理、模型訓練、模型測試和模型服務。其中，零售行業的零售商更關心的是，SKU在超市中鋪貨時，是如何擺放的。

線下零售商有兩種方式可以進行資料採集。方式一是利用手持終端（SFA）採集資料；方式二是在超市中架設攝像頭，進行固定場景的拍攝。方式二相較於方式一，有一定的優勢存在，如可選擇高畫素攝像頭，影象質量高；固定場景下的拍攝，變化較小；資料可用性高；模型可以確保細粒度商品的識別。

在資料預處理階段，也有兩種方式可以對已採集的影象資料資訊進行處理，方式一是提高影象質量，如調整亮度、對比度，對影象進行去模糊、超解析度重建等。

方式二是訓練影象增強，在AI的實現過程中，在訓練CNN網路之前，對資料進行增強是一個非常重要的環節。一般情況下，現實場景中所能收集到的資料量不是很大，這對於深度學習來說是一個致命的問題，這時便可以利用影象增強或者影象資料的擴充，增加資料量，如影象裁剪、影象對比度變化、影象亮度變化和影象微旋轉。

在商品檢測模型訓練的階段，目前前沿的演算法框架包括 Faster-RCNN、RetinaNet和YOLO等。

通用商品檢測模型能夠支援海量的多種包裝類別實際場景資料，可以針對大小目標和不同包裝類別，進行大類拆分，並且能夠優化模型結構，增強場景適應性。同時，通用商品檢測模型可以實現移動端壓縮，支援移動端檢測。

而細粒度商品識別模型訓練則需要先收集海量SKU資料，建立商品資料庫，之後結合注意力機制，訓練細粒度識別模型，然後在真實場景驗證模型效果。在實踐中，Pinlan的細粒度商品識別模型，已經能夠使自然場景商品識別準確率提升至97%.

建立檢測模型和識別模型之後，開發者可以將兩者進行結合，進行線下零售的智慧陳列分析，如陳列位置檢查、數量檢查、陳列規範檢查和陳列推薦。

以資料驅動的新零售時代已經來臨，面臨零售場所和消費觀念的轉變，傳統零售需要整合和重組，充分地利用電子商務、大資料雲平臺、移動網際網路和人工智慧等技術，讓線上線下一體化成為可能。

新零售進入“無限貨找人”時代，背後技術架構如何調整？
2018-05-29
架構
飛豬：消費者驅動新零售時代酒店變革
2018-04-18
TGDC | 探索人臉藝術背後的技術
2020-12-22
變革催化劑：技術型產業的新常態
2020-07-07
產業
詳解Windows 11背後的技術創新
2022-01-29
Windows
阿里雲研究中心：AI時代零售業的智慧變革（附下載）
2018-06-29
阿里AI
讀人工智慧時代與人類未來筆記02_技術變革
2024-05-14
人工智慧筆記
後 App 時代的輕應用技術
2022-08-18
APP
社交新零售時代，你的商業模式要變了！
2022-01-19
模式
探索ChatGPT和新的AI時代
2023-03-30
ChatGPTAI
深度解讀後疫情時代下，零售行業的趨勢及技術前瞻
2020-03-10
行業
蘇寧技術研究院：後疫情時代的零售行業趨勢及技術前瞻（附下載）
2020-04-16
行業
JDV背後的技術-助力618
2023-10-11
浪潮儲存以技術探索新資料時代，智慧未來讓人期待
2020-12-03
新零售趨勢下企業的變革轉型之路
2021-10-29
探索新技術機制
2024-03-29
探索雲原生時代：技術驅動的業務架構革新
2024-03-22
架構
走進新時代：在化工行業的變革中與時俱進開創未來
2019-05-26
行業
Google DNS劫持背後的技術分析
2020-08-19
GoDNS
深挖谷歌 DeepMind 和它背後的技術
2020-04-16
谷歌
歐尚中國更名背後的零售業變局
2021-07-05
新零售報告：供應鏈變革下的新產物（附下載）
2018-09-17
以“技術應變”之道，角逐後疫情時代企業數字化轉型
2020-08-25
新興技術驅動網路安全產業變革態勢感知技術化身“生產力”
2018-03-05
產業
ChatGPT 背後核心技術的白話版
2023-02-09
ChatGPT
10086小姐姐的問好背後，藏著雲與計算的時代鉅變
2020-07-21
適時應變，趨勢而行：數字時代汽車營銷變革
2022-03-17
完美世界蕭泓論述5G時代數字文創新變革
2020-07-30
“ABC”時代，IT變革下的驅動資料價值之路
2018-03-06
大資料開啟了新的時代變革，數字化智慧經營已成為應對這場變革的最佳解決方案。
2022-01-13
大資料
抵禦網路攻擊的背後——成熟創新的技術是關鍵
2022-11-28
從“模式創新”到“科技破局”，雲從科技如何穿越時代變革週期？
2022-05-24
模式
人臉識別背後：可怕的不是技術
2020-01-12
滴滴AR實景導航背後的技術
2020-09-11
揭祕.NET Core剪裁器背後的技術
2022-03-21
GIFTO背後區塊鏈技術的分類
2021-07-29
區塊鏈
AIGC時代下資料中心運維的變革與挑戰
2024-01-29
AIGC運維
前端技術選型及背後思考
2019-05-04
前端

探索新零售時代背後的技術變革

《大資料時代，使用者畫像實踐與應用》葉政君 個推大資料分析師

《即時物流場景下的機器學習實踐》莊學坤 達達-京東到家 物流演算法團隊Leader

《使用智慧對話機器人增強新零售服務鏈》孔曉泉 吉利集團Ecarx演算法專家

《AI賦能營銷數字轉化轉型》李澤洲 Pinlan聯合創始人兼CTO

相關文章

《大資料時代，使用者畫像實踐與應用》
葉政君個推大資料分析師

《即時物流場景下的機器學習實踐》
莊學坤達達-京東到家物流演算法團隊Leader

《使用智慧對話機器人增強新零售服務鏈》
孔曉泉吉利集團Ecarx演算法專家

《AI賦能營銷數字轉化轉型》
李澤洲 Pinlan聯合創始人兼CTO