京東雙11超級工程:AI成為交易平臺備戰主力

tianxiaoxu發表於2018-05-07

每年雙十一,不僅是剁手族的狂歡節,更是各大電商技術團隊技術水平與技術創新實踐檢驗的舞臺,不斷創新高的銷售額、交易峰值、支付峰值,這些驚人數字的背後都離不開強力的技術支撐。IT168希望通過技術報導的形式向讀者揭祕各大電商平臺在雙十一這一“超級工程”背後的鉅額投入與技術創新,讓更多人瞭解技術,尊重技術,促進同行業之間的技術交流分享,推動提高行業整體技術水平。

  本文摘要:

  2017年的雙十一大促是京東第四次零售革命的一場“大閱兵”。這次“閱兵”京東大手筆的佈局了線下市場,超過160家京東之家和京東專賣店、近200家京東母嬰體驗店、超過1700家京東幫服務店,超過5000家京東家電專賣店,以及沃爾瑪在全國的400餘家門店、京東合作品牌商家的近萬家門店以及接入京東掌櫃寶的數十萬家便利店都參與其中。

  經過了歷年618和雙十一大促的多次磨練與考驗,京東交易平臺在應對超高併發、超大流量方面顯然已經遊刃有餘。今年的雙十一,京東重筆墨落在精細化和人工智慧,對技術保障、GMV提升、使用者體驗等多方面進行了智慧化升級。

  作者:王曉烽

AI成為京東交易平臺雙11備戰新主力

  作者簡介:王曉烽,京東商城交易平臺架構師,負責交易平臺基礎架構規劃,在應對大流量、高併發、低延時、高可用系統設計方面有豐富經驗。

  正文:

  經過了歷年618和雙十一大促的多次磨練與考驗,京東交易平臺在應對超高併發、超大流量的大促系統穩定性技術保障方面已經遊刃有餘。整體上來說,系統穩定性主要是從高效能和高可用兩大方面著手。

  京東商城交易平臺提供使用者、商品、庫存、價格、促銷、優惠券等基礎核心服務,提供購物車、結算頁、訂單中心等黃金交易流程的平臺化服務,提供包括PC、APP、微信、手Q、開普勒等全渠道服務。

  最近一年,我們主要深耕精細化,對技術保障、GMV提升、使用者體驗等多方面進行了智慧化升級,本文我們就從技術保障和技術驅動業務兩方面作分享。

  京東雙十一超級工程的技術保障

  動態負載均衡和動態限流是流量智慧調撥的兩大應用

  流量智慧調撥目前主要應用於兩方面,一是動態負載均衡,一是動態限流。

  負載均衡演算法在我們內部主要是基於隨機和輪詢兩種方式,每年擴容伺服器規格可能都不一致,硬體效能有高有低,組成一個大叢集時,無論隨機還是輪詢都會有木桶效應,即整個叢集效能由硬體規格最低的伺服器決定。

  我們之前是通過預先配置權重或者歸類同規格機器“曲線救國”。這種方法在叢集規模小時還比較可行,但隨著叢集規模的不斷增大,這個過程不僅變得費時費力,還非常脆弱,極易出錯,在大規模容器化時代更難以人工處理。因此,我們迫切需要負載均衡能動態識別伺服器的承載能力,並自動調整其權重。

  流量限制是為了在遇到流量突增時,把流量速率限制在系統所能承受的合理範圍之內,不至於讓系統被瞬時流量擊垮。我們通過全鏈路壓測已經能夠比較精準估算出系統擴容需求,然而凡事都有萬一,因此還需要做好限流準備。常見限流維度有訪問量和併發數,此外還有平滑限流演算法,例如漏桶(Leaky Bucket)和令牌桶(Token Bucket)演算法,我們通常都是結合起來使用。

  這些策略和演算法通常是根據壓測值預先估算的一個安全閾值進行靜態配置,但實際執行環境往往是非常複雜多變的,訪問量、併發數可能還沒有達到安全閾值系統就扛不住了,此時再人工干預調整閾值已經來不及了。因此,我們同樣需要限流器能動態識別伺服器的承載能力,並自動調整閾值。

  我們通過綜合計算CPU使用率、CPU Load、TCP連線數、響應延時等系統與應用效能指標,可以實時計算伺服器負載能力與健康狀態,實時反饋到負載均衡器和限流器,實現流量智慧調撥,既能最大限度提升資源利用率,又能賦予其足夠的安全防護。

  從自導自演到對抗軍演再到自助式演練,京東故障演練再升級

  去年雙十一備戰時我們的故障演練已經從“自導自演”升格為“對抗軍演”,分為紅藍攻守兩軍,分別負責故障恢復和故障製造。藍軍獨立設計演習科目,紅軍事先並不知道,只會被告知在某個時間段發起“攻擊”。指揮部要求必須在5分鐘內識別故障點,準確執行預案,並有效恢復系統,這樣考核才算及格。

  今年我們的故障演練已經直接升級到了自助式,藍軍可以自主在軍演系統內自行選擇目標應用、目標叢集,可以隨機選擇目標機器,可以組合多應用、多叢集,組合多種故障,包括網路丟包、埠不通,CPU、記憶體、磁碟使用率飈高,Docker例項當機、Redis例項當機等等故障,可以即刻執行,亦可“埋彈”定時執行,甚至可以通過假報警釋放“煙霧彈”。這樣不僅解決了大量的人工干預與互動,更重要的是讓故障案例更加隨機,更加真實,更能如實檢驗預案的可行性、完備性,極大考驗了應急團隊處理故障的心理素質以及處理隨機事件的響應能力。

  技術驅動業務,京東交易平臺智慧化升級

  雙十一大促的成功同樣離不開大資料和智慧演算法的支援,交易平臺強大的產品設計和系統研發能力在這場“大閱兵”中功不可沒。交易平臺在原有的業務系統上,不斷進行資料的智慧化升級;同時,在原有的交易產品線基礎上,陸續推出了針對使用者體驗、針對品牌商、針對採銷的智慧營銷產品線。

  智選精靈,讓你的商品最超值

  智選精靈屬於基礎產品線的智慧化升級,其一期主要包含兩個產品,一是購物車為使用者智慧選擇最優的促銷,一是結算頁為使用者智慧選擇最佳的優惠券。

  京東營銷活動中,無論是促銷還是優惠券,都會出現一個SKU或多個SKU可以同時滿足多個促銷或多張優惠券,此外還有品類維度、商家維度,反之亦然。因此無論求最佳優惠券還是最優促銷,其實都是一個求組合最優解的過程。

  當資料量少,規則集小的時候,這個組合結果集相對較小,計算複雜度低,甚至不用系統計算,使用者自己就能識別,並沒有使用者體驗的問題。當資料量大時,特別是像京東目前有海量SKU,購物車可以同時加入上百SKU,各式各樣的促銷優惠規則,既有滿減又有贈品,促銷和券還可以疊加,每個使用者可以領到上千張優惠券。此時,系統就面臨兩難了:如果不能為使用者做出最優選擇,使用者購物時就得開“腦洞”了;如果要做,直接常規暴力窮舉尋找最佳優惠將是一個海量的計算過程,開銷非常大,可能還沒算出來,前端呼叫早就超時。

  此時智慧演算法的作用就凸顯了。

  在數理上,對於任一給定的隨機問題,總有一個最優解。智慧演算法的任務就是尋找這一個解,最大程度的等於或者接近數理上的最優解。換句話說,我們的工作有點像打靶,10環的最中心是完全命中,但是9.999環同樣是好成績。9.999環意味著,如果理論最優值是1000元,我們計算到了999.9元。更重要的是,對於比較大的問題,最優解永遠是不可知的,採用窮舉的方式可能需要幾天、幾年、乃至幾萬年。

AI成為京東交易平臺雙11備戰新主力

  通過對智慧演算法的不斷調優,智選促銷和智選優惠券精確度分佈在95%到100%之間,最保守概率是97.2%,同時在效能上能夠維持在5毫秒以內,極大提升了使用者體驗,進而極大提高了轉化率。。

  智慧營銷,牢牢鎖定潛在使用者

  除了原有功能的智慧化升級,交易平臺還陸續推出了包含京東專享、拉新復購神器等等與交易平臺深度結合的智慧系統,大大提升了採銷運營的靈活度、產出和效率。以前,採銷只能通過業務經驗,選擇相應的使用者標籤和使用者畫像組合成想要營銷的使用者包,然後通過簡訊或者頁面的方式觸達使用者。這個過程,極度依賴採銷的業務判斷,一旦判斷有偏差,就會造成效果的偏差。

  正是基於這個業務訴求,交易平臺推出了智慧營銷產品線。

  以京東專享這個產品為例,這個產品一經推出,就在採銷中引起了巨大的反響和熱情。其中,最令人矚目的就是這個產品的內在核心“高潛使用者模型”,該資料模型以使用者、商品和行為資料為基礎,建模團隊通過資料探勘的技術和機器學習的演算法,構建使用者購買商品的預測模型,輸出高潛使用者和目標商品。

  這個邏輯看似簡單,但是實現高精度的準確率非常困難。因為使用者在購物過程中的行為會受到多種因素的同時作用影響,這其中包含價格、商品、渠道、促銷活動等等,模型需要高頻訓練,才能適應市場的多樣變化。

  當前,高潛使用者模型對品類甄別的準確率高達80%,其中煙灶、熱水器等剛需品類的預測準確率可達85%以上。對購買SKU預測準確率超過50%,品類較為簡單的煙灶等品類,SKU預測準確率可達80%。基本做到了“猜使用者想買什麼,使用者就買什麼”。兩年間,高潛使用者模型不斷擴大預測品類,被更多的採銷應用在日常和大促的促銷活動中。

  除了準確的資料模型之外,搶客系統還是採銷最得力的“智慧促銷工具”。通過接通不同的促銷方式,如令牌、優惠券、預約預售、秒殺等,採銷能夠靈活使用高潛使用者資料,為每個使用者定製專屬的最優促銷方案,即:不同的使用者匹配不同的商品,適用不同的價格,實現真正的千人千促、千人千觸。

  非大促期間,採銷能夠利用智慧模型和系統,更精準的定位高潛人群,並在系統操作建立專屬促銷和專屬觸達,讓使用者感受到京東的差異化渠道優勢,實現搶奪那些“在京東瀏覽但即將在其他渠道下單”使用者的目標,挽留即將流失的京東高概率購買使用者。

  大促期間,由於渠道間競爭激烈,很多使用者跨渠道瀏覽比價,極易流失;同時,採銷為了能夠及時應對競手渠道的營銷策略,對促銷方式的靈活性也有更高的要求。此時,圍繞使用者的智慧促銷系統就十分必要。通過智慧系統,採銷能夠將已經鎖定的促銷商品和促銷價格(如預約商品等),提前釋放給已經識別的高潛使用者,助力品牌商將使用者牢牢鎖定。同時,智慧系統也給採銷更多靈活操作的機會,以便應對更多樣化的市場需求。

  人工智慧成為京東技術新主力

  人工智慧正以前所未有的姿態洶湧而來,快速進入人們的視野。京東一直致力於用技術驅動業務成長,全面提高使用者體驗。隨著人工智慧等技術在京東的全面應用,在業務與技術領域越來越多的以往靠人海戰術解決的問題會逐步被機器接手,讓技術人員發揮更大的創造性,在保障系統穩定性的同時,提高運營效率,大幅降低成本,提升使用者體驗。

  “雙十一”超級工程系列專題下期預告:

  資料時代,大資料計算已經滲透到了各行各業,業務沉澱資料,資料計算產生新的業務價值,大資料計算正不斷地用這種方式推動業務向前發展。那麼面對雙十一大促這樣一個高併發、高流量、極具特色的業務場景,大資料實時計算又有哪些用武之地呢?敬請期待下期網易雲資深技術專家帶來的《網易雙11“超級工程”:大資料實時計算如何為你量身定製?》的分享。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31137683/viewspace-2153932/,如需轉載,請註明出處,否則將追究法律責任。

相關文章