今天購物的你看評價了嗎?
新發布的小米MIX 2是否依舊是一款女生貼心的暖寶寶,眾多國產廠商嘲笑的 iPhone X 劉海屏,使用者的真實體驗如何;心儀的霓裳羽衣裙,自己穿上到底是買家秀還是賣家秀呢。
電商購物中,面對心儀的產品, 摸不到、試不得,如何挑選到稱心如意的那款。這時候評價就起了大作用。高質量、真實的商品體驗描述,幫助商家深入瞭解使用者對產品及服務的真實體驗,幫助消費者快速甄別產品能否滿足自己的需求,挑選到合適的款式。
目前京東每天使用者釋出的評價超過千萬量級,龐大的資料中充斥著眾多低質資訊。那麼對於大量的違法言論、無意義評價如何管控; 優質、精華的高質量內容如何有效的反饋給使用者及商家。
關心各位消費者的產品汪和程式猿們掉光了頭髮,想出了一系列舉措實現智慧評價生態。下面將透過對四個方面的工作,帶大家瞭解,產品汪和程式猿們都幹了啥。
違禁評價的識別
作為實體經濟和數字經濟深度融合的創新型企業,京東遵循科技引領,正道成功的理念,遵紀守法的寶寶對那些違法國家法律規章的評價最開始進行處理。
基於底層商品知識圖譜,我們對於電商違禁文字做了分類梳理的相關工作,積累了包含辱罵、政治、地域歧視、色情、賭博、招聘廣告、詐騙等違禁知識。利用深度神經網路等演算法學習這些特徵,構建了違禁實體識別模型。
這些模型利用商城技術架構部的JDOS容器管理平臺輕鬆一鍵擴容,目前每天支援多個業務方千萬級別的呼叫量,識別出海量的違禁內容加以遮蔽,保留使用者評價中合規的部分,淨化UGC評論社群。
低質量評價的摺疊
除了上述的違禁內容,評價中還存在千奇百怪的內容。下面小編就從資料庫抽取點評論給大家觀賞一下。
更多的例子就不舉例啦,長期從對UGC內容做知識抽取工作的我已經對我們家文采飛揚的消費者五體投地。對於這些低質量評價,通常亂碼型、湊字數型對社群影響較小。部分段子型選手的評價影響較大,一旦被濫用,產生群體效應,會直接攻佔一部分商品的評價區,導致使用者搜尋有價值評論的難度大幅增加。為了節約消費者寶貴的時間,快速選取最適合自己的寶貝,我們對這類文字繼續歸納總結成教材,交給CPU、GPU去認真學習,快速上崗,將這些無意義評價摺疊,提升評價空間的質量。
差異化的京豆激勵措施
區別於其他電商,京東每年為了激勵使用者發表評價內容,提升生態的構建,每年花費價值數億人民幣的京豆對使用者發表評價的行為進行實實在在的激勵。但由於沒有做差異化的激勵措施,很多使用者釋出上述那些與商品不相關的無意義評價資訊,真正釋出真實商品感受的使用者反而沒有得到有效的激勵。
尤拉平臺依據電商產品的固有屬性特徵,例如吸塵器具備吸力強弱、執行聲音、續航或者電源線長度、外觀等特徵。我們利用知識圖譜的知識進行學習,理解一條評價中包含的資訊,同時對維度的描述語義質量計算置信度,得出一條評價的語義價值分。價值得分越高的使用者可以得到數倍的京豆激勵。
當然我們也做了嚴格的風控措施,只有高質量原創的文字內容才會獲得獎勵,否則會降低使用者畫像中的評價置信度得分和未來的激勵係數。
使用者觀點挖掘及流量運營
尤拉平臺賦予評價的不僅僅是文字的語義質量計算,同時還提供了評價語義標籤的挖掘。演算法模型自動從使用者的評價文字中抽取使用者對於商品印象有價值的觀點。
目前這些標籤覆蓋了京東90%的SKU,每個SKU下都有著完全由演算法抽取和聚類生成的語義標籤,輔助使用者快速獲取自己想要的資訊,指導購物行為。
目前商品下的語義標籤會根據使用者的點選情況動態調整來展現不同維度的描述,接下來我們計劃將語義維度用於排序,更多的展示和大眾關心維度相關的評價內容,提升使用者體驗。
結語
近幾年,使用者對於電商的需求更加個性化,垂直化。社群的運營對使用者體驗的提升也尤為重要。在後續我們會強化對尤拉平臺的建設工作,更好的賦能業務,本期先介紹到這,下期將會選取讀者最關心的方面做技術與應用分享。
致謝辛苦熬夜的產品汪和程式猿:
京東商城技術架構部-知識計算部UGC資料探勘小分隊主要負責基於尤拉知識計算平臺,進行評論、問答、社群、達人中臺的文字語義分析、情感分析、合規檢測、商品治理、以及實時使用者畫像、智慧京豆生態體系建設後端的知識抽取,歡迎大家來溝通合作。
關於尤拉平臺:尤拉平臺是商城技術架構部研發的知識計算平臺,尤拉平臺以商品知識圖譜為核心,涵蓋產品、品牌、屬性、輿情、百科等主要領域知識,透過知識發現、融合、推理和圖資料儲存、查詢等一系列技術,目前已沉澱上億知識和相應規則,在堆砌、違禁、濫用、合規、類目錯掛、標屬不一、重複鋪貨和社群評價等領域,和商家、使用者正面交鋒,協助平臺生態、產品和運營,有效的管控問題商品和低質評價進入京東生態。
京東商城技術架構部在北京、南京、矽谷均設有技術團隊,長期尋覓一流人才,你的加入,將會給我們帶來更多精彩。簡歷投遞:sunshanshan3@jd.com