本文由百分點資訊無線業務部高階總監李曉東、Talking Data COO徐懿以及成都電子科大的龔亮聯合撰寫。

通過手機閱讀、手機音樂上的使用者行為,我們可以看到手機大資料在移動網際網路應用上的威力,但同時,手機上的大資料也不是萬能的,它的發展還面臨著很多實際的問題和挑戰。

資料的稀疏性

智慧手機端的App應用數以十萬計,但是每個應用中兩個使用者之間選擇的重疊非常少,如果用使用者和商品之間已有的選擇關係佔所有可能存在的選擇關係的比例來衡量系統的稀疏性,在我們研究的幾個App資料中,稀疏度均不超過4%,其實這些其實都是非常密的資料。想想一個具有千萬級使用者,百萬級歌手的App,平均而言一個使用者能聽100首歌嗎,估計不能,所以稀疏度應該在萬分之一或以下的量級。

這個問題本質上是無法完全克服的,但是有很多辦法,可以在相當程度上緩解這個問題。比如擴散方法、隨機預設值方法、隨機選擇等

冷啟動問題

在我們前面討論的音樂APP中,我們發現歌曲的覆蓋只有2%左右,這個是由於大量歌曲出於冷啟動狀態造成的。這是因為新商品由於被選擇次數很少或沒有,難以找到合適的辦法推薦給使用者結論。

最近一個有趣的研究顯示,新使用者更容易選擇特別流行的商品—這無論如何是一個好訊息,說明使用熱歌榜也能獲得不錯的結果。

大資料處理與增量計算問題

儘管資料很稀疏,大部分資料都包含百千萬計的使用者,與此同時新使用者不停進入系統。資料量不僅大,而且資料本身還時時動態變化,如何快速高效處理這些資料成為迫在眉睫的問題。在這個大前提下,演算法時間和空間的複雜性,尤其是前者,獲得了空前重視。一般而言,一個高效的演算法,要麼自身複雜性很低,要麼能夠很好並行化,要麼兩者兼具。

隨著加入的資訊量的增多,最終每過一段時間還是需要利用全域性資料重新進行計算。更先進但也更苦難的辦法,是設計出一種演算法,能夠保證其誤差不會累積,也就是說其結果與利用全部資料重新計算的結果之間的差異不會單調上升。

使用者行為模式的挖掘和利用

深入挖掘使用者的行為模式能更準確的抓住使用者喜好,從而有希望做出更好的使用者體驗。譬如說在音樂APP中,新使用者和老使用者具有很不一樣的選擇模式:一般而言,新使用者傾向於選擇熱門的歌曲,而老使用者對歌曲的多樣性關注更多。

使用者行為的時空統計特性也可以用於提高者設計針對特定場景的應用。舉個例子,在進行手機個性化閱讀推薦的時候,如果曾經的資料顯示某個使用者只在7點到8點之間有一個小時左右的手機閱讀行為(可能是上班時在地鐵或者公交車上),那麼9點鐘傳送一個電子書閱讀的簡訊廣告就是很不明智的選擇。從含時資料中還可以分析出影響使用者選擇的長期和短期的興趣,通過將這兩種效應分離出來,可以明顯提高推薦的精確度。

多維資料的交叉利用

目前手機端的APP還出於孤立的狀態,並沒有真正的完成資料打通及資料共享的地步。想象如果能夠把這些資料整合起來,特別是知道每個節點身份的對應關係(不需要知道你真實身份,只需要知道不同APP中存在的若干節點是同一個人),可以帶來的巨大的社會經濟價值。

舉個例子,你可能已經在新浪微博上關注了很多資料探勘達人的微博,並且分享了很多演算法學習的心得和問題,當你第一次上當當網購書的時候,如果主頁向你推薦資料探勘的最新專著並附有折扣,你會心動嗎?所以多維資料探勘是真正有望解決系統內部冷啟動問題的法寶——只要使用者在系統外部的其他系統有過活動。

目前有很多技術方法可以實現這種多維資料探勘,比如統計物理學的物質擴散、熱傳導方法,機器學習的遷移學習方法都有望解決這種多維資料探勘。

結論與展望

由於移動網際網路的迅速崛起,讓網際網路大資料變得更為多樣、豐富。它不但可以作為網際網路大資料的一個有益補充,而且還可以作為移動網際網路新業務本身的行動指導。

在市場營銷領域,資料可以用來洞察客戶,例如衡量他們的生命週期價值或者預測可能的購買行為。對於整個企業而言,利用資料進行分析和應對的能力,對於進行正確的決策並最終取得更好的業績是至關重要的。

真正實現“精準營銷”需要底層海量的使用者行為資料做支撐,網路營銷追求的都不應是曝光率,而是使用者轉化率。而對使用者轉化過程進行有效的資料分析,可實現效果的優化。效果可從三個層面分解:目標是否清晰、向過程要效果,最終目標達成率就是效果。利用資料工具控制和優化營銷過程,可不斷提升ROI效率。

這需要具體瞭解客戶的業務發展目標和推廣需求,可以考慮藉助專業的第三方服務公司作有關於網路營銷策略的效果評估。以制定出或調整有關於網路營銷策略。

一般來說,對於不同的營銷平臺會有不同的廣告形式投放,從而產生的效果也多種多樣,各家說各家的好。網路營銷中,品牌認知、提升偏好、主動尋找、購買轉化、分享/再購各階段,分別對應廣告管理、口碑、網站、電商、客戶管理的營銷策略。以“大資料”貫穿網路營銷全過程,就可將有價值的資料轉化為有意義的資料,讓廣告從效果監測變為效果預測、讓傳播更有效率、使用者體驗更佳,使用者轉化更清晰、可控。

讓我們一起隨著手機上的大資料一起“爆發”吧。

via:雷鋒網