基於使用者位置資訊的行為分析

呂建奎發表於2015-11-02

基於使用者位置資訊的行為分析

1、位置資訊獲取和儲存

  • 傳送位置資訊時序:
    傳送位置資訊時序


  • 基本技術方案步驟

    1. 服務端根據業務需求定時向客戶端推送特定訊息(需要服務端、客戶端一起定)
    2. 客戶端接收到推送的訊息不向使用者展示任何內容
    3. 客戶端通過Baidu定位API得到使用者當前的的地理位置
    4. 客戶端把地理位置傳送給服務端
    5. 服務端儲存地理位置
    6. 服務端定時或者根據不同的需求分析使用者的行為資訊
    7. 客戶端請求服務端相關的資料,服務端根據上次位置資訊分析的結果給使用者返回特定的資料

1.1 獲取

使用者位置資訊主要通過Android或者IOS客戶端呼叫百度定位API獲取

1.2 儲存

  • 客戶端是否獲取到定位資訊後直接傳送給服務端?

    • 直接傳送

      會造成客戶端電量浪費嚴重,服務端壓力暴增。
      客戶端不儲存任何使用者位置資訊

    • 不直接傳送

      省電,減少服務端壓力,但是增加客戶端複雜度
      客戶端儲存使用者的位置資訊
      如果長時間沒有向服務端傳送儲存的位置資訊,可能造成較早資料丟失

  • 服務端儲存

資料庫或其他方式儲存,服務端需要儲存海量使用者位置資訊

2. 位置資訊分析

位置資訊分析的工作主要在服務端。

2.1 使用者基本資訊。

如家和公司的位置。以座標進行聚類,再輔助時間,假設白天為公司,晚上為家,可以得到該使用者的家和公司的位置。如果根據座標可以找到相應的小區、公司名、學校名,就可以粗略知道該使用者的家庭住址和工作經歷。

  • 由於有一部分人會違反1中白天在公司,晚上在家的假設,可以根據某個原則,如晚上3點到4點,座標變化很小的,認為是家,來把這部分人挑出來,重新分析。

  • 特定時候的特定行為。如年假期間,可以猜測老家。

2.2 社交關係。

根據1中的使用者標籤,對使用者進行關聯分析。如公司標籤相同的兩個使用者,如果飯點的運動軌跡相同,可以猜測他們關係不錯。

2.3 使用者行為分析。如社交活動。

如果有了使用者的社交關係,結合地理標就可以進行行為分析了

2.4 使用者行為預測。

  • 比如你最近一個月每天中午都去某個飯館吃飯,我可以預測你今天中午也會經過同樣的路線到同樣的地方吃飯。甚至預測你最近會結婚、生娃、離婚。

以後涉及到的隱私問題,就看企業自律了。一般來說只分析到家地理分割槽,而沒有獲取到具體門牌號時(無論是分析還是使用者自己填寫),是不會涉及隱私問題的。國外某公司的做法是,可能採集使用者姓名、地址,但不會提供給商家(BlueKai.com)。

3. 演算法

使用百度SDK或者使用特定的演算法(當然要商用還得複雜地建模、複雜的演算法)分析使用者活動軌跡.

3.1 K-means演算法

定義:K-means演算法是硬聚類演算法,是典型的基於原型的目標函式聚類方法的代表,它是資料點到原型的某種距離作為優化的目標函式,利用函式求極值的方法得到迭代運算的調整規則。K-means演算法以歐式距離作為相似度測度,它是求對應某一初始聚類中心向量V最優分類,使得評價指標J最小。演算法採用誤差平方和準則函式作為聚類準則函式。

K-means演算法百科

K-means演算法

3.2 Apriori演算法

Apriori演算法是一種挖掘關聯規則的頻繁項集演算法,其核心思想是通過候選集生成和情節的向下封閉檢測兩個階段來挖掘頻繁項集。而且演算法已經被廣泛的應用到商業、網路安全等各個領域。

Apriori演算法百科

相關文章