淺談使用者畫像

weixin_33806914發表於2017-12-29

使用者畫像是什麼,給大多數人的印象就是給使用者打標籤,從某種意義上來說,這種理解也是正確的。更詳細地來說,使用者畫像是傾向於對同一類使用者進行不同維度的刻畫。

1.使用者畫像資料的來源

  • 一個完整的使用者畫像是由各個子畫像綜合計算出來的,豐富的使用者行為日誌檔案是各個子畫像的資料來源。

  • 從資料的角度來看,使用者畫像就是對原始資料二次計算重構的後的新資料。

    1.使用者屬性是用來描述一個使用者的“個性”,使用者畫像也是針對使用者屬性為基礎來進行建模的。
    
    2.使用者行為是使用者畫像建模的依據。 
    

2.使用者畫像特性

  • 動態性:由於是對使用者的行為進行分析,可知使用者畫像是具有很強的動態性。這要求我們設計建模的時候,應該考慮到使用者畫像的實時更新的問題。

  • 時空侷限性:與其動態性類似,在時間上,是對使用者的行為日誌進行分析,不可避免的會造成使用者畫像的時間侷限性,上一段時間的使用者畫像不一定適用於當前階段,其次,在空間上,對於不同的應用領域,需要建立的使用者畫像也是不同的,所以這就造成了時空侷限性,所以離開了應用場景,在談使用者畫像是不合適的。

3.使用者畫像建模

  • 使用者定量畫像;使用者定量畫像在建模的過程中,主要考慮到使用者畫像的顆粒度,即使用者畫像應該細化到何種程度,當然這個程度需要準確的把握,太過於細化雖然有利於增加推薦的準確度,但是建模的成本會增加,反之亦然。前期可以通過調查問卷的方法來大致的確定使用者的關注內容,從而確定使用者畫像的顆粒度。就可以藉助技術的方式來捕捉使用者的行為,儲存和分析使用者的資料。顯然,僅僅通過使用者定量畫像,無法精確的刻畫使用者。

  • 使用者定性畫像:相比與使用者定量畫像,使用者定性畫像是比較複雜的。包含了以下幾個部分

  1. 標籤與使用者定性畫像:標籤通常是人為高度精煉的特徵標識,是使用者定性畫像的核心。標籤化的使用者畫像既方便人們理解,同時也方便計算機進行統計分析和程式化處理。在使用者定性畫像建模中需要考慮以下幾個問題:

    (1)如何定義和表示標籤?(包括標籤名稱、標籤的類別、標籤值和取值範圍)
    
    (2)如何解釋標籤?主要是對標籤的語義資訊進行描述,從語義上給出標籤的解釋
    
    (3)如何推理標籤?主要是定義相應的推理規則,從何實現標籤之間的推理。
    
    (4)如何驗證標籤?包括標籤的定義是否合理,標籤關係是否一致、正確。
    

4.使用者畫像的構建

  • 構建使用者畫像的關鍵技術是利用本體對使用者畫像領域中的標籤進行表示、驗證、推理和解釋。本體的結構主要包含類(Class)、屬性(Property)、例項(Individual)、公理(Axioms)和推理規則(Rules)。基於知識的使用者定性畫像主要以使用者和消費的相關行為作為畫像建模的核心。本體構建的關鍵步驟:

    (1)構建領域詞彙表

    (2)確定類與類之間的結構

    (3)定義屬性

    (4)定義例項

    (5)定義約束公理和推理規則

  • 定性畫像知識的儲存:基於Jena API的面向關係資料的本體儲存技術。

本文參考《使用者網路行為畫像》

相關文章