profiling-people

作為新時代網際網路營銷的關鍵部分,人群畫像引起了諸多興趣,近年頗為風靡。幾乎所有的網際網路廣告供應商都不約而同的強調,他們有足夠精確的人群畫像資料,確保能夠找到廣告主真正的受眾。但是事情果真如此嗎?人群畫像是否是一勞永逸的解決方案?本文嘗試解答這些問題。

作者:宋星(網站分析在中國創始人,WAW中國創始人)

如果拋開所有灰色的因素,廣告追求的唯一效果應該就是找到對的人。作為廣告三要素(廣告位置、創意、受眾)中唯一不能事先確定的要素,人(即受眾)變幻莫測,讓無數廣告人茶飯不香,徹夜難眠。

我們用盡一切手段找到對的人,例如,電視廣告的露出非常講究不同頻道、節目和時點對於人群的覆蓋;樓宇廣告與樓盤和地理位置相關聯,以便釐清不同人群的購買力;雜誌上的廣告則跟雜誌對應的行業主題緊緊相連。這是不需要解釋的邏輯。但是到了網際網路上,這個邏輯面臨挑戰,因為網際網路這個虛擬的世界與現實世界相比,實在是大大不同。

這個不同在於,與傳統世界相比,網際網路是一個更能夠“監視”每一個人的地方。每一個人,他在網際網路(無論是桌面還是移動端)上的很多痕跡都會被各種或明或暗的機構或個人記錄儲存,然後被用於各種其他的目的。這些痕跡是什麼?後面會仔細介紹。

這些目的中最重要的之一是用於廣告,既然我們能夠監視個體,理論上我們就能知道他(或她)是誰,然後判斷他是不是“對的人”,如果是,我們就會在他下一次出現在網路世界中的時候,讓我們的廣告出現在他眼前,或是直接“騷擾”他。這種方法的效果比傳統廣告投放的效果肯定會好太多。TV-audience

因此,網際網路上的廣告投放可以脫離於廣告載體本身,而直接針對每一個具體的人。傳統廣告,是先考慮廣告載體(電視訊道或節目、雜誌內容、地址或樓盤等)來反推受眾大概是什麼型別的人,然後放一個大家看到的都一模一樣的廣告(而且載體的物理條件也已經限制了,不可能讓每個人看到的廣告不一樣);網際網路廣告則完全可以通過你在網際網路上的多種痕跡知道你是什麼樣的人,廣告的內容和創意可以根據你的具體情況來進行安排,而不需要根據網站上的內容(或在手機APP的型別)來放一個所有來這個網站的人都看到的一模一樣的廣告。

這個邏輯簡單而誘人,而且已經幾乎是徹底的改變了網際網路廣告的版圖。如果你足夠細心,你會發現現在網際網路上很多廣告跟你在網上的某些行為發生了關聯,例如你瀏覽了某寶商品之後,會發現很多頁面都有類似商品的廣告出現了。幾乎所有的傳統網際網路廣告公司都將自己擁有準確的人群定向能力作為賣點,以強化人們對其效果的信心。基於網際網路網民個人資訊識別進行鍼對性廣告投放的專門公司也突然激增,到2015年有近百家出現。專門“監視”並且描繪網際網路每個個人的第三方公司也開始出現,2015年也超過十家,且增速迅猛。運營商、網際網路巨頭也開始對外界提供部分的他們自有的使用者資料。而對網際網路世界中不同人群進行型別識別和描繪的工作,也有了更簡潔的說法——人群畫像,或是使用者畫像。

data-apparel-vendors

人群畫像突然成為網際網路營銷不可或缺的金字招牌。這個金字招牌的究竟是什麼?與之相關的說法,哪些可靠,哪些不靠譜?我希望在一系列文章中把這些問題弄清楚。

人群畫像的經典構成要素

人群畫像從字面理解,是把人群的情況用資料的方式描繪出來。人群畫像和個體畫像並不完全相同。千萬不要混為一談。

給個體畫像,指描述不同個人的過程。在廣告行業中,描述個體所用的方法被稱為“打標籤”,和電子商務中給商品打標籤很類似——商品上的標籤包含商品唯一的身份識別SKU,以及名稱、價格、產地、生產日期、保質期、原材料等資訊。而給個人打標籤,也是把這個人的資訊以標準化的方式組織儲存起來,並附著在這個人的唯一身份標識上。這裡多說一句,網際網路上對於人的唯一身份標記手段包括cookie(主要是PC端),或者是IMEI、IDFA等(主要是移動端)。如果一個人在網際網路世界中沒有一個唯一身份標識,那麼對這個人的畫像就無從談起,因為誰知道誰是誰?所以,人群畫像的最基本前提是對人的唯一身份的標記。

人群畫像與個體畫像有強關聯,人群畫像必須基於對個體的畫像,但卻高於個體的畫像,體現為人群作為一個叢集的整體特徵。人群是個體的集合,對什麼人群進行畫像是根據廣告營銷的目標受眾(target audience)或者細分目標受眾(audience segmentation)為物件進行的。例如,iPod生產商的人群畫像顯然是針對聽音樂感興趣的人,NB運動鞋廠則想對運動時尚人群畫像。

人群畫像與個體畫像相似之處在於,兩者都是對人的描述。但人群的描述需要歸納人群所呈現出的共性,而非多樣性特徵。可是,就像沒有任何兩個人是一模一樣的,對個體的畫像也不可能一樣,當每個不同的人集合成群體,就需要用一定的方法尋找他們的共性,並構建這些共性與營銷策略上的邏輯相關性。

人群畫像的經典構成要素,也就由此產生。它包括三個非常關鍵的組成部分:個體的標識,個體的畫像(即打標籤)以及對人群共性的抽象。第一個是一切的前提,第二個是基礎,第三個是對前者的組合、抽象、分析和加以利用。

structure-of-profiling

下面及後續的文章我們將逐一詳細看看這三個組成部分究竟有何玄機。

唯一身份標識

在網際網路世界中匿名“旅行”是一個人的基本權利(至少部分是),這給追蹤一個人的行動帶來了麻煩。既然不能實名,那麼我們至少要給他們起一個名字。

這個名字跟真實世界中的名字很不同。首先,這個名字是一串沒有什麼意義的隨機字元,其次,這個名字的存在可能連當事人自己都不知道。

比如說,你去了一個網站,管你註冊登入與否,這個網站都會給你安一個名字,當你下次來的時候,哪怕你繼續不登入,這個網站也會知道你來了。這個東西太普遍了,以至於現在幾乎所有的網站都使用這個東西,它的名字叫cookie。

即使是同一個人,每個網站也都給這個人不同的cookie命名,這很容易理解,因為每個網站有自己的命名規則。所以,唯一身份標識是相對的,對於同一個網站,不同的人,應該有唯一的識別,但這個人去了別的網站,理論上就是別人的事情了,這個人會被別的網站起上別的cookie命名,而且是其他網站根本無從知曉的。這就引起了一些問題,我們下面不久就會講。

隨著移動端的發展,唯一身份標識用cookie就不好用了,因為移動端上APP用量巨大,而cookie必須隨著網站存在,APP沒有這東西。不過,沒有cookie沒關係,移動端有別的東西來標識人。在移動端,唯一身份標識最常用的是手機的IMEI號碼,或者IDFA(蘋果手機對人的識別號),或者其他很多別的ID。各種ID中的一些類別,理論上具有與手機硬體捆綁的唯一性(手機不同,號碼不同,而且手機不變,號碼不變),比如前面的IMEI和IDFA(IMEI和IDFA實際上都可以被修改,但可以認為很接近與手機繫結),不會根據手機中裝的APP或者上的網站的不同而發生變化,因此這類識別號比cookie看起來更好。

imei_meid

那麼,現實世界中,這些唯一身份標識好用嗎?

有人說,現實是個大坑,我很想反駁這個觀點,但似乎真實世界真的在強化自己的“大坑”。所謂知易行難,我們知道這些東西好,但未必能用的好。我們繼續往下看。

PC上的唯一身份標識

首先看看PC上的cookie。在PC中,每個網站只能建立自己的cookie,那麼一個網友到了別的網站去,這個網站就看不到他了。對於網友而言,這個事情很好,他不會擔心別人知道了他去了“蒼老師”的網站。但是對於做廣告的營銷人而言,這個可是大大的不好。因為不同網站對人的標識不同,會造成無法追蹤一個人瀏覽不同網站的行為,也就無法判斷這個人的喜好是什麼,畫像的基礎也就不存在了。為了解決這個問題,一些廣告公司想了一個辦法,讓在不同的網站上訪問的同一個人,享有同一個cookie,這個cookie不屬於網站,而屬於這個廣告公司。簡單講,就是這個廣告公司給這個人起了一個名字,然後讓這個到哪個網站上,都仍然有這個名字,這時就能判斷這個人看了哪些網站了。這種cookie叫做第三方cookie,而最初的那種cookie叫第一方cookie。第三方cookie是個好東西,能夠跨越不同的網站識別同一個人。而只有實現了跨越不同的網站識別同一個人,才能給每個個人進行畫像的前提。

看起來好像問題解決了,可是,忽然有一天,我們發現cookie這東西越來越不靠譜。原因在於“隱私保護”!人們不喜歡cookie,誰樂意被一個第三方在你不知情的情況下跟蹤你的網路行為呢?這個問題,對於第三方cookie尤其如此。因為第一方cookie畢竟只能限制在一個網站內,而第三方cookie則有更大的工作範圍。歐洲人抗議最凶,於是歐洲立法要求網站使用cookie時,都要在網站彈出視窗警示訪問者,並且要徵得使用者同意才能儲存這個人的cookie。中國雖然沒有什麼立法,但是老百姓也不知道cookie是幹啥的,反正可能有害的那就一定有害,於是很多能夠禁用或者清除cookie的瀏覽器出現了,擁躉眾多。Cookie開始越來越不受待見,由於頻繁的清除和禁止,標識同一個人的cookie的平均生命週期越來越短,現在只有30天左右,而第三方cookie則更加受到限制,很多連建立的機會都沒有。

cookie-retention

有取代cookie的更好的方法嗎?在PC端,替代方法有很多,但真正說能取代的,對不起,還真是木有。比如,有人說,用電腦的MAC(網路卡硬體編號)來識別就是很好的辦法啊!但是這個東西沒這麼簡單,第一,你憑什麼技術能識別這個?第二,識別這個是法律禁止的!還有人說,用Flash cookie(Adobe公司Flash的唯一使用者識別資訊),這個方法還不是照樣被瀏覽器禁用,而且Flash越來越為人所詬病,支援它的網站也在減少。

還有人用另外一種技術方法,似乎可以一定程度上提升cookie的存活期。方法是這樣:利用一種被稱為“鉤子演算法”的計算機程式,能夠關聯同一個人的老cookie(cookie被清除前)和新cookie(老cookie被清除後又被賦予的新cookie,理論上這兩個cookie已經完全不同了),從而延續一個cookie的生命週期。不過這個方法的致命性在於精確性,對於數以百萬計的cookie而言,每做一次“鉤子”勾連都是隻有一定的準確性,誤判難免發生。即使每一次鉤子的準確性都有90%,那麼做五次之後,準確率也就不到一半了。

這些方法都不能根本上解決cookie生命週期逐漸變短這個現實。如果只是對網際網路使用者進行短時間的標識,cookie還是可用的,但越是需要長時間的對於人的識別,cookie的準確性就越低。

所以,PC上的識別,很多人不得已想很多辦法去追蹤硬體號碼,但這個方法是不合法的,而且追蹤之後也不能直接用於廣告投放上。人群畫像,理論上不應該基於PC的硬體識別號。如果這方法不能用,那麼只能接受不完美的cookie去進行短期的人群識別使用。

現在,你應該明白,如果有廣告商跟你講,我們持續數月甚至數年積累同一群人PC上的行為資料,本身就是一個不靠譜的忽悠。這方面,只有大的有賬號體系的網際網路媒體,才做得到。

整個系列的文章很長,所以第一期講到這裡,我們先休息一下呷口水。在下一期中,我們接著討論mobile端的唯一使用者身份標識以及更多的行業中流傳的靠譜不靠譜的使用者標識方法,敬請期待!

8-segments-580x485

作者簡介:

宋星,網站分析在中國網站的創始人和全部文章的作者,WAW中國創始人,百度廣告主投放商業諮詢部總經理。同時,也是百度認證鑽石講師、北京航空航天大學特聘教授、北京傳媒大學MBA特約講師。

via:http://www.chinawebanalytics.cn/internet-user-profiling-and-truth-1/