在資訊社會,資料將成為核心資源,就像農業時代的土地、工業時代的能源。
中國正在朝著那個時代奔跑,但還有些距離。
《紙牌屋》背後的祕密
在這個網站上,使用者每天產生高達三千多萬個行為,如收藏、推薦、回放、暫停等。隨著資料探勘技術日漸成熟,Netflix開始用這些資料倒推來生產影片。
時下最火的一部美劇,毫無疑問當數《紙牌屋》。
這部被中國網友們戲稱為“白宮甄嬛傳”的美國政治懸疑劇,正在全球四十多個國家熱播。嚴肅媒體們——無論是《紐約時報》、《洛杉磯時報》還是最近一期的《經濟學人》,都在重要版面研究它的成功之道。
該劇的製作方,既不是電視臺,也不是傳統的電影公司,而是一家類似於中國的土豆和優酷的線上視訊播放網站Netflix。
早期,Netflix是北美家喻戶曉的線上影片租賃提供商,主營業務是通過郵寄方式租賃DVD來賺錢。然而,在網際網路時代,這個盈利模式逐漸式微。於是,Netflix轉向線上流媒體播放,但轉型並不成功,一直被資本市場唱空。
和中國視訊網站一樣,Netflix也在尋求突圍之道,2012年開始向上遊進軍,準備推出自己的自制劇。
不過,在決定拍什麼、怎麼拍上,Netflix卻一反常規,祭出自己的祕密武器——大資料。
原來,Netflix從創立開始,就意識到資料的重要性。在這個網站上,使用者每天產生高達三千多萬個行為,如收藏、推薦、回放、暫停等;Netflix的訂閱使用者每天還會給出400萬個評分,300萬次搜尋請求,詢問劇集播放時間和裝置等。這些都被Netflix轉化成程式碼,當作內容生產的元素記錄下來。早些年,這些資料被Netflix用來進行精準推薦,隨著資料探勘技術的日漸成熟,Netflix開始將其用於倒推前臺的影片生產。
這次,Netflix的工程師們發現,喜歡BBC劇、導演大衛·芬奇(David Fincher)和老戲骨凱文·史派西(Kevin Spacey)的使用者存在交集,一部影片如果同時滿足這幾個要素,就可能大賣。
Netflix決定賭一把,他們花1億美元買下了一部早在1990年就播出的BBC電視劇《紙牌屋》的版權(幾乎是美國一般電視劇價錢的兩倍),並請來大衛·芬奇擔任導演,凱文·史派西擔當男主角。
事實證明,他們賭對了——《紙牌屋》不僅是Netflix網站上有史以來觀看量最高的劇集,也在美國及四十多個國家大熱。嚐到甜頭的Netflix,2013年將繼續推出4部自制劇。
聆聽資料的聲音
微博、微信等社交媒體上的“隻言片語”,從某種程度上也是資料的聲音——社交媒體上資料的聲音。
Netflix只是掘金資料的先行者之一,中國的跟隨者們正在紛紛出現。
2013年3月,搜狐買下《紙牌屋》的中國獨家網路播放權。而這個過程,本身就是一個覺醒的故事。
據負責採購的搜狐視訊版權影視中心高階總監馬可對媒體透露,早在2012年5月份,他們就在美國的一個看片會上看到了《紙牌屋》的資訊,當時只有這部劇的題材和陣容,並沒有確定播出平臺。搜狐當時也沒有拍板要買,只是留下了一個印象。
到2013年春節前,看完樣片,馬可們猶豫了:這麼高階的片子,市場會不會不接受?他有一個感性理由:一些內部高管說,自己很喜歡看,但他太太完全看不下去。
但春節期間,馬可就發現,這部劇在微博、微信朋友圈的一些相對有話語權的圈子裡口碑不錯,而且開始發酵了。他還注意到,一些字幕組甚至加班加點啟動了盜版。
一些網路上的主流精英人群為這部片子背書,增加了搜狐的信心。馬可判斷,這部劇的使用者群特徵應該是:有閱歷和話語權,高收入。
在諸多視訊網站裡,搜狐視訊一直力推的自我定位是優質美劇引進平臺。如果引進這部劇,一方面會給搜狐“優質美劇品牌”定位加分;另一方面,也可以藉此吸引廣告主以更高價格為貼片廣告埋單。
權衡之下,搜狐決定立即引進。春節之後,他們就決定新增一個臨時性採購,只用了兩週時間,便完成了全部流程。
2013年3月2日,《紙牌屋》在搜狐上線,接下來的10天裡,這部劇便不負眾望,迅速衝到了排行榜前幾名。
馬可們也賭贏了。他們的決策並不像Netflix一樣依靠的是多年來的資料探勘成果,而僅僅只是微博、微信等社交媒體上的“隻言片語”,但從某種程度上,也是在聆聽資料的聲音——社交媒體上資料的聲音。
聚焦社交媒體
社交媒體上留下了海量的資料,這些痕跡的拼圖,顯影出不同事物之間隱祕甚至是莫名其妙的聯絡,比如羅大佑演唱會和大眾車之間的關係。
社交媒體上的資料,正是目前許多中國的資料公司致力挖掘的領域。
清華大學畢業的鄂威從事廣告精準營銷已經有6年的時間,他觀察到,社會化媒體對使用者行為改變的影響力,正在逐漸增加。不管是買車買房等大宗消費,還是吃飯喝茶等日常消費,消費者更傾向於在微博等社會化媒體上尋求朋友的建議。鄂威判斷,企業在社會化媒體上的傳播,將來有可能成為跟搜尋一樣大的市場。於是,在2009年一次北京地下車庫的聊天當中,鄂威與朋友一拍即合,建立了孔明社交管理。
鄂威提供的,是一個類似於“社交管家”的軟體,幫助企業對微博、人人網等社會化媒體進行管理。比如說,在孔明社交的後臺,粉絲們一旦評論、轉發,資訊都會分類顯示,管理員可以根據不同的級別回覆和處理,提升效率。如果有負面評論,其負面關鍵詞抓取和監控的技術便會發揮作用,提醒管理員優先回復處理,進行引導。對一些企業大號來說,這項技術非常實用,因為如果單純靠人力來做此種監控,成本高不說,反應也很可能不及時,讓負面輿論發酵從而影響企業品牌。
不過,這些都只是低層次的應用。“我們最終的工作,是希望能幫企業去找到他潛在的客戶,分析他們有什麼樣的特點,什麼樣的喜好和生活方式,根據這些再去做針對性的營銷方案,促進實質交易。”鄂威說。
鄂威給南方週末記者舉了個例子,比如說買車,有的人可能會在微博上直接發個資訊,說要買車,抓取這個資料之後,就可以直接給對方推送汽車廣告。但大多數人可能不會直接說,那就要去找,“資訊實際上有很多維度,我們要知道的,是什麼樣的維度跟我們想明確的問題——比如買車——是有關的”。
鄂威透露,他們在做資料探勘時就有一個驚奇的發現:去聽過羅大佑現場演唱會的人,對上海大眾的車興趣度會提高30%,“為什麼這樣?分析起來也是有道理的,比如這款車的受眾是35歲左右的,居家型的,希望提高生活品質的男性,和羅大佑的受眾非常一致。”
不過,這並不一定是真的原因,真的原因其實也不那麼重要。在風靡業界的《大資料時代》一書中,被稱為“大資料時代預言家”的維克托·邁爾·舍恩伯格提出的一個重要洞見就是,放棄對因果關係的渴求而關注相關關係。也就是說,很多時候,只要知道“是什麼”,而不需要知道“為什麼”,只要知道某些事物之間有關係就夠了。
谷歌有一個名為“谷歌流感趨勢”的工具,它通過跟蹤搜尋詞相關資料來判斷全美地區的流感情況。如果有大量人搜尋一些關鍵詞,比如溫度計、流感症狀、胸悶 等,系統就會進行跟蹤分析,建立地區流感地圖(灰線)。其結果與美國疾病控制和預防中心的報告(虛線)大體一致。資料來源:谷歌網站 美國:流感樣疾病(ILI)資料由美國疾病控制中心提供。 (曾子穎/圖)
“影響力”即貨幣
想想看吧,同樣買個冰淇淋,你花的5美元和奧巴馬花的5美元就是不一樣——“美國總統之選”的招牌就是招財利器!
基於微博等社會化媒體而誕生的公司,目前已經非常多。這些社交化媒體管理工具,針對的使用者既有企業的,也有個人的。甚至還有一些應用,正在試圖將個人的影響力進行量化打分,從而實現“商用”。
在這方面,目前走在最前面的當屬Klout,它主要是通過排名演算法和語意分析對使用者在 Twitter、Facebook 和 LinkedIn 等社交網路上的活動進行分析,從而得出一個可以具體量化你影響力的分數。影響分數高低的因素包括——活躍粉絲數量,你發的訊息的轉發率、原創率與粉絲的互動等等。
別小看了這些分數。Klout有一個著名的口號:影響力即貨幣。想想看吧,同樣吃個冰淇淋,你花的5美元和奧巴馬花的5美元就是不一樣——“美國總統之選”的招牌就是招財利器!
基於這樣的判斷,一些商家開始身體力行。2012年2月份,企業軟體巨頭 Salesforce 引入了一個服務:讓客戶公司可以根據投訴客戶的 Klout 打分來靈活處理投訴,Klout值越高的客戶的投訴事件將得到越快處理,而且公司的態度和服務也會更加周到。奢侈品購物網站Gilt Groupe也開始根據顧客的Klout 的打分為其提供不同的折扣。
根據Klout的平臺經理預測,未來,那些有影響力的人將可以免費使用機場的貴賓休息室,住更好的酒店客房,並從各大品牌活動中獲得更高的折扣。
這些企業為何這麼“勢利眼”呢?理由其實很簡單:一定程度上,那些更有影響力的人往往在事業上更加成功,也更有購買力。就算這些人既沒錢又沒權,起碼他們還有很多“粉絲”。假如企業得罪了這些客戶,一個負面評論可能會傳達給更多的人,對公司品牌的影響也更大。
目前,Klout已經是明星級的創業公司,員工不到百人,已經獲得了4000萬美元的投資,估值也早已經超過了2億美元。
任重道遠
“大資料其實最核心的不在於‘數’,而在於‘大’和‘據’,所謂的‘大’,是指資料積累到一定的量級;而‘據’,就是找出論據,為企業決策做參考。”
不過,如果僅僅將“大資料”的概念侷限在社交媒體上,就顯得太窄了。在中國,大資料的商業化,依然任重而道遠。
生於1981年的洪倍算得上是中國資料行業發展歷程的親歷者之一。2006年,他和同齡人閆曌一起創立了一家名為AdMaster(中文名為精碩科技)的公司,主要業務是經營網路廣告投放。彼時,正值網路廣告興起,在廣告主與網際網路媒體之間迫切需要一個有效的通道,因而精碩科技的模式也很簡單,事先購買很多網站的廣告位置,然後再把它們打包賣給廣告主。洪倍告訴南方週末記者,當時他們在金融和快消領域,做到了行業領先的位置,不過,很快他們就開始了轉型。
大概在2009年左右,隨著網路廣告在企業廣告的支出中所佔比重越來越大,企業主們開始越來越重視廣告效果,一個新的市場——廣告效果監測開始出現。
精碩科技的第一次轉型從這時開始,他們將自己定位為獨立於廣告主和媒體的第三方廣告監測機構。
兩年前,隨著大資料的概念越來越熱,精碩科技又開始了第三次轉型——進軍大資料領域。“這才是我們從一開始就想做的事業。”洪倍說,這麼多年的技術積累,他們現在終於等來了機會。截至目前,精碩科技已經完成了前後兩輪共計2000萬美元的融資。
實際上,從做廣告效果監測開始,洪倍就一直在和資料打交道。
“我們說的大資料,其實最核心的不在於‘數’,而在於‘大’和‘據’,所謂的‘大’,是指資料積累到一定的量級;而‘據’,就是找出論據,為企業決策做參考。”在洪倍看來,網際網路發展這麼多年,資料的量級已經不是問題,問題在怎麼找出這個“據”上,“現在狀態是,大多停留在‘有資料,無認知’上。”
據洪倍介紹,五年前,一個資料分析公司挖掘一個資料可能需要三個月,但是現在,3秒鐘或者0.3秒鐘就夠了。資料的挖掘速度已大大提高,但這並不代表人們對資料的認知已經提高。洪倍說,在他們合作的客戶中,其實很多手上都有大量資料,但許多人卻並不知道怎麼去看這些資料,也不知道它的價值在哪裡。“我們得首先從客戶教育開始。”
不過,隨著大資料價值的凸顯,一些企業也認識到其中的機會。各大網際網路公司,如騰訊、阿里巴巴等,都組建了自己的資料探勘團隊。而銀行、保險、電網等擁有大量行業資料的公司,也紛紛在這方面開始佈局。
“AdMaster將來要做的,是營銷資料處理公司。”洪倍說,“這個營銷,不僅僅是廣告,而是真正地為‘運營’服務。”洪倍解釋說,原來他們的廣告效果監測,大多是事後的或者是實時的,而未來的大資料,則是在企業決策之前就提供意見和參考——就如同Netflix用資料來倒推影片生產一樣。
洪倍預估,這個過程,在中國至少還需要3-5年。