大資料公司挖掘資料價值的49個典型案例

趙鈺瑩發表於2018-08-13

對於企業來說,100條理論確實不如一個成功的標杆有實踐意義,本文的主旨就是尋找“正在做”大資料的49個樣本。

本文力圖從企業運營和管理的角度,梳理出發掘大資料價值的一般規律:一是以資料驅動的決策,主要透過提高預測機率,來提高決策成功率;二是以資料驅動的流程,主要是形成營銷閉環戰略,提高銷售漏斗的轉化率;三是以資料驅動的產品,在產品設計階段,強調個性化;在產品運營階段,則強調迭代式創新。

上篇 天然資料公司的各種套餐

從谷歌、亞馬遜、Facebook、LinkedIn,到阿里、百度、騰訊,都因其擁有大量的使用者註冊和運營資訊,成為天然的大資料公司。而像IBM、Oracle、EMC、惠普這類大型技術公司紛紛投身大資料,透過整合大資料的資訊和應用,給其他公司提供“硬體軟體 資料”的整體解決方案。我們關注的重點是大資料的價值,第一類公司首當其衝。

下面就是這些天然大資料公司的挖掘價值的典型案例。

01 亞馬遜的“資訊公司”

如果全球哪家公司從大資料發掘出了最大價值,截至目前,答案可能非亞馬遜莫屬。亞馬遜也要處理海量資料,這些交易資料的直接價值更大。作為一家“資訊公司”,亞馬遜不僅從每個使用者的購買行為中獲得資訊,還將每個使用者在其網站上的所有行為都記錄下來:頁面停留時間、使用者是否檢視評論、每個搜尋的關鍵詞、瀏覽的商品等等。這種對資料價值的高度敏感和重視,以及強大的挖掘能力,使得亞馬遜早已遠遠超出了它的傳統運營方式。

亞馬遜CTO Werner Vogels在CeBIT上關於大資料的演講,向與會者描述了亞馬遜在大資料時代的商業藍圖。長期以來,亞馬遜一直透過大資料分析,嘗試定位客戶和和獲取客戶反饋。“在此過程中,你會發現資料越大,結果越好。為什麼有的企業在商業上不斷犯錯?那是因為他們沒有足夠的資料對運營和決策提供支援,”Vogels說,“一旦進入大資料的世界,企業的手中將握有無限可能。”從支撐新興技術企業的基礎設施到消費內容的移動裝置,亞馬遜的觸角已觸及到更為廣闊的領域。

亞馬遜推薦:亞馬遜的各個業務環節都離不開“資料驅動”的身影。在亞馬遜上買過東西的朋友可能對它的推薦功能都很熟悉,“買過X商品的人,也同時買過Y商品”的推薦功能看上去很簡單,卻非常有效,同時這些精準推薦結果的得出過程也非常複雜。

亞馬遜預測:使用者需求預測是透過歷史資料來預測使用者未來的需求。對於書、手機、家電這些東西——亞馬遜內部叫硬需求的產品,你可以認為是“標品”——預測是比較準的,甚至可以預測到相關產品屬性的需求。但是對於服裝這樣軟需求產品,亞馬遜幹了十多年都沒有辦法預測得很好,因為這類東西受到的干擾因素太多了,比如:使用者的對顏色款式的喜好,穿上去合不合身,愛人朋友喜不喜歡…… 這類東西太易變,買得人多反而會賣不好,所以需要更為複雜的預測模型。

亞馬遜測試:你會認為亞馬遜網站上的某段頁面文字只是碰巧出現的嗎?其實,亞馬遜會在網站上持續不斷地測試新的設計方案,從而找出轉化率最高的方案。整個網站的佈局、字型大小、顏色、按鈕以及其他所有的設計,其實都是在多次審慎測試後的最優結果。

亞馬遜記錄:亞馬遜的移動應用讓使用者有一個流暢的無處不在的體驗的同時,也透過收集手機上的資料深入地瞭解了每個使用者的喜好資訊;更值得一提的是Kindle Fire,內嵌的Silk瀏覽器可以將使用者的行為資料一一記錄下來。

以資料為導向的方法並不僅限於以上領域,亞馬遜的企業文化就是冷冰冰的資料導向型文化。對於亞馬遜來說,大資料意味著大銷售量。資料顯示出什麼是有效的、什麼是無效的,新的商業投資專案必須要有資料的支撐。對資料的長期專注讓亞馬遜能夠以更低的售價提供更好的服務。

02 谷歌的意圖

如果說有一家科技公司準確定義了“大資料”概念的話,那一定是谷歌。根據搜尋研究公司comScore的資料,僅2012年3月一個月的時間,谷歌處理的搜尋詞條數量就高達122億條。谷歌的體量和規模,使它擁有比其他大多數企業更多的應用大資料的途徑。

谷歌搜尋引擎本身的設計,就旨在讓它能夠無縫連結成千上萬的伺服器。如果出現更多的處理或儲存需要,抑或某臺伺服器崩潰,谷歌的工程師們只要再新增更多的伺服器就能輕鬆搞定。將所有這些資料集合在一起所帶來的結果是:企業不僅從最好的技術中獲益,同樣還可以從最好的資訊中獲益。下面選擇谷歌公司的其中三個亮點。

谷歌意圖:谷歌不僅儲存了搜尋結果中出現的網路連線,還會儲存使用者搜尋關鍵詞的行為,它能夠精準地記錄下人們進行搜尋行為的時間、內容和方式,坐擁人們在谷歌網站進行搜尋及經過其網路時所產生的大量機器資料。這些資料能夠讓谷歌最佳化廣告排序,並將搜尋流量轉化為盈利模式。谷歌不僅能追蹤人們的搜尋行為,而且還能夠預測出搜尋者下一步將要做什麼。使用者所輸入的每一個搜尋請求,都會讓谷歌知道他在尋找什麼,所有人類行為都會在網際網路上留下痕跡路徑,谷歌佔領了一個絕佳的點位來捕捉和分析該路徑。換言之,谷歌能在你意識到自己要找什麼之前預測出你的意圖。這種抓取、儲存並對海量人機資料進行分析,然後據此進行預測的能力,就是資料驅動的產品。

谷歌分析:谷歌在搜尋之外還有更多獲取資料的途徑。企業安裝“谷歌分析”之類的產品來追蹤訪問者在其站點的足跡,而谷歌也可獲得這些資料。網站還使用“谷歌廣告聯盟”,將來自谷歌廣告客戶網的廣告展示在其站點,因此,谷歌不僅可以洞察自己網站上廣告的展示效果,同樣還可以對其他廣告發布站點的展示效果一覽無餘。

谷歌趨勢:既然搜尋本身是網民的“意圖資料庫”,當然可以根據某一專題搜尋量的漲跌,預測下一步的走勢。谷歌趨勢可以預測旅遊、地產、汽車的銷售。此類預測最著名的就是谷歌流感趨勢,跟蹤全球範圍的流感等病疫傳播,依據網民搜尋,分析全球範圍內流感等病疫的傳播狀況。

03 eBay的分析平臺

早在2006年,eBay就成立了大資料分析平臺。為了準確分析使用者的購物行為,eBay定義了超過500種型別的資料,對顧客的行為進行跟蹤分析。eBay分析平臺高階總監Oliver Ratzesberger說:“在這個平臺上,可以將結構化資料和非結構化資料結合在一起,透過分析促進eBay的業務創新和利潤增長。”

eBay行為分析:在早期,eBay網頁上的每一個功能的更改,通常由對該功能非常瞭解的產品經理決定,判斷的依據主要是產品經理的個人經驗。而透過對使用者行為資料的分析,網頁上任何功能的修改都交由使用者去決定。“每當有一個不錯的創意或者點子,我們都會在網站上選定一定範圍的使用者進行測試。透過對這些使用者的行為分析,來看這個創意是否帶來了預期的效果。”

eBay廣告分析:更顯著的變化反映在廣告費上。eBay對網際網路廣告的投入一直很大,透過購買一些網頁搜尋的關鍵字,將潛在客戶引入eBay網站。為了對這些關鍵字廣告的投入產出進行衡量,eBay建立了一個完全封閉式的優

04 塔吉特的“資料關聯挖掘”

利用先進的統計方法,商家可以透過使用者的購買歷史記錄分析來建立模型,預測未來的購買行為,進而設計促銷活動和個性服務避免使用者流失到其他競爭對手那邊。美國第三大零售商塔吉特,透過分析所有女性客戶購買記錄,可以“猜出”哪些是孕婦。其發現女性客戶會在懷孕四個月左右,大量購買無香味乳液。由此挖掘出25項與懷孕高度相關的商品,製作“懷孕預測”指數。推算出預產期後,就能搶先一步,將孕婦裝、嬰兒床等折扣券寄給客戶。塔吉特還建立了一套購買女性行為在懷孕期間產生變化的模型,不僅如此,如果使用者從它們的店鋪中購買了嬰兒用品,它們在接下來的幾年中會根據嬰兒的生長週期定期給這些顧客推送相關產品,使這些客戶形成長期的忠誠度。

05 中國移動的資料化運營

透過大資料分析,中國移動能夠對企業運營的全業務進行針對性的監控、預警、跟蹤。大資料系統可以在第一時間自動捕捉市場變化,再以最快捷的方式推送給指定負責人,使他在最短時間內獲知市場行情。

客戶流失預警:一個客戶使用最新款的諾基亞手機,每月準時繳費、平均一年致電客服3次,使用WEP和彩信業務。如果按照傳統的資料分析,可能這是一位客戶滿意度非常高、流失機率非常低的客戶。事實上,當蒐集了包括微博、社交網路等新型來源的客戶資料之後,這位客戶的真實情況可能是這樣的:客戶在國外購買的這款手機,手機中的部分功能在國內無法使用,在某個固定地點手機經常斷線,彩信無法使用——他的使用體驗極差,正在面臨流失風險。這就是中國移動一個大資料分析的應用場景。透過全面獲取業務資訊,可能顛覆常規分析思路下做出的結論,打破傳統資料來源的邊界,注重社交媒體等新型資料來源,透過各種渠道獲取儘可能多的客戶反饋資訊,並從這些資料中挖掘更多的價值。

資料增值應用:對運營商來說,資料分析在政府服務市場上前景巨大。運營商也可以在交通、應對突發災害、維穩等工作中使大資料技術發揮更大的作用。運營商處在一個資料交換中心的地位,在掌握使用者行為方面具有先天的優勢。作為資訊科技的又一次變革,大資料的出現正在給技術進步和社會發展帶來全新的方向,而誰掌握了這一方向,誰就可能成功。對於運營商來說,在資料處理分析上,需要轉型的不僅是技巧和法律問題,更需要轉變思維方式,以商業化角度思考大資料營銷。

06 Twitter中的興趣和情緒

Twitter興趣聚類:透過過濾使用者歸屬地、發推位置和相關關鍵詞,Twitter建立了一系列定製化的客戶資料流。比如,透過過濾電影片名、位置和情緒標籤,你可以知道洛杉磯、紐約和倫敦等城市最受歡迎的電影是哪些。而根據使用者釋出的個人行為描述,你甚至能搜尋到那些在加拿大滑雪的日本遊客。從這個視角看,Twitter的興趣圖譜的效率優於Facebook的社交圖譜。Twitter的使用者資料所能產生的潛在價值同樣令人驚歎。在社交媒體網站正在收集越來越多的資料的形勢下,它們或許能找到更好的方式來利用這些資料盈利,並使其取代廣告成為自身提高收入的主要方式。這些社交網站真正的價值可能在於資料本身。相信在不久的將來,如果尋找到既能充分利用使用者資料,又可合理規避對使用者隱私的威脅,社交資料所蘊藏的巨大能量將會徹底被開啟。

Twitter情緒分析:Twitter自己並不經營每一款資料產品,但它把資料授權給了像DataSift這樣的資料服務公司,很多公司利用Twitter社交資料,做出了各種讓人吃驚的應用,從社交監測到醫療應用,甚至可以去追蹤流感疫情爆發,社交媒體監測平臺DataSift還創造了一款金融資料產品。華爾街“德溫特資本市場”公司執行長保羅·霍廷每天的工作之一,就是利用電腦程式分析全球3.4億微博賬戶的留言,進而判斷民眾情緒,再以“1”到“50”進行打分。根據打分結果,霍廷再決定如何處理手中數以百萬美元計的股票。霍廷的判斷原則很簡單:如果所有人似乎都高興,那就買入;如果大家的焦慮情緒上升,那就拋售。一些媒體公司會把觀眾收視率資料打包到產品裡,再轉賣給頻道製作人和內容創造者。

精確的資料一旦與社交媒體資料相結合,對未來的預測會非常準。

07 特易購的精準定向

聰明的商家透過使用者的購買歷史記錄分析來建立模型,為他們量身預測未來的購物清單,進而設計促銷活動和個性服務,讓他們源源不斷地為之買單。特易購是全球利潤第二大的零售商,這家英國超級市場巨人從使用者行為分析中獲得了巨大的利益。從其會員卡的使用者購買記錄中,特易購可以瞭解一個使用者是什麼“類別”的客人,如速食者、單身、有上學孩子的家庭等等。這樣的分類可以為提供很大的市場回報,比如,透過郵件或信件寄給使用者的促銷可以變得十分個性化,店內的促銷也可以根據周圍人群的喜好、消費的時段來更加有針對性,從而提高貨品的流通。這樣的做法為特易購獲得了豐厚的回報,僅在市場宣傳一項,就能幫助特易購每年節省3.5億英鎊的費用。

Tesco的優惠券:特易購每季會為顧客量身定做6張優惠券。其中4張是客戶經常購買的貨品,而另外2張則是根據該客戶以往的消費行為資料分析,極有可能在未來會購買的產品。僅在1999年,特易購就送出了14.5萬份面向不同的細分客戶群的購物指南雜誌和優惠券組合。更妙的是,這樣的低價無損公司整體的盈利水平。透過追蹤這些短期優惠券的回籠率,瞭解到客戶在所有門店的消費情況,特易購還可以精確地計算出投資回報。發放優惠券吸引顧客其實已經是很老套的做法了,而且許多的促銷活動實際只是來掠奪公司未來的銷售額。然而,依賴於紮實的資料分析來定向發放優惠券的特易購,卻可以維持每年超過1億英鎊的銷售額增長。

特易購同樣有會員資料庫,透過已有的資料,就能找到那些對價格敏感的客戶,然後在公司可以接受的最低成本水平上,為這類顧客傾向購買的商品確定一個最低價。這樣的好處一是吸引了這部分顧客,二是不必在其他商品上浪費錢降價促銷。

特易購的精準運營:這家連鎖超市在其資料倉儲中收集了700萬部冰箱的資料。透過對這些資料的分析,進行更全面的監控並進行主動的維修以降低整體能耗。

08 Facebook的好友推薦

Facebook是社交網路巨擎,但是在挖掘大資料價值方面,好像辦法不多,值得一提的就是好友推薦。Facebook使用大資料來追蹤使用者在其網路的行為,透過識別你在它的網路中的好友,從而給出新的好友推薦建議,使用者擁有越多的好友,他們與Facebook之間的黏度就越高。更多的好友意味著使用者會分享更多照片、釋出更多狀態更新、玩更多的遊戲。

09 LinkedIn的獵頭價值

LinkedIn網站使用大資料在求職者和招聘職位之間建立關聯。有了LinkedIn,獵頭們再也不用向潛在的受聘者打陌生電話來碰運氣,而可以透過簡單的搜尋找出潛在受聘者並聯系他們。與此相似,求職者也可以透過聯絡網站上其他人,自然而然地將自己推銷給潛在的僱主。有兩個例子能夠生動呈現LinkedIn的資料價值:幾年前,LinkedIn忽然發現近期雷曼兄弟的來訪者多了起來,當時並沒引起重視,過了不久,雷曼兄弟宣佈倒閉;而在谷歌宣佈退出中國的前一個月,在LinkedIn發現了一些平時很少見的谷歌產品經理線上,這也是相同的道理。如果LinkedIn針對性地分析某家上

10 沃爾瑪的資料基因

早在1969年沃爾瑪就開始使用計算機來跟蹤存貨,1974年就將其分銷中心與各家商場運用計算機進行庫存控制。1983年,沃爾瑪所有門店都開始採用條形碼掃描系統。1987年,沃爾瑪完成了公司內部的衛星系統的安裝,該系統使得總部,分銷中心和各個商場之間可以實現實時,雙向的資料和聲音傳輸。採用這些在當時還是小眾和超前的資訊科技來蒐集運營資料為沃爾瑪最近20年的崛起打下了堅實的地基,從而發現了“啤酒與尿布”關聯。

如今,沃爾瑪擁有著全世界最大的資料倉儲,在資料倉儲中儲存著沃爾瑪數千家連鎖店在65周內每一筆銷售的詳細記錄,這使得業務人員可以透過分析購買行為更加了解他們的客戶。透過這些資料,業務員可以分析顧客的購買行為,從而供應最佳的銷售服務。沃爾瑪一直致力於改善自身的資料收集技術,從條形碼掃描,到安裝衛星系統實現雙向資料傳輸,整個公司都充滿了資料基因。2012年4月,沃爾瑪又收購了一家研究網路社交基因的公司Kosmix,在資料基因的基礎上,又增加了社交基因。

11 阿里小貸和聚石塔

雖然阿里系的餘額寶如日中天,但其實阿里小貸才真正體現出了大資料的價值。早在2010年阿里就已經建立了“淘寶小貸”,透過對貸款客戶下游訂單、上游供應商、經營信用等全方位的評估,就可以在沒有見面情況下,給客戶放款,這當然是對阿里平臺上大資料的挖掘。資料來源於“聚石塔”——一個大型的資料分享平臺,它透過共享阿里巴巴旗下各個子公司的資料資源來創造商業價值。這款產品就是大資料團隊把淘寶交易流程各個環節的資料整合互聯,然後基於商業理解對資訊進行分類儲存和分析加工,並與決策行為連線起來所產生的效果。

12 西爾斯的資料大整合

在過去,美國零售巨頭西爾斯控股公司,需要八週時間才能制定出個性化的銷售方案,但往往做出來的時候,它已不再是最佳方案。痛定思痛,決定整合其專售的三個品牌——Sears、Craftsman、Lands'End的客戶、產品以及銷售資料,使用群集收集來自不同品牌的資料,並在群集上直接分析資料,而不是像以前那樣先存入資料倉儲,避免了浪費時間——先把來自各處的資料合併之後再做分析。這種調整讓公司的推銷方案更快、更精準,可以從海量資訊中挖掘價值,但是價值巨大,困難也巨大:這些資料需要超大規模分析,且分散在不同品牌的資料庫與資料倉儲中,不僅數量龐大而且支離破碎。

西爾斯的困境,在傳統企業中非常普遍,這些企業家一直想不通,既然網際網路零售商亞馬遜可以推薦閱讀書目、推薦電影、推薦可供購買的產品,為什麼他們所在的企業卻做不到類似的事情。西爾斯公司技術長菲裡·謝利(Phil Shelley)說:如果要制定一系列複雜推薦方案質量更高,需要更及時、更細緻、更個性化的資料,傳統企業的IT架構根本不能完成這些任務,需要痛下決心,才能完成轉型。

中篇 輕公司資料創業狂歡

在這次“資料盛宴”中,是否只有大公司的狂歡?並非如此,從事大資料產業的輕公司將無處不在。新興的創業公司透過出售資料和服務更有針對性地提供單個解決方案,把大資料商業化、商品化,才是更加值得我們關注的模式。這將帶來繼入口網站、搜尋引擎、社交媒體之後的新一波創業浪潮和產業革命,並會對傳統的諮詢公司產生強烈衝擊。

13 PredPol的犯罪預測

PredPol公司透過與洛杉磯和聖克魯斯的警方以及一群研究人員合作,基於地震預測演算法的變體和犯罪資料來預測犯罪發生的機率,可以精確到500平方英尺的範圍內。在洛杉磯運用該演算法的地區,盜竊罪和暴力犯罪分佈下降了33%和21%。

14 Tipp24 AG的賭徒行為預測

Tipp24 AG針對歐洲博彩業構建的下注和預測平臺。該公司用KXEN軟體來分析數十億計的交易以及客戶的特性,然後透過預測模型對特定使用者進行動態的營銷活動。這項舉措減少了90%的預測模型構建時間。SAP公司正在試圖收購KXEN,“SAP想透過這次收購來扭轉其長久以來在預測分析方面的劣勢”。

15 Inrix的堵車預言

交通的參與者多種多樣,是大資料最能發揮價值的領域。交通流量資料公司Inrix依靠分析歷史和實時路況資料,能給出及時的路況報告,以幫助司機避開正在堵車的路段,並且幫他們提前規劃好行程。汽車製造商、移動應用開發者、運輸企業以及各類網際網路企業都需要Inrix的路況報告。奧迪、福特、日產、微軟等巨頭都是Inrix的客戶。

16 潘吉瓦的時尚預測

消費者追尋意見領袖的生活方式。潘吉瓦公司就是用資料分析來預測流行趨勢,以此為基礎甚至撬動全球貿易。比如,它們透過41次追蹤《暮光之城》的徽章、襪子的運輸情況,分析在這部電影中主角的服飾對流行趨勢有多大影響率,並將分析結果告知使用者,建議他們對自己的行動做出恰當的調整。

17 潘多拉的音樂推薦

美國線上音樂網站潘多拉特別聘請一些音樂專家,讓他們每個人平均花上20分鐘去分析一首歌曲,並賦予每首歌400種不同的屬性。如果你表示喜歡一首歌,程式會自動尋找跟這首歌“基因”相同的歌曲,猜測你也會喜歡並採用推薦引擎技術推薦給你。藉助這種人海戰術,潘多拉網站已經分析了74萬首歌曲。

18 Futrix Health的醫療方案

Futrix Health是一家專注於用透過資料為患者制定醫療解決方案的公司,從安裝在智慧手機上的個人健康應用,到診所、醫院裡醫生使用的電子健康記錄儀,甚至是革命性的數字化基因組資料,均連線到後端資料倉儲上。從而為患者制定最佳的醫院選擇、醫藥選擇。該如何將採集到醫療保健機構的大量操作資訊,分析患者情況或治療效果,實施任何高效率的措施,使之更具有意義——大資料時代提供的機會,不再是簡單地收集這些資料,而是如何運用資料來更好地認知這個世界。

19 Retention Science的使用者粘性

在零售領域,創業公司Retention Science釋出了一個為電子商務企業提供增強使用者粘性的資料分析及市場策略設計的平臺,它的使用者建模引擎具備自學習功能,透過使用演算法和統計模型來設計最佳化使用者粘性的策略。平臺的使用者資料分析都是實時進行,以確保使用者行為預測總是符合實際使用者行為更新;同時,動態的根據這些行為預測來設計一些促銷策略。RS目前已獲得Baroda Ventures, Mohr Davidow Ventures, Double M Partners及一些著名天使投資人130萬美金的投資。

20 眾瀛的婚嫁後推薦

江蘇眾瀛聯合資料科技有限公司構建了這樣一個大資料平臺——將準備結婚的新人作為目標消費者,並把與結婚購物相關的商家加入其中。一對新人到薇薇新娘婚紗影樓拍了婚紗照,在實名登記了自己的資訊後會被上傳到大資料平臺上。大資料平臺能根據新人在婚紗影樓的消費情況和偏好風格,大致分析判斷出新人後續消費需求,即時傳送獎勵和促銷簡訊。比如邀請他們到紅星美凱龍購買傢俱、到紅豆家紡選購床上用品、到國美電器選購家用電器、到希爾頓酒店擺酒席……如果新人在紅星美凱龍購買了中式傢俱,說明他們偏好中國傳統文化,就推薦他們購買紅豆家紡的中式家居用品。

21 Takadu的數字馴水

水,向來是個不好管理的東西:自來水公司發現某個水壓計出現問題,可能需要花上很長的時間排查共用一個水壓計的若干水管。等找到的時侯,大量的水已經被浪費了。以色列一家名為Takadu的水系統預警服務公司解決了這個問題。Takadu把埋在地下的自來水管道水壓計、用水量和天氣等檢測資料蒐集起來,透過亞馬遜的雲服務傳回Takadu公司的電腦進行演算法分析,如果發現城市某處地下自來水管道出現爆水管、滲水以及水壓不足等異常狀況,就會用大約10分鐘完成分析生成一份報告,發回給這片自來水管道的維修部門。報告中,除了提供異常狀況型別以及水管的損壞狀況——每秒漏出多少立方米的水,還能相對精確地標出問題水管具體在哪裡。檢測每千米“水路”,Takadu的月收費是1萬美元。

22 百合網的婚戀匹配

電商行業的現金收入源自資料,而婚戀網站的商業模型更是根植於對資料的研究。比如,作為一家婚戀網站,百合網不僅需要經常做一些研究報告,分析註冊使用者的年齡、地域、學歷、經濟收入等資料,即便是每名註冊使用者小小的頭像照片,這背後也大有挖掘的價值。百合網研究規劃部李琦曾經對百合網上海量註冊使用者的頭像資訊進行分析,發現那些受歡迎頭像照片不僅與照片主人的長相有關,同時照片上人物的表情、臉部比例、清晰度等因素也在很大程度上決定了照片主人受歡迎的程度。例如,對於女性會員,微笑的表情、直視前方的眼神和淡淡的妝容能增加自己受歡迎的機率,而那些臉部比例佔照片1/2、穿著正式、眼神直視沒有多餘pose的男性則更可能成為婚戀網站上的寵兒。

23 Prismatic的新聞外衣

Prismatic是一款個性化新聞應用,只有4名創始員工,憑藉網際網路資料爬蟲和社交網路開發平臺的資料,依託亞馬遜的雲端計算平臺,實現了大資料的精益創業。Prismatic不提供統一的設計精良的新聞訂閱或推薦介面,而是根據分析使用者的Facebook 或Twitter資料,為使用者做一對一的資料分析和推薦。從盈利模式來看,Prismatic不是依靠廣告費生存下來,也不是傳統的新聞媒介,而是一個披著新聞應用外衣的電子商務公司。名義上為了給使用者個性化推薦新聞而得到使用者的個人資訊進行資料分析,針對性的推出推薦商品,從而從電子商務中盈利。

24 Opower的對比激勵

人類都有和同類對比的天性,例如,一家政府機構收集不同地點從事同類工作的多組員工的資料,僅僅將這些資訊公諸於眾就促使落後員工提高了績效。在能源行業,Opower使用資料對比來提高消費用電的能效,並取得了顯著的成功。作為一家SaaS的創新公司,Opower與多家電力公司合作,分析美國家庭用電費用並將之與周圍的鄰居用電情況進行對比,被服務的家庭每個月都會受到一份對比的報告,顯示自家用電在整個區域或全美類似家庭所處水平,以鼓勵節約用電。Opower的服務以覆蓋了美國幾百萬戶居民家庭,預計將為美國消費用電每年節省5億美元。Opower報告信封,看上去像賬單,它們使用行為技術輕輕地說服公用事業客戶降低消耗。Opower已經推出了它的大資料平臺 Opower4 ,透過分析各種智慧電錶和用電行為,電力公司等公用事業單位成為Opower的盈利來源。而對一般使用者而言,Opower完全是免費的。

25 Chango和Uniqlick的點選消費

使用新的資料技術,諸如美國的Chango公司和中國的Uniqlick公司正在數字廣告行業中探索新的商業模式——實時競拍數字廣告。透過了解網際網路使用者在網路的搜尋、瀏覽等行為,這些公司可以為廣告主提供最有可能對其商品感興趣的使用者群,從而進行精準營銷;更長期的趨勢是,將廣告投放給最有可能購買的使用者群。這樣的做法對於廣告主來說,可以獲得更高的轉換率,而對於釋出廣告的網站來說,也提高了廣告位的價值。

26 眾趣的行為辯析

眾趣是國內第一家社交媒體資料管理平臺,目前國內主要的社交開放平臺在使用者資料的開放性方面仍比較保守,身為第三方資料分析公司,能夠獲得的使用者資料還十分有限,要使用這些使用者資料需獲得使用者許可。眾趣透過運營統計學等相關資料分析原理對使用者資料進行過濾,最終完成的是對一個使用者的行為、動作等個體特徵的描述。這些描述可以幫助品牌營銷者瞭解消費者的消費習慣及需求;也可以幫助企業的領導增強對自己員工的瞭解。除了對個體以及群體行為特徵的描述外,這些資料分析結果還可用於對使用者群體的行為預測,從而為營銷者提供一些前瞻性的市場分析。眾趣資料分析的結果只能精準到群組而無法達到個人。此類的使用者資料研究除在市場營銷領域具有一定的參考價之外,目前大多還主要用於配合一些小調研。此外,這些資料還可以實現對使用者甚至企業機構的信用評級,在金融領域也有一定程度的使用。

27 拖拉網的明天猜想

導購電商的拖拉網製作了“明天穿什麼”這一應用。在這個應用當中,眾多時裝圈權威人士輸送時裝搭配與風格單品,由使用者任意打分,根據使用者的打分偏好,拖拉網便能猜到明天她們想穿什麼,然後為她在數十萬件網購時裝中推薦單品,並且實現直通購買下單。在獲取客戶資料後,後臺分析也是各顯神通。

拖拉網加入了更多變數來考核自己的推薦模式。比如有消費者明天要參加一個聚會,不知道要穿什麼風格,也沒有看天氣預報,希望導購網站能幫她把這些場景和自己的資訊組合起來,給出一整套的解決方案。於是日期、地域、場合、風格,這些都成為穿衣搭配解決方案的變數,經過不斷的組合呈現給使用者,據拖拉網資料,使用者在看到一個比較優質的搭配,並有場景性引導的時候,點選到最後頁面完成購買的轉化率會比單品推薦高40%。

28 SeeChange的基因健康

現在人們有了把人類基因檔案序列化的能力,這允許醫生和科學家去預測病人對於某些疾病的易感染性和其他不利的條件,可以減少治療過程的時間和花費。位於舊金山的SeeChange公司建立了一套新的健康保險模式。該公司透過分析客戶的個人健康記錄、醫療報銷記錄、以及藥店的資料,來判斷該客戶對於慢性病的易感性,並判斷該客戶是否有可能從一些定製的康復套餐中獲利。SeeChange同時設計健康計劃,並設立獎勵機制鼓勵客戶主動完成健康行動,全過程都透過其資料分析引擎來監控。

29 Given Imaging的影像診斷

以色列的Given Imaging公司發明了一種膠囊,內建攝像頭,患者服用後膠囊能以大約每秒14張照片的頻率拍攝消化道內的情況,並同時傳回外接的影像接收器,患者病徵透過配套的軟體被錄入資料庫,在4至6小時內膠囊相機將透過人體排洩離開體外。一般來說,醫生都是在靠自己的個人經驗進行病徵判斷,難免會對一些疑似陰影拿捏不準甚至延誤病人治療。現在透過Given Imaging的資料庫,當醫生發現一個可疑的腫瘤時,雙擊當前影像後,過去其他醫生拍攝過的類似影像和他們的診斷結果都會悉數被提取出來。可以說,一個病人的問題不再是一個醫生在看,而是成千上萬個醫生在同時給出意見,並由來自大量其他病人的影像給出佐證。這樣的資料對比,不但提高了醫生診斷的效率,還提升了準確度。

30 Entelo的“前獵頭”

真正的技術人才永遠是各大公司的搶手貨,絕對不要坐等他們向你投簡歷,因為在他們還沒有機會寫簡歷之前很可能已經被其他公司搶走了。Entelo公司能替企業家們推薦那些才剛剛萌發跳槽動機的高階技術人才,以便先下手為強。

Entelo的資料庫裡目前有3億份簡歷。而如何判斷高階人才的跳槽傾向,Entelo有一套正在申請專利的演算法。這套演算法有70多個指標用於判定跳槽傾向。某公司的股價下跌、高層大換血、剛被另一大公司收購,這些都會被Entelo看作是導致該公司人才跳槽的可能性因素。於是Entelo就會立刻把該公司裡的高階人才的資訊推送給訂閱了自己服務的企業家們。企業家們收到的簡歷跟一般的簡歷還不一樣。Entelo抓取了這些人才在各大社交網路的資訊。這樣企業家們可以瞭解該人提交過哪些程式碼,在網上都回答了些什麼樣的問題,在Twitter上都發表的是些什麼樣的資訊。總之,這些準備“挖角”的企業家能夠看到一個活生生的目標人才站在面前。

31 FlightCaster和Passur的延誤預測

航空業分秒必爭,尤其是航班抵達的準確時間。如果一班飛機提前到達,地勤人員還沒準備好,乘客和乘務員就會被困在飛機上白白耽誤時間;如果一班飛機延誤,地勤人員就只能坐著乾等,白白消耗成本。美國一家大航空公司從其內部報告中發現,大約10%的航班的實際到達時間與預計到達時間相差10分鐘以上,30%的航班相差5分鐘以上。FlightCaster是一家提供航班延誤資訊預測的公司,主要根據航空公司的航班執行情況進行預測。與航空公司所擁有的類似航班執行情況的專有資訊一樣,該公司擁有大量國內航班飛行和航班實時執行狀況的歷史資料。Flightcaster的秘訣就是其對大資料分析的有效利用和使用適當的軟體工具對產出資料進行實時管理。

Passur Aerospace是專門為航空業提供決策支援的技術公司。透過蒐集天氣、航班日程表等公開資料,結合自己獨立收集的其他影響航班因素的非公開資料,綜合預測航班到港時間。時至2012年,Passur公司已經擁有超過155處雷達接收站,每4.6秒就收集一次雷達上每架飛機的一系列資訊,這會持續地帶來海量資料。不僅如此,經過長期的資料收集,Passur擁有了一個超過十年的巨大的多維資訊載體,為透徹的分析和恰當的資料模型提供了可能。Passur公司相信,航空公司依據它們提供的航班到達時間做計劃,能為每個機場每年節省數百萬美元。

32 Climate的農業保險

一家名為氣候公司的創業企業每天都會對美國境內超過100萬個地點、未來兩年的天氣情況進行超過1萬次模擬,其資料量龐大、動態、實時。隨後,該公司將根系結構和土壤孔隙度的相關資料,與模擬結果相結合,為成千上萬的農民提供農作物保險。透過遙感獲取土壤資料,這和我們過去所熟悉的透過網路服務獲取使用者網路行為資料不是一回事,資料的概念得以極大的擴充。要想對每塊田地提供精準的保險服務,肯定還需要與土地資料相配套的農產品期貨、氣候預測、國際貿易、國際政治和軍事安全、國民經濟,產業競爭等等各方面的數。在如此龐雜的大資料基礎上推出的商業模式是創新的,同現有農作物保險方式相比具備極大競爭力,並且是可持續和規模化的。更妙的是,這家公司基於大資料的運營,完全沒有進行高額的網路設施投資,只是租用了亞馬遜的公共雲服務,一個月幾萬美元而已。

33 Hiptype的記錄閱讀

幾乎所有的收費電子書都會提供部分章節讓讀者試讀,其實,出版商需要弄清楚人們讀到了哪裡、讀完後有沒有購買,以及其他各種體驗,才能賣出更多的電子書。美國創業公司Hiptype開發了一套電子書閱讀分析工具,其商業模式就在試圖解決這一難題。Hiptype自稱為“面向電子書的Google Analytics”,能夠提供與電子書有關的豐富資料。它不僅能統計電子書的試讀和購買次數,還能繪製出“讀者圖譜”,包括使用者的年齡、收入和地理位置等。此外,它還能告訴出版商讀者在看完免費章節後是否進行了購買,有多少讀者看完了整本書,以及讀者平均看了多少頁,讀者最喜歡從哪個章節開始看,又在哪個章節半途而廢,等等。Hiptype能夠與電子書整合在一起,出版商無論選擇哪種渠道,總是能夠獲得使用者資料。Hiptype收集的所有資料都是匿名的。使用者在下載了內建Hiptype服務的電子書時,會得到一個提示,可以選擇將其遮蔽。

34 安客誠的“人網合一”

網路營銷存在一個巨大問題,如何獲知在網上使用幾個不同名稱的人是否是同一個人?安誠客推出了一種名為“觀眾作業系統”的技術方案解決了這個問題。它允許市場營銷者與你的 “數字人物”繫結,即使你由於婚姻換了名字,或者使用暱稱,或者偶爾使用中名,它也照樣能夠解答那個已經換了地址或者電話號碼的人是否是同一個人的問題。

AOS 可以彙集不同資料庫中的資訊,這些資料或離線或線上,是公司可能在不同場合針對個人而收集的。透過使用AbiliTec——一種Acxiom也擁有的數字化“身份識別”技術——AOS將客戶資訊刪繁就簡,得到簡單單一的結果。AOS幫助安誠客的廣告客戶使用他們的資料在Facebook上找到廣告投放目標使用者。

下篇 資料關聯、資料廢氣和黑暗資料

大資料主要不作因果判斷,主要適用於關聯分析。很多關聯分析並不需要複雜的模型,只需要具有大資料的意識。

很多機構都有資料廢氣,資料不是用完就是被捨棄,它的再利用價值也許你現在不清楚,但在未來的某一刻,它會迸發出來,可以化廢為寶。

黑暗資料就是那些針對單一目標而收集的資料,通常用過之後就被歸檔閒置,其真正價值未能被充分挖掘。如果黑暗資料用在恰當的地方,也能公司的事業變得光明。

35 資料關聯分析

某公司團隊曾經使用來自手機的位置資料,來推測美國聖誕節購物季開始那一天有多少人在梅西百貨公司的停車場停車,進而可以預測其當天的銷售額,這遠早於梅西百貨自己統計出的銷售記錄。無論是華爾街的分析師或者傳統產業的高管,都會因這種敏銳的洞察力獲得極大的競爭優勢。

對於稅務部門來說,稅務欺騙正在日益的被關注,這時大資料可以用於增加政府識別詐騙的流程。在隱私允許的地方,政府部門可以綜合各個方面的資料比如車輛的登記,海外旅遊的資料來發現個人的花費模式,使稅務貢獻不被疊加。同時一個可疑的問題出現了,這並沒有直接的證據指向詐騙,這些結論並不能用來去控告個人。但是他可以幫助政府部門去明確他們的審計和其他的稽核以及一些流程。

36 資料廢氣

物流公司的資料原來只服務於運營需要,但一經再利用,物流公司就華麗轉身為金融公司,資料用以評估客戶的信用,提供無抵押貸款,或者拿運送途中的貨品作為抵押提供貸款;物流公司甚至可以轉變為金融資訊服務公司來判斷各個細分經濟領域的執行和走勢。

有公司已經在大資料中有接近“上帝俯視”的感覺,美國洛杉磯的一家企業宣稱,他們將全球夜景的歷史資料建立模型,在過濾掉波動之後,做出了投資房地產和消費的研究報告。麥當勞則透過外送服務,在售賣漢堡的同時獲得了使用者的精準地址,這些地址資料彙集之後,就變成了一份絕妙的房地產業的內部資料。

37 黑暗資料

在特定情況下,黑暗資料可以用作其他用途。Infinity Property & Casualty公司用累積的理賠師報告來分析欺詐案例,透過演算法挽回了1200萬美元的代位追償金額。一家電氣銷售公司,透過積累10年ERP銷售資料分析,按照電氣裝置的生命週期,給5年前的老客戶逐一拜訪,獲得了1000萬元以上電氣裝置維修訂單,順利地進入MRO市場。

38 客戶流失分析

美國運通以前只能實現事後諸葛亮式的報告和滯後的預測,傳統的BI已經無法滿足其業務發展的需要。於是,AmEx開始構建真正能夠預測客戶忠誠度的模型,基於歷史交易資料,用115個變數來進行分析預測。該公司表示,對於澳大利亞將於之後4個月中流失的客戶,已經能夠識別出其中的24%。這樣的客戶流失分析,當然可以用於挽留客戶。酒店業可以為消費者定製相應的獨特的個性房間,甚至可以在牆紙上放上消費者的微博的旅遊心情等等。旅遊業可以根據大資料為消費者提供其可能會喜好的本地特色產品、活動、小而美的小眾景點等等來挽回遊客的心。

39 快餐業的影片分析

快餐業的公司可以透過影片分析等候佇列的長度,然後自動變化電子選單顯示的內容。如果佇列較長,則顯示可以快速供給的食物;如果佇列較短,則顯示那些利潤較高但準備時間相對長的食品。

40 大資料競選

2012年,參與競選的奧巴馬團隊確定了三個最根本的目標:讓更多的人掏更多的錢,讓更多的選民投票給奧巴馬,讓更多的人參與進來!這需要“微觀”層面的認知:每個選民最有可能被什麼因素說服?每個選民在什麼情況下最有可能掏腰包?什麼樣的廣告投放渠道能夠最高效獲取目標選民?如競選總指揮吉姆·梅西納所說,在整個競選活中,沒有資料做支撐的假設不能存在。

為了籌到10億美元的競選款,奧巴馬的資料探勘團隊在過去兩年蒐集、儲存和分析了大量資料。他們注意到,影星喬治·克魯尼對美國西海岸40歲至49歲的女性具有非常大的吸引力:她們無疑是最有可能為了在好萊塢與克魯尼和奧巴馬共進晚餐而不惜自掏腰包的一個群體。克魯尼在自家豪宅舉辦的籌款宴會上,為奧巴馬籌集到數百萬美元的競選資金。此後,當奧巴馬團隊決定在東海岸物色一位對於這個女性群體具有相同號召力的影星時,資料團隊發現莎拉·傑西卡·帕克的粉絲們也同樣喜歡競賽、小型宴會和名人。“克魯尼效應”被成功地複製到了東海岸。

在整個的競選中,奧巴馬團隊的廣告費用花了不到3億美元,而羅姆尼團隊則花了近4億美元卻落敗,其中一個重要的原因在於,奧巴馬的資料團隊對於廣告購買的決策,是經過縝密的資料分析之後才制定的。一項民調顯示,80%的美國選民認為奧巴馬比羅姆尼讓他們感覺更加重視自己。結果是,奧巴馬團隊籌得的第一個1億美元中,98%來自於小於250美元的小額捐款,而羅姆尼團隊在籌得相同數額捐款的情況下,這一比例僅為31%。

41 監控非法改建

“私搭亂建”在哪個國家都是一件鬧心的事,而且容易引起火災。非法在屋內打隔斷的建築物著火的可能性比其他建築物高很多。紐約市每年接到2.5萬宗有關房屋住得過於擁擠的投訴,但市裡只有200名處理投訴的巡視員。市長辦公室一個分析專家小組覺得大資料可以幫助解決這一需求與資源的落差。該小組建立了一個市內全部90萬座建築物的資料庫,並在其中加入市裡19個部門所收集到的資料:欠稅扣押記錄、水電使用異常、繳費拖欠、服務切斷、救護車使用、當地犯罪率、鼠患投訴等等。接下來,他們將這一資料庫與過去5年中按嚴重程度排列的建築物著火記錄進行比較,希望找出相關性。果然,建築物型別和建造年份是與火災相關的因素。不過,一個沒怎麼預料到的結果是,獲得外磚牆施工許可的建築物與較低的嚴重火災發生率之間存在相關性。

利用所有這些資料,該小組建立了一個可以幫助他們確定哪些住房擁擠投訴需要緊急處理的系統。他們所記錄的建築物的各種特徵資料都不是導致火災的原因,但這些資料與火災隱患的增加或降低存在相關性。這種知識被證明是極具價值的:過去房屋巡視員出現場時簽發房屋騰空令的比例只有13%,在採用新辦法之後,這個比例上升到了70%。

42 榨菜指數

負責起草《全國促進城鎮化健康發展規劃(2011-2020年)》(以下簡稱“城鎮化規劃”)的國家發改委規劃司官員需要精確知道人口的流動,怎麼統計出這些流動人口成為難題。

榨菜,屬於低質易耗品,收入增長對於榨菜的消費幾乎沒有影響。一般情況下,城市常住人口對於泡麵和榨菜等方便食品的消費量,基本上是恆定的。銷量的變化,主要由流動人口造成。

據國家發改委官員的說法,涪陵榨菜這幾年在全國各地區銷售份額變化,能夠反映人口流動趨勢,一個被稱為“榨菜指數”的宏觀經濟指標就誕生了。國家發改委規劃司官員發現,涪陵榨菜在華南地區銷售份額由2007年的49%、2008年的48%、2009年的47.58%、2010年的38.50%下滑到2011年的29.99%。這個資料表明,華南地區人口流出速度非常快。他們依據“榨菜指標”,將全國分為人口流入區和人口流出區兩部分,針對兩個區的不同人口結構,在政策制定上將會有所不同。

43 天氣賬單

常言道,“天有不測之風雲”,遇到過出門旅遊、重要戶外路演、舉辦婚禮等重要時刻卻被糟糕的天氣弄壞心情甚至造成經濟損失的情況嗎?全球第一家氣象保險公司“天氣賬單”能為使用者提供各類氣候擔保。客戶登入“天氣賬單”公司網站,然後給出在某個特定時間段裡不希望遇到的溫度或雨量範圍。“天氣賬單”網站會在100毫秒內查詢出客戶指定地區的天氣預報,以及美國國家氣象局記載的該地區以往30年的天氣資料。透過計算分析天氣資料,網站會以承保人的身份給出保單的價格。這項服務不僅個人使用者需要,一些公司,比如旅行社也很樂意參與。

一家全球性飲料企業將外部合作伙伴的每日天氣預報資訊整合,錄入其需求和存貨規劃流程。透過分析特定日子的溫度、降水和日照時間等3個資料點,該公司減少了在歐洲一個關鍵市場的存貨量,同時使預測準確度提高了大約5%。

44 歷史情景再現

微軟和以色列理工學院的研究人員已開發出一款軟體,能根據過去20年《紐約時報》的文章以及其他線上資料預測傳染病或者其他社會問題可能會於何時何地爆發。

在利用歷史資料進行測試時,該系統的表現十分驚人。例如,根據2006年對安哥拉乾旱的報導,該系統預測安哥拉很可能發生霍亂。這是由於,透過此前發生的多起事件,該系統瞭解到在乾旱出現的幾年後霍亂爆發的可能性將上升。此外,該系統根據對2007年初非洲大型颶風的報導,再次對安哥拉發生霍亂做出預警。而在不到一週之後,報導顯示安哥拉確實發生了霍亂。在其他測試,例如對疾病、暴力事件及傷亡人數的預測中,該系統的準確率達到70%至90%。

該系統的資訊來自過去22年中《紐約時報》的報導存檔,具體時間為1986年至2007年。不過,該系統也利用了網路上的其他一些資料,瞭解什麼樣的事件會帶來特定的社會問題。這些資訊來源提供了不存在於新聞文章但卻有價值的內容,有助於確定不同事件之間的因果關係或前後關係。例如,該系統能夠推斷盧安達和安哥拉城市之間所發生事件的關係,因為這兩個國家都位於非洲,有著類似的GDP,其他一些因素也很相似。根據這種方法,該系統認為,在預測霍亂爆發方面,應當考慮國家或城市的位置,國土面積有多少是水域,人口密度和GDP是多少,以及近幾年是否發生過乾旱。

負責此項研發工作的Horvitz表示,近幾十年來,世界的許多方面都發生了改變,不過人類的本性和環境的許多方面仍然未變,因此軟體可以從以往的資料中瞭解事情發生的模式,從而預測未來會發生什麼。他表示:“對於回溯更久之前的資料,我個人很感興趣。”

此類預測工具的市場正在形成。例如,一家名為RecordedFuture的創業公司根據網上的前瞻性報導和其他資訊來源預測未來事件,該公司的客戶包括政府情報部門。該公司CEOChristopherAhlberg表示,利用“硬資料”來進行預測是可行的,但從原型系統到商用產品還有很長的路要走。

45 Nike+感測鞋

耐克憑藉一種名為Nike+的新產品變身為大資料營銷的創新公司。所謂Nike+,是一種以“Nike跑鞋或腕帶+感測器”的產品,只要運動者穿著Nike+的跑鞋運動,iPod就可以儲存並顯示運動日期,時間、距離、熱量消耗值等資料。使用者上傳資料到耐克社群,就能和同好分享討論。耐克和Facebook達成協議,使用者上傳的跑步狀態會實時更新到賬戶裡,朋友可以評論並點選一個“鼓掌”按鈕——神奇的是,這樣你在跑步的時候便能夠在音樂中聽到朋友們的鼓掌聲。隨著跑步者不斷上傳自己的跑步路線,耐克由此掌握了主要城市裡最佳跑步路線的資料庫。有了Nike+,耐克組織的城市跑步活動效果更好。參賽者在規定時間內將自己的跑步資料上傳,看哪個城市累積的距離長。憑藉運動者上傳的資料,耐克公司已經成功建立了全球最大的運動網上社群,超過500萬活躍的使用者,每天不停地上傳資料,耐克藉此與消費者建立前所未有的牢固關係。海量的資料對於耐克瞭解使用者習慣、改進產品、精準投放和精準營銷又起到了不可替代的作用。

46 沃爾沃的工業網際網路

在沃爾沃集團,透過在卡車產品中安裝感測器和嵌入式CPU,從剎車到中央門鎖系統等形形色色的車輛使用資訊,正源源不斷地傳輸到沃爾沃集團總部。“對這些資料進行分析,不僅可以幫助我們製造更好的汽車,還可以幫助客戶們獲取更好體驗。”沃爾沃集團CIORichStrader說。這些資料正在被用來最佳化生產流程,以提升客戶體驗和提升安全性。將來自不同客戶的使用資料進行分析,可以讓產品部門提早發現產品潛在的問題,並在這些問題發生之前提前向客戶預警。“產品設計方面的缺陷,此前可能需要有50萬臺銷量的時候才能暴露出來,而現在只需要1000臺,我們就能發現潛在的缺陷。”

47 McKesson的動態供應鏈

在美國最大的醫藥貿易商McKesson公司,對大資料的應用也已經遠遠領先於大多數企業,將先進的分析能力融合到每天處理200萬個訂單的供應鏈業務中,並且監督超過80億美元的存貨。對於在途存貨的管理,McKesson開發了一種供應鏈模型,它根據產品線、運輸費用甚至碳排放量而提供了極為準確的維護成本檢視。據公司流程改造副總裁RobertGooby說,這些詳細資訊使公司能夠更加真實地瞭解任意時間點的運營情況。McKesson利用先進分析技術的另一個領域是對配送中心內的物理存貨配置進行模擬和自動化處理。評估政策和供應鏈變化的能力幫助公司增強了對客戶的響應能力,同時減少了流動資金。總體來講,McKesson的供應鏈轉型使公司節省了超過1億美元的流動資金。

48 紙牌屋與電影業

《紙牌屋》最大的特點在於,與以往電視劇的製作流程不同,這是一部“網路劇”。簡而言之,不僅傳播渠道是網際網路觀看,這部劇從誕生之初就是一部根據“大資料”,即網際網路觀眾欣賞口味來設計的產品。Netflix成功之處在於其強大的推薦系統Cinematch,該系統基於使用者影片點播的基礎資料如評分、播放、快進、時間、地點、終端等,儲存在資料庫後透過資料分析,計算出使用者可能喜愛的影片,併為他提供定製化的推薦。為此他們開設了年Netflix大獎(點選檢視獲獎演算法),用百萬美元懸賞,獎勵能夠將其電影推薦演算法準確性提高至少10%的人。

未來的電影製作成本將大幅降低,一千粉絲足以使電影成功。還是像《技術元素》裡說:“目光聚集的地方,金錢必將追隨。”

49 點評與餐飲業

美國很多州政府在與餐飲點評網lep展開合作,監督餐飲行業的衛生情況,效果非常好。人們不再像以前那樣從視窗去看餐館裡的情況,而是從手機APP裡的評論!在中國的本地化O2O點評比如大眾點評、番茄點等等,消費者可以對任何商家進行評判,同時商家也可以透過這些評判來提升自己的服務能力,在環節上進行更大力度的效率最佳化。

未來的餐飲行業將會由網際網路和社會化媒體上所產生和承載的資料徹底帶動起來,會有越來越多的人加入點評中,餐館優勝劣汰的速度將會大幅加快。


原文釋出時間為:2018-08-12


本文來自雲棲社群合作伙伴“ 大資料地盤 ”,瞭解相關資訊可以關注“ 大資料地盤 ”。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31077337/viewspace-2199968/,如需轉載,請註明出處,否則將追究法律責任。

相關文章