大資料商業分析-Top down還是Buttom top
copy來的,作筆記。
現在搞大資料(後端資料)的朋友,和早些年搞資料倉儲的沒啥本質區別,因為都是人為需要把各系統的資料集中化,現在增加個非結構化資料,於是就叫大資料,而以前就叫資料倉儲。
在10多年前,資料倉儲界一直有個爭論,到底是TOP-DOWN好還是Bottom-UP好,一邊說,我先把企業所有資料都整合,資料基礎做紮實了,然後分析就可以源源不斷產出了。而另一邊認為,我們得先建資料集市,把業務主題搞紮實,讓資料先有產出,然後再多個主題後再進行資料梳理整合。
前者的詬病是大半年都不會有啥“資料變現”的產出,問產出,就一直在說,系統搭建中,XX系統搭好了,XX業務資料整合了,等等。後者的詬病是,資料是有產出了,但是不同主題間的資料會有管理問題、每個主題需要不斷新增新的資料來源,開發、資料冗餘都是個問題。
這是資料倉儲界爭論10多年的話題,直到近兩年大資料興起,大家就都沒興趣討論了。在很多企業,大家都採用資料團隊組織基礎資料,做傳統資料倉儲前者的事情,再組織一個商業資料分析團隊,做後者的事情。只不過大家都很少提資料倉儲、BI這些老概念,不知道認為過時了,還是新一代資料人都不知道這些歷史。其實本質是一樣的,IBM等企業10年前就是2個團隊在做,前後者的優勢兼得。
------------------商業資料分析的傳統---------------
在商業資料分析方面,我也是近4、5年才真正切入,之前都是做傳統的資料倉儲和BI。不過我經常欣賞幾十年前的小資料商業分析的成功案例,試想小資料時代商業分析如此成功,大資料時代炒得那麼熱,卻炒來炒去,就那麼幾個案例,有意思麼?
我這裡還是介紹那2個經典小資料時代的案例:
1。早期超市為了優化超市設計,採用人工觀察,到後來的視訊觀察,來解析使用者行為,他們解析使用者行為的時候,發現了幾個方面的業務改進Idea,超出了預期的想法。當看到人們眼光主要放在眼睛上下30度範圍,於是陳列的時候,總是把利潤最高的放這2排,利潤低,價效比高的分別放上面和最下面;當發現人們通過買麵包順便買紅酒,而不是買紅酒順便買麵包,於是他們改變兩種商品的組合和區域順序;當發現免費品嚐某水果,可以帶動新鮮水果以及高利潤的純果汁的時候,超市又改變了策略。。。。。。。。
2。有個商場,糾結於傳統方案是現代方案,於是兩個方案同時上,一個是用諮詢團隊,一個是監控方案,數人數看人流。結果諮詢團隊的方案勝,原因是諮詢團隊雖然是小資料,但是他們的抽樣資料都是按照經驗選擇恰當的樣本,其次小資料的資訊非常全面,包括人的性別、年齡、身份背景、收入水平(經驗判斷)、去哪個區域,買東西走到哪一步了(諮詢、試穿、有沒討價還價),這些資料監控都沒法得出,所以監控資料全面,但無法給出任何實質價值意義的建議,都是些空話。
-----------大資料商業分析應該TO-DWON還是Botton-Up?--------------
一種思路是需要足夠大、全面的資料,沒有解決不了的分析,一上來把所有可能的維度、資料分佈、趨勢都嘗試一遍,認為沒有規律也能看出規律了;一種是看問題,需要解決什麼問題,就做什麼分析,缺什麼資料再從大資料中去取。
有人問,如果採用第二種方案,那麼大資料價值何在,那麼多資料都沒利用起來?我想問,如果你想挖前面一座金山,你是挖一部分,然後淘一部分出來賣,還是把金山都挖完,然後一點點淘出來賣呢?當然你選擇第一種,但你選擇這個,你不會說浪費了整個金山,因為你知道你需一點點變現後才會有動力挖後面的。但為啥那麼多搞大資料的人不是這個思路呢?
看到這裡,可能大家認為我偏向第二種方案,其實不全是,我一直認為任何方案都有其優勢,中庸取其精華最好。第二種方案的死穴是,如果你問題沒搞得透徹明白,那麼分析的都是無用功,都是在錯誤的軌道上轉圈。
------------------什麼是大資料時代好的分析方案?-----------------
我們來看第一個超市案例,他通過一個簡單的、人工判斷過的“使用者行為”資料解決了這麼多各種業務難題(陳列、佈局、商品搭配、促銷等),是因為他們發現一個問題,然後去解決的思路麼?不是,而是充分以“商業”為中心,以“迎合使用者需求,滿足商業利益最大化”這一個最大分析目的,發現了使用者行為,原來對這麼多商業佈局都有改進的地方,可以同時滿足使用者的購物需求,也滿足商業利益最大化的需求,於是產生了後來的一系列超市零售改進。
再看大資料的案例,某人收到小孩用品推薦,他很生氣投訴,結果沒多久就寫感謝信,說他女兒真的懷孕了,感謝云云。其實從這個案例中,除非給人驚奇外,有多大“商業價值”?如果純從資料商業價值來說,這個分析推薦的作用,比起超市零售通過使用者行為的變革,簡直不值得一提,為啥還廣為流傳? 因為大資料時代,還找不出像樣的案例,於是就拿驚奇的案例來吸引大眾注意吧。
反過來說,並非大資料無用,或者說大資料不是遠不夠大(要知道比超市人工觀察的資料大多了),而是大資料分析和應用的人們思維並未完全開啟,我相信做推薦的朋友沒多少熟悉供應鏈的,也沒多少熟悉商品定價和生命週期管理的,所以他們的大資料只是應用在推薦。
兩者本身適用於不同的場景,從個人實際工作遇到的情況出發,在大型集團機構中(如金融行業),總部的需求多趨近於TO-DWON的情況,需要大而全的基礎,再此基礎上生成具體的業務需求;而到下面實際的分支機構,因其各種侷限性,需求往往是Botton-Up類的明細,我不需要所有的內容,只要相關的明細分析即可。
所以,我覺著,TO-DWON與Botton-Up本身並沒有太多的優劣之分,需求決定一切!
在10多年前,資料倉儲界一直有個爭論,到底是TOP-DOWN好還是Bottom-UP好,一邊說,我先把企業所有資料都整合,資料基礎做紮實了,然後分析就可以源源不斷產出了。而另一邊認為,我們得先建資料集市,把業務主題搞紮實,讓資料先有產出,然後再多個主題後再進行資料梳理整合。
前者的詬病是大半年都不會有啥“資料變現”的產出,問產出,就一直在說,系統搭建中,XX系統搭好了,XX業務資料整合了,等等。後者的詬病是,資料是有產出了,但是不同主題間的資料會有管理問題、每個主題需要不斷新增新的資料來源,開發、資料冗餘都是個問題。
這是資料倉儲界爭論10多年的話題,直到近兩年大資料興起,大家就都沒興趣討論了。在很多企業,大家都採用資料團隊組織基礎資料,做傳統資料倉儲前者的事情,再組織一個商業資料分析團隊,做後者的事情。只不過大家都很少提資料倉儲、BI這些老概念,不知道認為過時了,還是新一代資料人都不知道這些歷史。其實本質是一樣的,IBM等企業10年前就是2個團隊在做,前後者的優勢兼得。
------------------商業資料分析的傳統---------------
在商業資料分析方面,我也是近4、5年才真正切入,之前都是做傳統的資料倉儲和BI。不過我經常欣賞幾十年前的小資料商業分析的成功案例,試想小資料時代商業分析如此成功,大資料時代炒得那麼熱,卻炒來炒去,就那麼幾個案例,有意思麼?
我這裡還是介紹那2個經典小資料時代的案例:
1。早期超市為了優化超市設計,採用人工觀察,到後來的視訊觀察,來解析使用者行為,他們解析使用者行為的時候,發現了幾個方面的業務改進Idea,超出了預期的想法。當看到人們眼光主要放在眼睛上下30度範圍,於是陳列的時候,總是把利潤最高的放這2排,利潤低,價效比高的分別放上面和最下面;當發現人們通過買麵包順便買紅酒,而不是買紅酒順便買麵包,於是他們改變兩種商品的組合和區域順序;當發現免費品嚐某水果,可以帶動新鮮水果以及高利潤的純果汁的時候,超市又改變了策略。。。。。。。。
2。有個商場,糾結於傳統方案是現代方案,於是兩個方案同時上,一個是用諮詢團隊,一個是監控方案,數人數看人流。結果諮詢團隊的方案勝,原因是諮詢團隊雖然是小資料,但是他們的抽樣資料都是按照經驗選擇恰當的樣本,其次小資料的資訊非常全面,包括人的性別、年齡、身份背景、收入水平(經驗判斷)、去哪個區域,買東西走到哪一步了(諮詢、試穿、有沒討價還價),這些資料監控都沒法得出,所以監控資料全面,但無法給出任何實質價值意義的建議,都是些空話。
-----------大資料商業分析應該TO-DWON還是Botton-Up?--------------
一種思路是需要足夠大、全面的資料,沒有解決不了的分析,一上來把所有可能的維度、資料分佈、趨勢都嘗試一遍,認為沒有規律也能看出規律了;一種是看問題,需要解決什麼問題,就做什麼分析,缺什麼資料再從大資料中去取。
有人問,如果採用第二種方案,那麼大資料價值何在,那麼多資料都沒利用起來?我想問,如果你想挖前面一座金山,你是挖一部分,然後淘一部分出來賣,還是把金山都挖完,然後一點點淘出來賣呢?當然你選擇第一種,但你選擇這個,你不會說浪費了整個金山,因為你知道你需一點點變現後才會有動力挖後面的。但為啥那麼多搞大資料的人不是這個思路呢?
看到這裡,可能大家認為我偏向第二種方案,其實不全是,我一直認為任何方案都有其優勢,中庸取其精華最好。第二種方案的死穴是,如果你問題沒搞得透徹明白,那麼分析的都是無用功,都是在錯誤的軌道上轉圈。
------------------什麼是大資料時代好的分析方案?-----------------
我們來看第一個超市案例,他通過一個簡單的、人工判斷過的“使用者行為”資料解決了這麼多各種業務難題(陳列、佈局、商品搭配、促銷等),是因為他們發現一個問題,然後去解決的思路麼?不是,而是充分以“商業”為中心,以“迎合使用者需求,滿足商業利益最大化”這一個最大分析目的,發現了使用者行為,原來對這麼多商業佈局都有改進的地方,可以同時滿足使用者的購物需求,也滿足商業利益最大化的需求,於是產生了後來的一系列超市零售改進。
再看大資料的案例,某人收到小孩用品推薦,他很生氣投訴,結果沒多久就寫感謝信,說他女兒真的懷孕了,感謝云云。其實從這個案例中,除非給人驚奇外,有多大“商業價值”?如果純從資料商業價值來說,這個分析推薦的作用,比起超市零售通過使用者行為的變革,簡直不值得一提,為啥還廣為流傳? 因為大資料時代,還找不出像樣的案例,於是就拿驚奇的案例來吸引大眾注意吧。
反過來說,並非大資料無用,或者說大資料不是遠不夠大(要知道比超市人工觀察的資料大多了),而是大資料分析和應用的人們思維並未完全開啟,我相信做推薦的朋友沒多少熟悉供應鏈的,也沒多少熟悉商品定價和生命週期管理的,所以他們的大資料只是應用在推薦。
兩者本身適用於不同的場景,從個人實際工作遇到的情況出發,在大型集團機構中(如金融行業),總部的需求多趨近於TO-DWON的情況,需要大而全的基礎,再此基礎上生成具體的業務需求;而到下面實際的分支機構,因其各種侷限性,需求往往是Botton-Up類的明細,我不需要所有的內容,只要相關的明細分析即可。
所以,我覺著,TO-DWON與Botton-Up本身並沒有太多的優劣之分,需求決定一切!
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/28573466/viewspace-772468/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- TOP 3大開源Python資料分析工具!Python
- 大資料搜尋選開源還是商業軟體?ElasticSearch 對比 Splunk大資料Elasticsearch
- 大資料開發好還是大資料分析好?哪個薪資高?大資料
- 大資料,還是大錯誤?大資料
- 網友的TOP資料
- 爬取豆瓣電影Top250和資料分析
- 2014年全球大資料行業最頂尖人才Top 20大資料行業
- 大資料:大機遇還是大忽悠?大資料
- 以Top-Down思維去解決問題——遞迴遞迴
- awr的top sql分析SQL
- rownum—top-N分析
- 帶你深入瞭解什麼是商業資料分析
- 大資料時代的五大商業分析技術趨勢大資料
- Smartbi作為企業級商業智慧和大資料分析品牌大資料
- 零售資料分析之操作篇10:銷售排名與TOP分析
- 商業價值雜誌:商業巨頭是怎麼玩轉大資料的?大資料
- 深度揭祕:大資料時代企業賣技術還是賣資料?大資料
- 豆瓣top250資料爬取
- 大資料分析是企業轉型的關鍵大資料
- 詳解大資料應用案例排行榜TOP 100大資料
- 50款大資料分析神器 :你還是隻會用Excel嗎?大資料Excel
- 大資料七種商業模式大資料模式
- 大資料分析是什麼大資料
- 預測模型要大資料還是小資料?模型大資料
- 從作業系統命令TOP到資料庫的優化作業系統資料庫優化
- 大資料人才缺口高達150萬,商業智慧分析師是怎樣的存在?大資料
- 韓國資料包告:TOP手遊MAU品類,入韓中國廠商排名
- 什麼是商業模式分析?模式
- 從作業系統命令TOP到資料庫的最佳化作業系統資料庫
- 商業智慧、大資料、社交化、實時性是未來企業的精髓大資料
- top
- 商業資料分析師——IT和商業之間的紐帶
- 2014年Top10大資料初創公司深度剖析大資料
- 商業創新奇才,巧用大資料分析帶你穿越古代當首富大資料
- 查詢資料庫等待事件top10資料庫事件
- MongoDB如何使用top命令監控資料庫MongoDB資料庫
- 大資料創業的幾道坎?除了技術、人才和錢,你還需要商業模式大資料創業模式
- 金融行業的大資料分析行業大資料