分析資料分析的幾大黃金法則
大資料時代的到來使人類的認識變得更精確系統、更全面廣泛、更快速有效。然而面對各種資料來源收集來的海量資料,究竟如何對其進行歸類、計算、建模和解釋,卻需要高超的智慧。因資料本身始終沉默,需要依賴認識主體的賦予。
為什麼你的資料分析成果總是難以落地?資料分析的價值總是遠遠低於預期?相信看完這篇文章,每個人都能找到一個屬於自己的答案。本人先後在電力、軍工、金融等行業擔任資料分析師,有多年行業經驗。從平時的工作中總結出以下六個資料分析時要注意的原則,希望能對大家有所幫助。
1、遵循資料分析標準流程
資料分析遵循一定的流程,不僅可以保證資料分析每一個階段的工作內容有章可循,而且還可以讓分析最終的結果更加準確,更加有說服力。一般情況下,資料分析分為以下幾個步驟:
1)業務理解,確定目標、明確分析需求;
2)資料理解,收集原始資料、描述資料、探索資料、檢驗資料質量;
3)資料準備,選擇資料、清洗資料、構造資料、整合資料、格式化資料;
4)建立模型,選擇建模技術、引數調優、生成測試計劃、構建模型;
5)評估模型,對模型進行較為全面的評價,評價結果、重審過程;
6)成果部署,分析結果應用。
2、明確資料分析目標
在資料分析前期,要做到充分溝通、理解業務規則、關注業務痛點、瞭解使用者需求、換位思考,明確為什麼要做資料分析,要達到一個什麼目標。這樣才能保證後續的收集資料、確定分析主題、分析資料、分析結果應用等工作都能夠圍繞分析目標開展,保證最終能夠從整體目標的角度去總結分析成果。
3、業務與資料結合確定分析主題
以解決業務問題為目標,以資料現狀為基礎,確定分析主題。前期要做好充分的準備,以業務問題為導向,以業務梳理為重點,進行多輪討論,分析主題避免過大,針對業務痛點,實現知現狀、明原因、可預測、有價值。另外,分析資料的範圍除了重點關注的業務指標資料,還要儘量考慮擴充套件外延資料,比如經濟指標資料、氣象資料、財務資料等。確定分析主題之前,要進行資料支撐情況的初步判斷,避免中途發現資料質量或者資料範圍不能支撐分析工作的情況發生。確定分析主題之後,詳細論證分析可行性,保證分析過程的清晰性,才能開始分析工作。
4、多種分析方法結合
分析過程中儘量運用多種分析方法,以提高分析的準確性和可靠性。例如,運用定性定量相結合的分析方法對於資料進行分析;融合互動式自助BI、資料探勘、自然語言處理等多種分析方法;高階分析和視覺化分析相結合等。
5、選擇合適的分析工具
工欲善其事,必先利其器,資料分析過程中要選擇合適的分析工具做分析。SPSS、SAS、Alteryx、美林Tempo、RapidMiner、R、Python等這幾種工具都是業界比較認可的資料分析產品。它們各有其優勢,SPSS較早進入國內市場,發展已經相對成熟,有大量參考書可供參考,操作上容易上手,簡單易學。SAS由於其功能強大而且可以程式設計,很受高階使用者的歡迎。Alteryx工作流打包成應用,為小企業直接提供應用,地理資料分析功能強大。美林資料的Tempo大資料分析平臺功能全面,在高階分析和視覺化分析相結合上具有明顯優勢。RapidMiner易用性和使用者體驗做得很好,並且內建了很多案例使用者可直接替換資料來源去使用。R是開源免費的,具有良好的擴充套件性和豐富的資源,涵蓋了多種行業中資料分析的幾乎所有方法,分析資料更靈活。Python,有各種各樣功能強大的庫,做資料處理很方便,跟MATLAB很像。
6、分析結論儘量圖表化
經過嚴謹推導得出的結論,首先要精簡明確,3-5條即可。其次要與業務問題結合,給出解決方案或建議方案。第三儘量圖表化,要增強其可讀性。
資料分析過程中,除了以上六條原則,還要避免以下3種情況:
1)時間安排不合理
在開始分析工作之前,一定要做一個明確的進度計劃,時間分配的原則是:資料收集、整理及建模佔70%,資料視覺化展現及分析報告佔25%,其他佔5%。(資料的收集、整理和建模的過程,是反覆迭代的過程)
2)資料來源選擇不合理
一般企業中的資料來源有很多,SAP、TMS、CRM及各部門業務系統,每個渠道的資料各有特點。這時,應該慎重考慮從哪個渠道獲取資料更加快捷有效。資料來源選擇不合理,不僅影響結論的可靠性,而且有返工的風險。
3)溝通不充分
無論是分析人員內部的溝通還是與外部相關人員的溝通,都是至關重要的。與外部人員溝通效不順暢,可能造成前期需求不清,中間業務邏輯混亂,最終導致資料分析結果差強人意。與內部人員溝通效率低,可能造成分析進度滯後,分析工作開展不暢等諸多問題,直接影響分析效果。
中琛魔方表示:對於資料分析師,分析經驗的積累與專業知識的提升同樣重要,因為有些問題不是隻用專業知識就能解決的,所以在平時的工作中要有意識的去學習業務知識、掌握先進的資料分析工具,做一個有心人!
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69936596/viewspace-2649295/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 麥肯錫教我的資料科學家的五大黃金法則資料科學
- 最美APP的9條黃金法則APP
- 資料分析的黃金時期,你再不會就晚了!
- 大資料分析的幾種方法大資料
- 提高遊戲留存的14條黃金法則遊戲
- 客服系統的七條黃金法則
- 雙均線策略:量化交易中的黃金法則
- 面試:黃金法則——細節決定成敗面試
- 一則資料庫無法重啟的案例分析資料庫
- 谷歌機器學習規則要點簡析:43條黃金法則谷歌機器學習
- 選擇遠端辦公軟體的黃金法則
- 專案經理需要了解的黃金圈法則
- Keras作者:給軟體開發者的33條黃金法則Keras
- [譯] 編寫整潔 CSS 程式碼的黃金法則CSS
- 電商運營工具設計的12條黃金法則
- iOS 7圖示設計的七條黃金法則iOS
- 大資料時代——未來世界的資料分析法大資料
- 谷歌機器學習白皮書 43 條黃金法則全解析谷歌機器學習
- 雲架構儉約之道:企業架構七大黃金法則架構
- 一則資料庫無法啟動的奇怪案例分析資料庫
- 線上公開課 | 監控與日誌的黃金法則
- PHP物件導向程式設計的61條黃金法則PHP物件程式設計
- 解析應用程式UI設計的15項黃金法則UI
- 幾本資料分析的書
- 資料分析方法中的杜邦分析法
- 提高java程式設計安全性的12條黃金法則Java程式設計
- 成為優秀程式設計師的10條黃金法則程式設計師
- 程式設計師30歲前成功的12條黃金法則程式設計師
- 中國迎來大資料“黃金時代”資料安全需求更加迫切大資料
- 需求分析的20條法則
- Magento的大資料分析大資料
- 【大資料】大資料企業策略與法則大資料
- 數字時代的金礦:大資料產業園掃描與分析大資料產業
- 有效提高java程式設計安全性的12條黃金法則Java程式設計
- 【友盟+】全域資料首次定義“超級使用者”,DI時代新黃金法則誕生
- 資料是黃金還是垃圾?
- 大資料安全分析大資料
- 王汕11.3外匯黃金晚間價格漲跌分析、貴金屬黃金獨家短線解套