掌握資料,就是掌握規律。當你瞭解了市場資料,對它進行分析,就可以得到市場規律。當你掌握了產品自身的資料,對它進行分析,就可以瞭解產品的使用者來源、使用者畫像等等。所以說資料是個全新的視角。資料分析如此重要,它不僅是新時代的“資料結構 + 演算法”,也更是企業爭奪人才的高地。接下來步入正題
一、什麼是資料分析
1、資料分析我們可以分成三個重要的組成部分
- 資料採集。它是我們的原材料,也是最“接地氣”的部分,因為任何分析都要有資料來源。
- 資料探勘。它可以說是最“高大上”的部分,也是整個商業價值所在。之所以要進行資料分析,就是要找到其中的規律,來指導我們的業務。因此資料探勘的核心是挖掘資料的商業價值,也就是我們所談的商業智慧 BI。
- 資料視覺化。它可以說是資料領域中萬金油的技能,可以讓我們直觀地瞭解到資料分析的結果。
2、詳細講解三部分
① 資料採集
通常會和資料來源打交道,然後使用工具進行採集
工具:1、八爪魚 - 抓取 99% 的頁面源 2、py爬蟲
② 資料探勘
知識型的工程,相當“演算法”部分。首先你要知道它的基本流程、十大演算法、以及背後的數學基礎 ,比如關聯分析,Adaboost 演算法等
掌握了資料探勘,它會通過歷史資料,告訴你未來會發生什麼。當然它也會告訴你這件事發生的置信度是怎樣的,置信度這個詞你先記住就可以了,後面我們來學習它具體代表什麼。
③ 資料視覺化
直觀的瞭解到資料分析的結果 - 萬金油
兩種方法:1、使用 Python。在 Python 對資料進行清洗、挖掘的過程中,我們可以使用 Matplotlib、Seaborn 等第三方庫進行呈現。
2、使用第三方工具。如果你已經生成了 csv 格式檔案,想要採用所見即所得的方式進行呈現,可以採用微圖、DataV、Data GIF Maker 等第三方工具,它們可以很方便地對資料進行 處理,還可以幫你製作呈現的效果。
二、學習指南
把知識轉化為自己的語言,才能變成我們自己的東西 - 這個過程就是認知的過程。 認知比作大腦,工具則是雙手
1、MAS 學習法
- Multi-Dimension - 多個角度
- Ask - 不懂就問
- Sharing - 最好的學習就是分享
2、資料分析原則
- 不重複造輪子 - 大部分類庫就能滿足需求
- 工具決定效率 - 好的工具事半功倍
- 積累熟練度
3、建議
- 記錄每天的認知
- 用工具來表達你對知識點的掌握,並用自己的語言記錄下這些操作筆記。
- 做更多練習來鞏固你的認知
- 畫圖軟體SketchBook