大資料時代,從零學習資料思維

web前端開發交流發表於2018-09-06

 

大資料時代,從零學習資料思維

為什麼選擇資料分析

其實直到3個月前,我還不知道資料分析是什麼。不知道的原因是一直以來我從事的都是醫學相關專業。在這裡我想推薦漫畫家蔡志忠老師的演講——《我覺得努力是沒有用的》(不是打廣告),我就是在看了這場演講之後,毅然決定從新選擇一條職業道路。
大資料學習資料分享群119599574

努力的前提,是先選好自己要走的路,這點很重要。

最近一段時間我陸續瞭解過很多行業,從工作內容、薪資待遇、行業發展、市場環境方方面面考察一番過後,我突然發現那些前景大好的職業都有一個共性,就是他們都能夠順應時代的發展,讓人們的生活更加高效便利。尤其是在行為即是資料的大資料時代,每個人都是資料的生產者。如果誰能用資料闡明當下,預測未來,那他無疑是掌握了一種巨大的力量,而這種力量可以最大限度得優化生活。

資料即是資源,資料也是資本。

既往學習的收穫

仔細想來,“收穫”這個詞我或許還承擔不起,換成“心得”也許會好一些。

自從決定學習資料分析,這段日子我搜集了很多資料,雖說這些資料的質量良莠不齊,但好歹也幫助我形成了初步的認知。

普通的資料分析其實涉及到生活中的方方面面,在我看來,生活裡面臨的任何選擇題,都可以用資料分析解決。例如買房子應該選擇多高的樓層、開店鋪應該選擇什麼位置、買股票應該如何選擇等等等等。這些決策都可以通過收集資料、處理資料而得出結論。

如若需要通過演算法獲取大量資料並進一步對海量資料進行預處理,使得這些資料可以應用於後續的分析過程,就是大資料分析。大資料分析的重點其實傾向於挖掘資料並對所獲得的資料進行預處理。

(如果理解錯誤之處,歡迎批評指正)

既往學習的不足

第一點也是最重要的一點不足,就是缺乏對資料分析領域的系統認知。資料分析其實是按照收集資料、處理資料、得出結論這一流程進行的。流程中的每一環節又有諸多步驟,而每一步驟可採取的解決方法可能也較為多樣。由於我事先沒有梳理出整體框架和結構,導致在查閱資料的時候被各個環節或者步驟所需的解決方案搞得暈頭轉向,完全不知道真正開始資料分析要如何踏出第一步。

改進方案:對於一個自己不熟悉的領域,應該先進行巨集觀把握和認知。按照由整體到部 分的思維層層遞進。

第二點不足是沒有明確可以用不同的工具解決同一個問題。舉例說明,就統計分析而言,EXCEL、SAS、SPSS軟體以及工具語言python、R等都可以用來分析資料(正如上文所述可以採用多種解決方案解決同一步驟)。但我在自學的初期,其實並沒有充分認識到這一點。造成的結果就是學的雜亂無章,毫無系統可言。

改進方案:先精通一種解決方法,明白解決問題的核心思路。

學習規劃

資料分析需要循序漸進、按部就班得進行。

不管解決方案有多少種,先精通一種,能夠高效得解決實際問題才是資料分析的價值所在。

 

相關文章