通往資料科學之路
DinK發表於2020-06-16
數智君 | 翻譯
想成為一名資料科學家嗎?你一定聽過太多關於資料科學的新聞,想知道這鋪天蓋地的宣傳到底在說什麼嗎?那你來對地方了!資料科學領域在過去的十年間有了長足的發展。如今,有很多方法可以讓你投身到資料科學領域併成為一名資料科學家,並不一定要求您擁有一個理想的學位。好,讓我們開始吧。
資料科學家是什麼?先想想你希望做什麼
不同的公司對資料科學和資料科學家的理解並不相同。以我的經驗,公司希望僱到的人和他們實際僱到的人,總是無法完全吻合的。資料科學是一個非常廣闊的領域,成為一名資料科學家並不意味著你需要通曉並掌握該領域內所有的知識。
所以我的第一個建議是好好研究一下資料科學的不同方向,找到你最感興趣的那一個,然後再去調查一下這些方向相關的職位和行業需求。根據這些事實再做選擇。一旦決定後,你就要加強這個特定方向的知識積累。
這個問題經常被問起,卻很難有令人滿意的答案。接受更高的教育當然是更好的選擇,但並非人人都能實現。事實上,學歷甚至不是硬性要求。誠然,學歷在第一次找工作時可能會讓你握有一些優勢(請注意,我說的是“可能”)。但是,也有許多人並沒有專門的大學學位,卻一樣擁有成功的資料科學家和資料分析師職業生涯。你最好尋找一些可以幫助你學習的線上課程。選擇課程時,你應該看看曾經的學員的總結和成功故事,甚至可以試著直接聯絡他們。
網路非常重要
一旦你立志投身資料科學領域,甚至已經確定了夢想的職位,你就需要開始與人交流。給你夢想加入的公司的職員和你希望投身的領域的專業人士發郵件,徵求他們的建議。可能僅有少數人回覆你,但這些建議非常有價值。無論你決定上大學還是線上學習,你都需要不斷更新你的簡歷和社交媒體資料。LinkedIn是職場社交網路,就用它!
Python和R語言是資料科學領域最流行的程式語言。一方面,R在過去20年中一直是統計和資料分析的領先語言。另一方面,Python是過去5年成長最快的語言,這也讓它迅速成為最流行的程式語言之一。
資料科學領域每天都要用到統計學、迴歸模型、基礎的平面幾何和立體幾何、矩陣和分散式模型等等。複習基礎知識並儘可能地多學一些吧,沒有良好的數學處理能力,你根本無法在資料科學家之路上走遠。我建議你閱讀一些資料科學以及和你選擇領域相關的文章,以便確切瞭解你需要學習什麼。收聽相關的播客也會有幫助,當然還有很多免費的線上課程。
沒有什麼比做專案更能展示你的技能和知識。別等你有了足夠多的知識才去做專案,就用你目前掌握的知識立刻動手。這能夠檢驗你當前的知識,提升你對概念的理解,並給你堅持的信心和動力。
堅持做適合你當前水平的專案,利用基本概念同樣能夠展示你的技能,和利用高階概念沒什麼區別。而且這還能顯示你的進步過程。不要直接使用別人的程式碼,因為你在做自己的專案。你可能會從別人的專案那兒得到靈感,但你的專案應該反映你自己和方法和技能。
有許多開源專案正不斷尋找優秀的貢獻者。你可以先找一些適合初學者的專案,然後隨著經驗的積累不斷進階。
這不但可以展示你的能力,更重要的是可以幫助你建立交流和聯絡。其他貢獻者,甚至是專案負責人或專案所有者,都可能在你尋求第一份工作時幫到你。
至此,你擁有了不少專案經驗,也擁有了大學學歷或線上課程證照這樣的資質,還擁有了可以幫助你進入這個行業的聯絡方式。
這時你可以再次聯絡我們開頭所說的那些業內人士。向他們展示這段時間你是如何提升的,感謝他們給予你的寶貴建議。然後你可以將簡歷傳送給儘可能多的公司,這也許就會給你帶來一份工作。當然,直接登門求職是最好的方式。
全情投入和努力工作總能得到回報,而聰明地工作能得到更多回報。我確信這份指南能幫助你成為一名成功的資料科學家並找到一份理想的工作。但即便你已經得到工作並踏入行業,也千萬不要停止為開源社群做貢獻,更不要停止學習。這是我送給所有有志在資料科學領域取得一番成就的人的禮物。你永遠不會知道,一個更好的機會是不是就在前面拐角處等著你。
https://hackernoon.com/a-roadmap-for-becoming-a-data-scientist-yg6l321r