2017年資料科學發展中值得一入的坑

泡泡淺眠發表於2017-07-11

在機器學習這一領域研究中,繼谷歌和Facebook之後越來越多的公司加入了對於最優秀的機器學習專家和資料科學家的競爭之中。與此同時,我們也看到了物聯網和資料科學的結合。未來一年,資料科學的的發展趨勢是什麼方向呢?讓我們往下閱讀。

blob.png

在資料科學領域,大資料和物聯網正在持續快速增長著。目前的商業中已經逐漸可以把不同來源的資料拼湊在一起,並獲得更多的資訊,這也就意味著資料將變得更有意義。在開發新的商業模式和獲得增長的過程中,使用資料已經變得越來越重要。世界各地的企業都在尋找一些可以利用資料進行商業化並從中獲利的方式。接下來就是我們在2017年的資料科學界可能看到的現象以及資料科學怎樣影響我們。

技術需求上的改變

機器學習曾被特斯拉的Elon Musk稱之為“被召喚的惡龍”,但到如今,這個詞還是以高頻率被提起。亞馬遜、Facebook、谷歌都已經加入了人工智慧的競賽中,在2017年,更多的商業模擬將會吸引到更多的機器學習資料科學家來增加他們各自部門實力。

blob.png

但是對於相應工作的競爭可能也會更激烈一些。當你發現機器學習已經成為資料科學中的一個職業時不要驚訝,從2017年起更多的學校將會將人工智慧列入他們的課程中。如果你想保持在這一浪潮最前列,那麼這裡有一些機器學習和人工智慧相關證照可以供你獲取。然而這裡的課程都價格不菲——通常要10,000美元,相似的這些內容在一些訓練課程網站如Coursera或者edX都相對比較便宜或者是免費的。

2016年,資料科學家最需要掌握的技能

blob.png

為了在資料科學領域獲得成就,其他的你還需要擁有的技能包括強大的技術和程式設計知識,尤其是使用R語言或者Python,還有SRS和MATLAB的經驗也是非常有用的。

此外,你還需要習慣於使用關聯式資料庫的工作,因此SQL也是非常重要的。在2015年,從領英上列出的工作列表中,SQL被列為最重要的技能。當然,Hadoop、Python和Java也是非常重要。

物聯網和資料科學的結合

資料科學和物聯網經常被看成是一個硬幣的兩面。

由於資料科學總是尋找資料和實時裝置的介面從而實現先進的資料據分析,甚至用於決策,因此,在2017年,這兩個行業將會走的越來越近,甚至合併在一起。

blob.png

那麼這一點如何實現呢?考慮一下一下場景。在不遠的將來,你可能不需要鑰匙來進入你的家門,當你走到門口的時候,它會感覺到你的存在,並自動為你開門。同時,當你離開的時候,它將會讓家裡的所有能量單元關掉——反而節省主人的錢。

這可能聽起來像是進取號戰艦(電影《星際迷航》中戰艦)中的場景,但是我們也許在2017年看到這些場景都將開始發生——而且你要確定你有能力來投入在這些專案中。

blob.png

人工智慧、資料科學等對於物聯網的影響,意味著你要能夠處理無線介面層、不同裝置、邊緣處理、實時系統和深度學習等領域的工作。

不斷髮展的大資料技術

我們已經看到了在2016年天文數字般的增長,但是在下一年,隨著大資料越來越普及並不斷被企業所接受使用,大資料的預算還會繼續增長。大多數企業也意識到了他們需要改進該領域的商業模式,這也就意味著需要更多的資料科學家來獲取並處理大量的額外資料。

blob.png

如果你想要尋找一個資料科學的職位,大資料的知識和資料框架是非常重要的。你尤其需要看看 ApacheHadoop,HDFS,Hbase,Spark,Stom,Solr和Kafka.

blob.png

  由大資料引領的醫療行業

資料科學已經在控制流行病和預測病人行為等方面發揮了重要作用。2015年,資料科學幫助預測了西尼羅病毒在美國的爆發,並達到了85%的精度。而且在今年早些時候,一個科學家團隊開發了一個可以預測蝙蝠攜帶埃博拉病毒的模型。期待著2017年資料科學在醫療行業的進一步應用,並希望醫療行業能夠不斷找到更好的方式來滿足日常需求和拯救生命。

blob.png

隨著電子醫療記錄儀記錄資料量的增加,我們所處理的資料已經達到歷史最高水平。儘管大量的資料有他自身的有點和缺點,但是對於資料科學家而言這裡存在著巨大的商機,期待他們在2017來破解這些資料的祕密,如果你正在尋找一個新興市場,那麼醫療行業就是了。

本文轉自d1net(轉載)


相關文章