時長12:16,請在wifi環境下觀看
噹噹噹當~
TalkingData的視訊訪談欄目開播啦
它有一個非常響亮的名字:《數中生智》
顧名思義,就是從資料中產生智慧
在這個欄目當中
我們將探討大資料能產生怎樣的智慧
以及怎麼從大資料中生產這些智慧
與大資料以及AI相關的
趨勢、科學、技術、實踐以及從業者
都將是這個欄目所關注的焦點
在本期欄目當中我們邀請到了TalkingData資料科學家王小輝與陳日涵,和大家一起聊聊:AI帶來的機遇,以及如何把握這些機遇,成為AI時代所需的人才。
本期嘉賓
陳日涵
才貌兼具的TalkingData資料科學家
畢業於明尼蘇達大學統計專業,目前就職於TalkingData從事資料科學工作。主要關注的方向為機器學習、計算機視覺及貝葉斯優化。
話題1:如何看待大資料和人工智慧?
統計學或人工智慧是比較大的概念,而機器學習只是其中的交叉部分,它屬於學習(Learning)的分支。統計可能更為嚴謹,關注於資料建模(Data Modeling),機器學習則是更貼近應用測的學科,關注預測,對於假設或模型檢校(Mode Checking)的要求並不嚴格。
話題2:在校生怎樣才能進入AI領域?
對於那些在校生來說,基礎是更為重要,需要去上基礎的數學課以及去修一些機器學習的課程。
現在有很多像Cousera這樣的網站,提供免費的線上課程,都可以作為很好的入門材料,而Youtube上也有一些大神,比如Andrew Ng(吳恩達)、Stephen Boyd主講的公開課。很多名校如史丹佛大學也有免費線上的公開課,這些公開課實際上與其在校生所學的課程同步,會比開源網站上的課程更有深度,若想提高自己在AI領域的知識積累,公開課是一個不錯的途徑,此外,GitHub上也有很多機器學習或深度學習相關的學習資源。
注:參考資料見文末
話題3:神祕的資料科學家平時都在忙什麼?
除了做演算法、資料建模(Data Modeling)、預測(Prediction)等這些基本的工作以外,資料科學家還需要去了解資料本身和業務場景,這是衡量一個資料科學家合格與否的重要標準。
資料科學家要成為資料工程師與業務之間的橋樑,一方面與資料工程師對接,需要對技術框架和程式碼有一定理解;一方面,將資料演算法和模型做成一個合格的產品,指導實際業務。
話題4:如何增加自身籌碼找到稱心如意的工作?
大體上有兩種方法,首先是開源競賽,不僅能在論壇上和其他人交流提升自身的知識水平,也能刷一些排名(Rank)去提升用人單位發現自己的機率;第二是對一些開源專案做貢獻,因為做貢獻的這個行為也能從側面反映出自身是一個合格的資料科學家。
TalkingData曾在Kaggle上釋出過性別識別的競賽,參與人數重新整理了Kaggle當時的歷史記錄。最近,TalkingData在Kaggle上釋出了另外一個關於廣告反欺詐的競賽,歡迎大家參加。
詳情請點選:組隊打擊廣告欺詐,重金召喚你的加入
AI入門進階神功寶典
友情提示:部分網站需要科學上網
- 好玩的AI入門教程AI Education:https://www.youtube.com/channel/UCWN3xxRkmTPmbKwht9FuE5A
- MIT課程-深度學習導論 by Alexander Amini, Ava Soleimany, Harini Suresh, Lex Fridman:https://www.bilibili.com/video/av19113488/
- Hugo Larochelle教授的神經網路課程:https://www.bilibili.com/video/av3278931/
- Linear Algebra for Deep Learning:https://machinelearning-blog.com/2018/03/18/linear-algebra-for-deep-learning/
- An Intuitive Guide to Linear Algebra:https://betterexplained.com/articles/linear-algebra-guide/
- 吳恩達Deep Learning課程:https://www.coursera.org/specializations/deep-learning
- 吳恩達深度學習網易翻譯版:https://mooc.study.163.com/smartSpec/detail/1001319001.htm
- 吳恩達機器學習課程:https://www.coursera.org/learn/machine-learning
- 吳恩達機器學習短視訊課程:https://www.youtube.com/playlist?list=PLLssT5z_DsK-h9vYZkQkYNWcItqhlRJLN
- Stephen Boyd與Lieven Vandenberghe的凸優化教程:http://web.stanford.edu/~boyd/cvxbook/
- Tensorflow官方教程: https://www.tensorflow.org/tutorials/
- Scikit-learn官方教程:http://scikit-learn.org/stable/tutorial/index.html
- Lightgbm官方文件:https://lightgbm.readthedocs.io/en/latest/