Kaggle推出免費線上課程,覆蓋機器學習、深度學習等四門課

AI前線發表於2018-01-24
本文由 「AI前線」原創,原文連結:Kaggle推出免費線上課程,覆蓋機器學習、深度學習等四門課
線索編輯|Tina
撰稿編輯|Natalie,Debra

AI 前線導讀:”Kaggle 是機器學習和資料科學領域比較權威的資料建模和資料分析競賽平臺,近日 Kaggle 釋出了免費的線上學習專案 Kaggle Learn,這對於想要學習機器學習和資料科學的人來說無疑是個福音。該課程更重視程式碼實踐,相比閱讀程式碼,使用者需要花更多的時間自己編寫程式碼。據官網介紹,“ 使用者將獲得所需的理論知識,以便做出更好的建模決策,但無需將時間浪費在那些對成為一名實踐型資料科學家毫無幫助的理論和歷史背景的學習上。” 該課程共包含機器學習、R 語言、資料視覺化和深度學習四門課。”


Kaggle 是目前世界上最大的資料科學家、機器學習開發者的社群,使用者量達到幾十萬,是行業中比較權威的平臺。

2017 年 3 月 8 日,Stanford 人工智慧實驗室主任兼谷歌雲首席科學家李飛飛主導了 Google 收購 Kaggle 的案子。大約在一年前,李飛飛就說過:“Kaggle 是搜尋、分析公共資料集,開發機器學習模型和提高資料科學專業水平的最佳場所。”這是對 Kaggle 在機器學習、人工智慧領域的地位的高度認可,也為今年的收購行為做出了一個合理的解釋。

對於 Kaggle 而言,在加持了 Google Cloud 服務後,社群將擁有更好的獲取、儲存大型資料集的能力;而社群成員將能夠享用最先進的雲機器學習開發環境。這一合作無疑將會對 Kaggle 社群的發展起到很大的推動作用,因此未來 Kaggle 在 ML 和 AI 領域的地位只會更加穩固。(來自知乎使用者 a2Mia 姐,連結:www.zhihu.com/question/32…

作為一個機器學習和資料科學平臺,企業和研究者可在 Kaggle 上釋出資料,該平臺的競賽也吸引了很多統計學者和資料探勘專家,其中一項獎項 Heritage Health Prize 獎金高達 300 萬美金,參加該比賽對於競賽者來說是一次學習和實踐鍛鍊的機會,因為只有佼佼者才能獲得最終第一名的獎金,競賽成績也會成為簡歷中一項非常亮眼的經歷。


Kaggle Learn 專案總覽

Kaggle Learn 專案所有課程均為線上免費課程,據專案官網介紹,該專案旨在幫助有意參加競賽的人或幫助資料科學學習者在建模之前瞭解理論知識,以提高解決實際問題的能力。

該專案由四門課程組成,分別為機器學習、R 語言、資料視覺化和深度學習,每門課程又根據難度分為 Level1、Level2 不等,講授知識由淺入深,內容涵蓋人工智慧、資料科學等熱門領域。

Kaggle推出免費線上課程,覆蓋機器學習、深度學習等四門課
  • 機器學習:這是資料科學中最熱門的領域,此課程可以讓你迅速入門機器學習。
  • R 語言:這是專門為資料分析而設計的語言。此係列課程包括資料設定、機器學習和資料視覺化。
  • 資料視覺化:視覺化是資料科學中最具有活力的技術,通過可視、美麗的影象展現資料集。
  • 深度學習:通過本課程學習 TensorFlow 的使用方法,從而使機器學習更進一步,這項新的技能將會帶給你更多驚喜。
Kaggle推出免費線上課程,覆蓋機器學習、深度學習等四門課

該專案的四門課程具備以下特點:基於專案學習,能夠很方便地關注學習進度,由全球最大的資料科學社群提供支援,可以將專案經驗寫入個人履歷。

Kaggle推出免費線上課程,覆蓋機器學習、深度學習等四門課

Kaggle Learn 專案目前共有三名講師:

  • Dan Becker,資料科學家,曾為“財富”100 強中的 6 家公司提供資料科學技術的諮詢服務,是 Keras 深度學習庫的程式碼貢獻者。他擁有計量經濟學博士學位。目前主要負責機器學習和深度學習兩門課程。
  • Racheal Tatman,多年來一直是 R 語言的活躍使用者和講師。她曾擔任 Software Carpenty 和 She Codes Now 講習班的講師,擁有語言學博士學位。目前主要負責 R 語言課程。
  • Aleksey Bilogur,他是一位資料專家和 Python 開源專案貢獻者。他為紐約市長辦公室和紐約大學 CUSP 工作,擁有數學學士學位。目前主要負責資料視覺化課程。


Kaggle Learn 課程詳細介紹

機器學習

機器學習課程分為 Level1、Level2,機器學習新手可以從入門課程開始,一步步學習從原理到資料上傳、設定計算環境、建模等全部過程,每節課均附有學習筆記可供查閱學習。

課程連結:

www.kaggle.com/learn/machi…

Level 1 共包含 8 節課:

  1. 模型工作原理:新手入門機器學習第一步
  2. 建立自己的機器學習專案:上傳資料,親自動手設定專案所需的計算環境
  3. 用 Pandas 篩選過濾資料:為建模做資料準備
  4. 執行你的第一個模型
  5. 驗證模型:測試模型效能,必要時用其他模型替換
  6. 欠擬合、過擬合以及模型優化:調整模型以提高效能
  7. 隨機森林:使用更加複雜的機器學習演算法
  8. 提交參加競賽:為你做到的感到自豪吧,並關注你的專案在競賽中的進展

Level 2 共包含 7 節課,涵蓋了機器學習中會遇到的各種問題,如處理丟失資料、使用分類資料等。

R 語言

課程連結:

www.kaggle.com/learn/r

目前這門課程僅開放了 Level 1,共包含 6 節課:

  1. 用 R 語言學資料科學(學習讀取資料和建立機器學習模型的基本知識)
  2. 用 Tidyverse 運算元據(這個被廣泛採用的強大的庫將大大提高效率
  3. 用 ggplot2 進行資料視覺化:雖然資料視覺化庫眾多,但大多數專家認為 ggplot2 功能最為強大
  4. 用 R 寫 NLP:主題模型
  5. XGBoost(R)機器學習
  6. 選擇帶有補字元的最佳模型(模型自動篩選,讓機器學習更輕鬆、更有效)

資料視覺化

課程連結:

www.kaggle.com/learn/data-…

同樣僅開放了 Level 1,共 10 節課,從入門基本知識到高階操作均涵蓋其中。

深度學習

課程連結:

www.kaggle.com/learn/deep-…

同樣僅開放了 Level 1,共 6 節課,包括:

  1. 深度學習和計算機視覺入門:簡單介紹模型影象處理的原理

本課結束後,你將會對卷積有所瞭解,卷積是計算機視覺(和許多其他應用)深度學習模型的基本構建塊。接下來你就可以學習使用世界級的深度學習模型了。

  1. 建立卷積模型

學完本課後,你將會了解卷積是如何發揮作用,在計算機視覺上達到人類難以企及的水平。

  1. 用 TensorFlow 和 Keras 程式設計

學完本課後,你就可以使用 TensorFlow 和 Keras 程式設計程式設計計算機視覺領域最好用的模型之一了。

  1. 遷移學習

學完本課後,你將能夠在缺乏資料的強況下,根據顧客的需求,使用遷移學習建立精準的計算機視覺模型。

  1. 資料增強

學會使用資料增強後,達到的效果會遠高於你只是擁有資料所能獲得的效果,並且可以建立更好的模型。

  1. 進一步瞭解深度學習

在這節課結束時,你將瞭解如何使用隨機梯度下降和反向傳播來設定深度學習模型中的權重。雖然這些話題很複雜,但許多專家認為這是深度學習中最重要的思想。

以上就是對 Kaggle 最新推出的免費線上課程的介紹,所有課程的程式碼編寫和執行均能在 Kaggle 網站上直接進行,無需在自己的電腦上安裝環境和外掛。 如果你對這一系列線上課程感興趣,可以訪問 Kaggle 官網(www.kaggle.com/learn/overv…) 動手嘗試,學完歡迎回來與 AI 前線分享你的學習經驗和體會!

更多幹貨內容,可關注AI前線,ID:ai-front,後臺回覆「AI」、「TF」、「大資料」可獲得《AI前線》系列PDF迷你書和技能圖譜。


相關文章