這是什麼選秀節目?數百萬人看後想學「機器學習」

思否編輯部發表於2021-12-17

“秋名山上行人稀,常有車手較高低。如今無人車當道,全是 AI 老司機。”

且問 AI 老司機表現如何?

可靈活轉彎,控速自如:

可行雲流水,沿最優路線過彎:

更可多次打圈,繞多少下也不在話下:

這場競速賽事,主角確實是一群 AI 老司機,人類全程只能看,也沒有什麼遙控器參與。

更準確地說,它們是歷經千萬次虛擬練車訓練出來的人工智慧模型。這些模型所角逐的賽事也在業內頗具盛名,這就是亞馬遜雲科技舉辦的——

Amazon DeepRacer League。

作為全球最多開發者參與的自動駕駛賽車聯賽,Amazon DeepRace 不拼誰更有錢買跑車,更不拼誰有資源搞場地,只拼選手們寫的強化學習演算法和訓練水平——

堪稱全球智力水平選秀綜藝,充分詮釋“ Smart is the new sexy ”的真正奧義。

開辦至今, Amazon DeepRacer 在 AI/ML 圈已有相當名氣,14萬開發者參與其中,知乎上還有鐵粉曬經歷、Po證書。

大眾影響力水漲船高,僅一部預告片就有380萬播放量。

隨著賽事越辦越破圈,去年,Amazon DeepRacer League 更與 F1 官方搞起聯名,舉辦了一場虛擬“巴塞羅那站”比賽,坐實自動駕駛界 F1 名頭。

所以,這個 Amazon DeepRacer 什麼來頭?為什麼讓技術愛好者們如此上頭?

最多開發者參與的自動駕駛聯賽

2018年,亞馬遜雲科技萌生舉辦 AI 演算法大賽念頭,讓更多人瞭解相關技術,甚至入門成為從業者,Amazon DeepRacer League 應運而生。

活動一開始就面向非業內群體,官方提供了幾乎所有參賽軟體資源,甚至有教程攻略,參與者甚至無需花錢購買實體小車,可以先在雲平臺上 3D 賽車模擬器,訓練自己的自動駕駛演算法。

入門後,參與者即可報名參加每個月的線上預選賽。如果你衝入全球前64強,就能獲得線下聯賽參賽資格——

和世界各路高手實地 PK 你的模型。

雖說門檻低,比賽獎金也卻很高。

冠軍將獲得10000美元的獎金,亞軍則獎勵5000美元,季軍2000美元。

低門檻加上高額獎金,玩的還是前沿技術,比賽自打舉辦,吸引了全球不同背景的人們關注。

參與者中,既有矽谷全棧開發人員、飛行員,來自新加坡、加拿大銀行員工,還有中國大學生……

不同背景參與者加入,不僅體現比賽多元性,讓機器學習技術為更多人所知,同時,也為比賽增添許多有意思的小片段。

比如 Amazon DeepRacer TV 2019年決賽中,一位台灣小哥逆轉獲勝後,贏得冠軍,但發表獲獎感言時,他卻用了中文表達自己的心情,整得英語主持人一時不知道怎麼接話…

值得一提的是,今年DeepRacer也開始在國內舉辦面向中國開發者的中國挑戰賽,獎品同樣豐厚,值得關注與期待。

如何馴服一隻無人車?

從賽場回顧技術理論,實際上,Amazon DeepRacer 活動背後的基礎即簡單又前沿。

如何理解這句話?

不妨先從一輛自動駕駛小車構造展開。

Amazon DeepRacer 的自動駕駛小車有代際區分。一代車是參賽主力,核心包括一個 Intel Atom® 處理器,一個四百萬畫素1080p解析度攝像頭,一個高速 WiFi 以及 Intel OpenVino 計算機視覺工具套件。一代車主要用於競速比賽,通過視覺識別判定賽道,完成比賽。

更高階的是二代車 DeepRacer Evo ,配備立體攝像頭和鐳射雷達,可用於可進行追逐賽與避障賽。

如果熟悉自動駕駛,你可能也能看出這一配置可謂“樸素”,卻足夠體驗自動駕駛的樂趣——

這是因為真正賦予小車自動駕駛靈魂的,是演算法與模型。

同當今馬路上的自動駕駛車一樣,Amazon DeepRacer 同樣使用到機器學習門類下的一門技術:

強化學習(RL)。

該項技術興起不過數年,卻算得上是近些年人類最重要的技術突破之一。2016年戰勝李世石的 AlphaGo 背後就是該技術發揮作用。

強化學習原理不難理解,就是一種“馴獸師”機制,也可以理解為「巴浦洛夫的狗」原理。

以“小雞啄紙”為例:

如果我們想訓練一隻雞啄粉色紙片,那麼,每當它啄到粉色紙片時,就獎勵給食物。

經過一番訓練後,這隻雞就一直能正確找到粉色紙片了。

來自Twitter使用者@YAWScience

當然,獎勵無人小車和電腦不能用食物,而是用它們能懂的“獎勵函式”( Reward Function )。

對於 Amazon DeepRacer 來說,開發者可以設定一個超級簡單的獎勵函式,它只有兩個引數:all\_wheels\_on_track 表示四個輪子是否全在賽道內, progress 代表當前完成進度。

具體到程式碼上,如果有車輪不在賽道上發生一次,就扣除獎勵函式,反之,就一直以小車走過的進度來獎勵它。

獎勵函式的值越大,就說明訓練越成功,當獎勵函式為負值時,任務失敗。

def reward_function(params):
    if not params["all_wheels_on_track"]:
        reward = -1
    else:
        reward = params["progress"]
    return reward

如果想讓小車更聰明,不要在跑道上拐來拐去,我們還可以把函式設定得稍微複雜一點,以小車偏離跑道中心虛線的距離作為一個引數。距離越小,則獎勵越大。

訓練過程中,小車通過攝像頭等記錄自己的位置,不斷調整車速和行駛方向,當獎勵函式最大化且穩定後——

“馴獸”就完成了,恭喜,你已掌握強化學習的根本原理。

如何參賽?

比賽熱血好玩,還有獎金可拿,原理易懂,現在,你是不是迫不及待想玩玩?

參與方式很簡單:只需註冊一個亞馬遜雲科技賬戶就行。

登陸賬號進入 Amazon DeepRacer 控制檯。

在構建模型之前,先在車庫配置一輛自己的虛擬賽車。

給它起一個炫酷的名字(名字不可以更改,千萬不要取個“ test ”就完事了),選個你喜歡的顏色並根據你要參加的比賽型別配置攝像頭。

建立好專屬虛擬小車後,按照提示一步步建立模型:

官方還提供虛擬環境,降低上手門檻,讓小車在虛擬世界中訓練,完成後,就可提交模型選一場比賽參加了!

參與線上競賽不需要實體小車,直接參與即可。

等你在虛擬練車領域嶄露頭角後,也能可以獲得亞馬遜雲科技免費贈送的實體小車,價值300美元。

當然,不差錢的話,也可直接在官網購買:

買小車雖說要花點錢,不過確實更添玩樂趣味,你可以在家裡復刻賽道,隨時進行練習。

據說,還有人為了拿個好成績直接換了大房子,在自家地下車庫裡復刻了賽道練習(手動狗頭)——

官網也貼心地提供了在家搭建賽道的教程:

最後,劃重點,提供一些薅官方羊毛機會。

如果你是新使用者首次參加 Amazon DeepRacer 專案,第一個月可以獲得10小時的免費訓練時長以及5GB的儲存空間

除了免費時長,Amazon DeepRacer 還提供了免費的視訊教程教你強化學習的基礎知識、比賽入門指導。

比賽技巧也是重點,官方網頁上連單圈記錄保持者寫的攻略都要來了:

所以,不論你是技術小白還是有經驗的機器學習從業人員,都可以放心大膽地參與進來。

賽車遊戲讓更多人入門AI

如前面所說,亞馬遜雲科技2018年就想以遊戲活動方式推廣 AI 演算法,後來才有 Amazon Deepracer ,此舉目的,在於面對 AI/ML 發展勢頭洶湧,這家大廠期望讓更多人瞭解相關技術,進而參與其中。

就拿 Amazon Deepracer 來說,為擴大參賽人群,亞馬遜雲科技還發起一項針對16歲以上高中生和大學生的學生比賽,註冊無需信用卡即可參與。

此外,如果完成所有學習模組,在所有課程測試中獲得至少80%分數,又在學生聯盟中單圈成績優異,還可以獲得一份獎學金。前500名的學生,還將獲得亞馬遜雲科技和英特爾的技術專家指導,為期12個月。

不止於 Amazon DeepRacer ,亞馬遜雲科技為讓不同背景的人都可以瞭解併入門機器學習,在方方面面都有所動作。

比如,提供1000萬美金的亞馬遜雲科技 AI&ML 獎學金計劃;

比如,釋出無程式碼機器學習圖形介面 Amazon SageMaker Canvas ,幫助零機器學習經驗的企業級使用者解決業務問題,讓各個業務背景的人都能上手。

再比如,面向更多開發者,提供免費算力的機器學習“實驗室” Amazon Sagemaker Studio Lab ……

相信只有越來越多人瞭解並上手 AI/ML 相關技術和產品,這一興起不過10年的浪潮才能真正釋出價值。

更多關於亞馬遜雲科技的新發布,長按下方圖片瞭解:

最後的最後,你想試試 Amazon DeepRacer 麼?

新增官方小助手瞭解更多詳情,傳送門在這:

相關文章