論 AI 圈活菩薩,非李沐老師莫屬。
前有編寫「動手學深度學習」,成就圈內入門經典,後又在B站免費講史丹佛 AI 課,一則艱深硬核講論文的視訊播放量36萬,不少課題組從導師到見習本科生都在追番。
如此給勁的分享,難怪不少人驕傲自稱「已拜在老師門下」——
而最近,我發現有平臺幹了個更給勁的事。
這個平臺無償提供算力不說,還將入門經典「動手學深度學習」放進平臺,免費供大家學習和實操,名曰:Amazon SageMaker Studio Lab 。
按介紹說法,該平臺基於 JupyterLab,提供免費 GPU 和 CPU 算力+15G永久儲存功能,還與 GitHub 連結,支援主流機器學習工具元件和開源資源包使用,開發者可結合「動手學深度學習」教材自行訓練模型、看結果。
而且,他們還號稱申請只需一個郵箱,不要官方賬號,更不用填什麼信用卡。
真有這麼好的事?
今天就帶著大家一起親測試試。
真能實操「動手學深度學習」案例?
通過連結 studiolab.sagemaker.aws ,我們即可登入 web 端平臺,探探虛實。
哪能找到「動手學深度學習」?
從介面能看到,平臺提供 GPU/CPU 算力選擇,而且,可直接開啟使用,確實無需付款。
右下角,我們就能看到那本 Dive into Deep Learning (縮寫為 D2L )。
直接點選 Open D2L notebooks 可開啟:
開啟專案後,系統自動載入D2L資源,並儲存在我們的雲上資料夾中。
README 檔案也一併開啟好了,在這裡面,系統環境配置、全書概要、面向受眾、目錄框架一應俱全。文末還有每個章節連結,從中能直接進入。
到這,就可以通過平臺結合課程內容與實操來學習深度學習了——
那麼實操效果如何?
哪兒哪兒的程式碼,都能執行給你看
以經典中的經典的 AlexNet 部分為例,感受一下。
平臺上,AlexNet 沿襲發展、基礎原理解釋均呈現出來,模型的定義構建程式碼均可執行。
為保證初學者更好理解,還能構建單通道資料示例,觀察 AlexNet 內部8個層的輸出情況,目的嘛,在於幫我們直觀瞭解不同層的作用:
最關鍵的是,訓練模型環節也開放實操,選中程式碼部分執行即可。
不過該過程允許時間較長,我們在 GPU 選項下訓練大約使用7分鐘,慢慢等吧!
眼看曲線緩緩慢慢畫出來
值得一提的是,由於整個介面都能作為 Notebook 新增程式碼,記錄學習思考——
因此,即便我們課程完成,還能在文末新增程式碼欄,對照著章節末尾習題,程式設計實現作業。
從數理基礎到實操環境配置,都安排得明明白白
上面展示還只是一個小節。其實,從全連線層、卷積、池化等概念介紹,到 ResNet、DenseNet 講解…在 Amazon SageMaker Studio Lab 免費環境中均有呈現及實操,都安排得明明白白。
平臺還貼心地考慮到我們的高數線性代數基礎不一,不是每個人都過了90分,還把單變數微積分、最大似然等數理基礎介紹和程式碼實現都給出來了,還附上環境配置方法,一副很靠譜的架勢。
經過上面驗證,這個 Amazon SageMaker Studio Lab 確實可免費又完整地實操大神的「動手學深度學習」——
對希望入門乃至深度掌握 AI/ML 這門技術的人來說,這種理論+實踐型的研習方式自然更為高效,日後切換到實際工作或科研甚至創業中,過渡也更為無縫。
事實上,它的能力還不僅這個水平。
一個面向開發者的免費平臺
從名字上你也發現了,推出 Amazon SageMaker Studio Lab 的幕後企業是亞馬遜雲科技。
這家前沿技術大廠此次推出免費平臺,不只將「動手學深度學習」做成理論+實操練習場,更想面向資料科學家、企業開發者、高校師生——
提供一個免費低門檻入門機器學習的普惠機會。
其實在亞馬遜雲科技之前,業內已有多個開放機器學習平臺——
那麼,這回的 Amazon SageMaker Studio Lab ,又有什麼值得關注的新亮點?
我們一起先從配置看起。
平臺提供15G以上永久儲存,16G記憶體,4個 CPU ,GPU 為英偉達 Tesla T4 ,比目前其他主流平臺稍高。
由於使用了較新架構的英偉達 Tesla T4 ,其混合精度運算速度指標相應也更高,此外,免費版與 SageMaker Studio 使用相同架構,相當於疊加一層企業級 Buff ,穩定性更有保障。
值得我們注意的是,平臺宣傳的是4小時 GPU+12小時 CPU ,但實際上,我們到時間後仍可再次開啟 Runtime ,原來的檔案依然存在。
不過如果你想挖幣,還是算了…
平臺明令禁止使用 SageMaker Studio Lab 進行生產行為,挖掘加密貨幣查到直接封號。
說完配置,再看下實操。
從操作性上來說, Amazon SageMaker Studio Lab 相比其他平臺更簡潔直觀。
介面不僅僅能建立 Jupyter Notebook 檔案,還支援我們直接新建 Terminal 標籤頁、 Markdown 格式檔案。
此外,這個平臺配置有 Conda 和 Pip 資源包管理器,避免我們重複安裝開源軟體包,省事省心。
拉取 GitHub 專案甚至無需使用命令列,點選左側按鈕即可。
若克隆專案中有 yml 環境配置檔案,在建立專案同時,也會同步建立好 Conda 環境。
平臺還與 Github 關聯。
在我們自己的 Github 專案 README 文件中加入以下內容:
[![Open In Studio Lab](https://studiolab.sagemaker.a...)](https://studiolab.sagemaker.a...)
即可加入「 Open in Studio Lab 」按鈕——
他人只需一鍵,即可接入 Amazon SageMaker Studio Lab 平臺。
當然,我們也可以通過手動上傳或拷貝的方式新建 ipynb 。
以經典的影像分類演算法舉例。
從其他平臺拷貝一份 ipynb 檔案後,無需修改即可使用,最多也就是手動安裝依賴項。
實測訓練與其他平臺基本相同,有時,甚至稍快。
最後,得看看很多人關心的資料安全問題。
我們做機器學習,經常拿著大量人臉隱私資訊,甚至是尚未脫敏的醫院病患資訊,為保護他人隱私和資料安全,還得看看這方面情況。
Amazon SageMaker Studio Lab 脫胎於企業級應用,承諾每個人資料均通過加密保護,且如果刪除賬戶,所有相關資料也均相應刪除,平臺方承諾,不做保留。
目前,已有很多名校名企用上了 Amazon SageMaker Studio Lab ,併為其站臺背書。
這裡面,有 ENIAC 誕生地的賓夕法尼亞大學工程學院,也有美國加州聖克拉拉大學金融系,還有 Hugging Face 。
國內關注者也不少。
南方某985理工院校機器學習領域博士生表示,他們課題組方向雖然是傳統機器學習,但仍需深度學習方式輔助驗證。
由於實驗室的計算裝置好幾年前購入的,隨著人員與研究方向的增加,特別是在投稿前夕,計算資源的爭搶情況很普遍。Amazon SageMaker Studio Lab 對他們來說,的確有吸引力。
說完該免費平臺的種種優點,下個問題就是:怎麼申請?
這裡展開講講。
無需亞馬遜雲科技賬號,登陸官方連結studiolab.sagemaker.aws/requestAccount 填寫郵箱及相關資訊即可。
不過,為保證大家早日通過申請用起來,有些 Tips ,希望大家留意:
建議語言用英文,填寫清楚相關機構名稱,所留郵箱字尾與所在機構英文名匹配,這樣的申請更可信靠譜。
滿足上述條件,親測24小時內就能獲得邀請,注意查收郵箱。
無縫遷移的進階版
前面已經提到了, Amazon SageMaker Studio Lab 與專業版 Amazon SageMaker Studio 為同一架構,所以,如果想從初學免費版遷移專業版,肯定不是大事兒。
對專業開發者來說,這當然提供更多進階科研及創業的可能。
更具體看,專業版 Amazon SageMaker Studio 從頭到尾已經提供給開發者一套相當全面的功能:
比如提供大規模分散式訓練,面向我們生產性的大模型訓練需求。使用分割槽演算法,在 GPU 例項中自動拆分大模型和資料集,提升並行度加快訓練速度。
比如資料標註功能 Ground Truth Plus ,拉上了人類專家,結合機器學習輔助預標記,大幅降低標註錯誤,提升標註速率。
再比如 Amazon SageMaker Data Wrangler ,該功能面向機器學習中的資料準備階段,可通過視覺化介面進行資料選擇、清理、探查。只需一鍵匯入,無需程式碼即可快速標準化、轉換大批量、結構五花八門的資料。「四大」之一的德勤就採用了該項功能,原本幾個月才能完成的資料準備,現在壓縮到幾天完成。
此外,Amazon SageMaker Studio 還包括訪問許可權控制管理、模型監控、無伺服器推理功能、推理配置推薦…直至全週期的工業化 AI/ML 服務,都給包圓了。
上述種種,不少是今年亞馬遜雲科技 re:Invent 2021 新推出的功能,很大程度展示出這家企業對需求的理解和技術的前瞻性——
對專業開發者、資料科學家,不管是研究,還是創業,這些功能均提供了更多可能性。
更有意思的是,亞馬遜雲科技著眼點似乎並不止於經營業務,還有很多「不掙錢」的普惠性活動提供給我們。
機器學習馬拉松專案就是一個體現。
該活動一年好幾場,平臺一方會在AI相關領域應用中拿出試題,涵蓋 AI 自動化程式設計、對災害進行預防或定損等等方面。
活動將會測試挑戰者 CV 、NLP 等方面技能高低,這期間,相關平臺、資源也由平臺方提供。優勝者會得到最高5萬美元的獎品。
像這種面向實際需求,又將技術普惠開發者的活動還有很多,而且,各有好玩之處或社會價值。
有0門檻即可入門機器學習的自動駕駛競速賽 Amazon DeepRacer ,關注者數百萬,參與開發者已有14萬;
也有活動跟非盈利性組織 Girls in Tech 合作,幫助更多女性瞭解並上手機器學習,消除科技圈的性別差距;
還有最新推出,在圈內引發高度關注的 Amazon SageMaker Canvans ,面向0程式碼經驗的企業內部分析師、運營者,幫他們在實際業務中應用到機器學習這門技術。
技術大廠退居幕後
最後,如何評價亞馬遜雲科技的 SageMaker Studio Lab ?
經營角度看,這些做法對未來自家生態構建當然有利,是頭部企業保持身位的必要動作。此外,大批企業動輒年薪50萬招相關從業者,對很多開發者也是好事。
畢竟,人工智慧短缺肉眼可見,大部分開發者有豐富程式設計經驗和數理基礎,唯一擋板就是:不熟悉機器學習。補上這塊就喝湯,何樂不為?
不過,從行業維度看,上述動作也確實在推動前沿技術落地——
不過這裡的推動,不在於更快,而在於更廣。
要知道,一百年前汽車剛發明,只有機械專家才能成為車主,以至於當時社會,司機都是一個手握前沿技術的職業。
也要知道,三十年前,PC 和網際網路只是少部分開發者的玩具,以至於開發網站都能讓人迅速暴富,積累起萬丈高樓一樣高的資產。
所以,百年前的人無法理解一個人人可開車的社會,所以,30年前的人們也很難想象自己可以動動手指擁有屬於自己的網際網路平臺。
今天放在機器學習上也一樣。即便是最前沿的科技界大師,也只能窺見AI落地版圖的小部分狀貌。只有一再降維,這項技術才能走進千行百業場景,在不同背景不同經歷的人手裡才會產生不同頻率的迴響——
這既是亞馬遜雲科技普惠佈局的價值體現,也是李沐老師等大拿的公心所在。
那麼,將來 AI 技術還能釋放多大能量?
答案還得從每位個體開發者、每個場景裂隙裡,去尋找。
更多技術風向,長按下方圖片,即可瞭解:
不知不覺,又到年末,對技術圈而言,這一年中,各種技術與行業發展,既站高峰,也歷跌宕。
在2021年最後時刻,亞馬遜雲科技想聆聽來自雲端計算領域開發者的聲音,為此,雲端計算開發者有獎調研正式開啟,誠邀各位夥伴參與,多重好禮等你來領!