機器學習快速落地, Amazon SageMaker終於來了!

danny_2018發表於2020-05-25

前不久,全球市場份額佔比最大的公有云廠商亞馬遜雲服務(AWS)宣佈,旗下機器學習服務Amazon SageMaker在中國寧夏和北京區域正式上線,對於想透過機器學習加速數字化轉型的企業來說,這無疑是一個重大的福利。基於Amazon SageMaker釋出的一系列工具,企業不但擁有了機器學習所需要的強大的模型、演算法等方面的能力,還省去了準備、建立、部署、訓練等環節,系統自帶的各種功能,可以極大地提升開發效率,降低總體成本。

那麼,問題來了,Amazon SageMaker到底是什麼?

SageMaker是什麼?

“按照英文字義理解,Sage是魔法的意思,SageMaker是一個魔法生成器,是一項完全託管的機器學習服務,可以幫助開發者和資料科學家快速地規模化構建、訓練和部署機器學習 (ML) 模型。” AWS首席雲端計算企業戰略顧問 張俠博士,從SageMaker的概念開始,進行了詳細解讀。

傳統的機器學習要經歷一個艱難、複雜的過程,需要配備一些專業的技術人員,包括計算機、物理、統計、應用數學等好幾個專業的博士,用張量計算、卷積計算等方法,去構建整個流程。不僅耗費人力、物力、財力,花費時間也長,一般至少需要八、九個月時間才能完成。而透過SageMaker,技術人員只需要具備基礎知識,就可以在幾周內完成機器學習部署。

SageMaker擁有業界最全的內建演算法,關於計算機視覺的有影像分類、物件監測、語義分割的演算法;關於推薦的有分解機演算法;關於主題模型的有LDA、NTM;關於預測的有DeepAR;關於聚類的有KMeans演算法;關於迴歸的有Linear、XGBoost、Learner、KNN等等。

AWS在去年re:Invent大會上還推出了Amazon SageMaker Studio,提供的是一個全面整合的機器學習的整合開發環境,它可以讓開發者無需關心程式碼層面的問題,一鍵即可進行大規模協作,同時可快速建立易用的實驗環境,對上千個實驗進行比較、跟蹤,在全可見、可控的環境下自動生成高精度、高質量的模型,並且可以自動除錯、監控和運維。

另外,Amazon SageMaker還有一個特有的彈性筆記本功能,透過Amazon SageMaker Notebooks,使用者可在幾秒鐘內訪問筆記本,並且在不顯示增加計算資源的情況下啟動,靈活調整計算資源型別。

同時,還有多個符合特定業務場景的工具應用。比如:Amazon SageMaker Experiments,可跨實驗和使用者大規模跟蹤、度量和實驗資料,對組織和目標進行自定義管理,讓訓練快進快出、保證質量;Amazon SageMaker Debugger,可自動收集資料並用於視覺化分析、除錯,能自動化錯誤監測,透過警報提升生產力;Amazon SageMaker Model Monitor,可對模型進行監測,並透過內建規則檢測資料漂移或編寫自定義規則,用於定製化分析。再比如:完全可見、可控的自動化模型構建工具Amazon SageMaker Autopilot;用於資料處理和模型評估的分析作業工具Amazon SageMaker Processing;還有訓練一次便可多處執行的Amazon SageMaker Neo等等。

如果用一句話概括,SageMaker其實是一個能提供端到端服務的機器學習平臺,具有零安裝、模型訓練靈活、按秒付費等特點,因此可以幫助使用者將基於機器學習的模型快速構建到擁有智慧應用程式的生產環境中去。從準備開始,到最後的機器學習部署,SageMaker能提供全流程的工具集。

至於,Amazon SageMaker具體應該怎麼來用?AWS為何要花大力氣部署與機器學習相關的技術?這要從機器學習發展現狀以及AWS在人工智慧領域的戰略說起。

AWS為何如此看重機器學習?

眾所周知,人工智慧其實是一個比較大的概念,包括機器人、語言識別、影像識別、自然語言處理和專家系統等,主要是研究、開發用於模擬、延伸和擴充套件人的智慧的理論、方法、技術和應用系統的一門技術科學。

作為人工智慧的重要分支,機器學習強調的是學習,而不是計算機程式,主要透過一臺機器使用複雜的演算法來分析大量的資料,識別資料中的模式,並做出一個預測,不需要像過去那樣,透過人手動在機器的軟體中編寫特定的指令,機器可以模仿人獲取一些學習的能力。

與機器學習密切相關的還有深度學習,是一個基於神經網路的模式分析方法的統稱。因為機器學習從上個世紀80年代開始被廣泛關注,所以之後的十幾年,深度學習也得到了快速發展,取得了突破性的成果,返過來推動了人工智慧和機器學習的發展。

大體來看,機器學習有幾個重要元素:一個是資料;另一個是計算能力;第三個是演算法。從某種程度上來說,機器學習是大資料平臺、雲端計算和一些深度學習框架凝聚在一起的產物。其中,雲端計算起到了決定性作用,它既能提供大資料的儲存,提供了很多計算能力,又使得使用者可以非常方便地交流、分享各種各樣的演算法。

如今,人工智慧和機器學習已經成為新一代資訊科技的典型代表,很多傳統企業以及創新型企業都把機器學習看成是企業最重要的變革手段,用於提高產品自動化能力,或者進一步最佳化業務流程。但同時我們也發現,機器學習正面臨兩大難以逾越的挑戰。第一,人才短缺。人工智慧以及機器學習都需要很多專業知識,而瞭解這方面知識的人才又比較欠缺,有些人才需要百萬年薪才能找到。第二,技術落地難。如何快速構建、擴充套件與人工智慧相關的產品和應用,並把一些創新型技術落地到生產環境中去,還有一段很長的路要走。

作為網際網路巨頭企業,亞馬遜公司之所以要致力於機器學習領域,並不是簡單的追趕技術熱潮,而是企業網際網路內在基因使然。從二十多年前有電商開始,亞馬遜就在關注與機器學習相關的工作,產品推薦、產品搜尋,物流配送等等很多創新業務和服務都有機器學習的身影。比如:在倉儲業務環境中,除了送貨的無人機,亞馬遜還推出了智慧助理Amazon Echo、無人值守商店Amazon GO等等,背後其實都有機器學習和人工智慧的身影。

到目前為止,AWS有數千名工程師以及資料科技人員,在從事與人工智慧相關的工作,除了滿足企業內部的應用需求,還要進行業務創新,把更多服務打包成產品,推向市場。就像AWS雲端計算的發展脈絡一樣,最初也是基於自己企業內部應用,最後形成產品以及解決方案,為更多外部企業提供服務。對於機器學習,AWS有著自己的定義,那就是把機器學習能力轉移到每一位建立者手中,使它成為被廣泛應用的工具。

如何為行業賦能?

瞭解了AWS機器學習發展歷史,對於使用者為什麼更願意選擇AWS這個問題,也就不難理解!

首先,是工具的豐富性。AWS提供了最廣泛、深入的機器學習服務,其中核心服務就是Amazon SageMaker,它能加速整個機器學習過程,包括建模、訓練調優、部署管理等。外加AWS雲平臺的助力,使用者可以把資料儲存、資料倉儲,包括物聯網的技術和機器學習結合到一起,形成所謂的AIoT智慧物聯網。

其次,應用的快速落地。在選擇機器學習工具或者解決方案時,使用者看重的不只是功能的豐富性,還有應用的可實施性。目前,全球有數萬家企業選擇了AWS來執行機器學習工作負載。AWS擁有的機器學習使用者數量要高於其他任何運營商的至少兩倍。可以說,我們在各行各業都能看到AWS機器學習的身影,比如健康、醫療、線上教育等一些行業。

AWS的機器學習可以落地到各種特定應用場景。比如:在短影片行業,透過大量機器學習以及推薦演算法的使用,可以自動生成影片內容,並對內容進行分類,使用者只要有瀏覽記錄,就能判斷他會喜歡其他哪些影片。在金融行業,從風險欺詐偵測到智慧投顧等很多方面,機器學習都有施展拳腳的空間。再比如:健康醫療行業,從藥物的發現,到基因的使用、到各種個性化的醫療診斷,包括精準醫療、線上醫療等等,機器學習都能發揮關鍵作用。

而從應用效果來看,很多使用者對AWS的機器學習給與了高度評價。以大型方程式賽車Formula One 為例,Formula One公司在21個國家/地區舉辦過一系列賽車活動,在全球擁有超過5億粉絲,2017年創下18億美元的總收入。為了推動業務增長,Formula One使用AWS服務來推動賽事模式的變革,透過資料跟蹤系統和數字廣播等新技術的使用,公司增強了粉絲和車隊的賽車體驗方式。

“AWS在速度、可擴充套件性、可靠性、全球覆蓋範圍、合作伙伴社群以及可用雲服務的廣度和深度方面,均優於其他所有云提供商。” Formula One創新和數字技術總監Pete Samara說道。

具體而言,Formula One的資料專家使用 Amazon SageMaker 培訓深度學習模型,用65年的歷史競賽資料來提取關鍵競賽成績統計資料,進行競賽預測,並讓粉絲深入瞭解車隊和車手採用的瞬間決策和戰略。另外,Formula One的賽車運動部門在 AWS 上執行高效能運算工作負載,在制定新的賽車設計規則時,大幅度提高了空氣動力學團隊可以執行的模擬數量和質量。

總之,機器學習帶來的諸多好處,顯而易見。可以預測,未來隨著疫情的退去,機器學習會加快落地程式,尤其在企業數字化轉型關鍵階段,如何從客戶體驗、運營、決策、創新等方面多管齊下,提高整體競爭力,是企業下一步提振經濟的關鍵點。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31547898/viewspace-2694177/,如需轉載,請註明出處,否則將追究法律責任。

相關文章