2022年4月27日,亞馬遜雲科技宣佈推出“雲、數、智三位一體”的大資料與機器學習融合服務組合,幫助企業推進大資料和機器學習的融合,將機器學習由實驗轉為規模化落地實踐。亞馬遜雲科技“雲、數、智三位一體”服務組合具體涵蓋三個方面,分別是:構建雲中統一的資料治理底座,為機器學習提供生產級別的資料處理能力,以及賦能給業務人員更加智慧的資料分析工具。該服務組合是亞馬遜雲科技自去年推出 “智慧湖倉”架構以來,持續推進該框架的深度智慧並加速其落地實踐。
亞馬遜雲科技大中華區產品部總經理陳曉建表示:“隨著企業資料越來越多,機器學習模型越來越先進,很多企業期望通過大資料與機器學習技術的融合,進一步帶動業務創新,提升產出。但企業往往面臨一個困境,有大量的資料和分析技術儲備,也嘗試了很多先進的機器學習模型,但就是很難有實際的業務產出。企業不能只靠機器學習,而應在雲中打造統一的資料基礎底座,實現大資料與機器學習的‘雙劍合璧’。 在大資料與機器學習領域,亞馬遜雲科技提供廣泛而深入的服務,既有能打通兩個領域的資料治理底層服務,還能實現大資料與機器學習之間的相互賦能。我們希望能憑藉在這兩個領域的領先技術以及服務全球數百萬客戶的實踐經驗,幫助客戶加速實現大資料和機器學習融合的落地,為企業節本增效,提供業務發展的新動力。”
“雲、數、智三位一體”的亞馬遜雲科技大資料與機器學習融合服務組合
亞馬遜雲科技 “雲、數、智三位一體”的大資料和機器學習融合服務組合,是亞馬遜雲科技“智慧湖倉”架構的重要組成。亞馬遜雲科技通過在雲中構建統一的資料治理底座,提供資料分析服務保障機器學習的生產實踐,實現機器學習反向賦能智慧化資料分析,促進雲、數、智三者的統一與融合,幫助客戶推進機器學習專案的落地。
- 構建雲中統一的資料治理底座,打破資料及技能孤島。亞馬遜雲科技能幫助客戶構建統一的資料治理底座,實現大資料和機器學習的資料共享,資料許可權的統一管控,以及兩者統一的開發和流程編排。雲中統一的資料治理底座不僅能提升大資料和機器學習的高效融合,還能減少大資料和機器學習重複構建的工作,並且顯著降低成本。其中, Amazon Lake Formation推出諸多新功能,實現了資料網格跨部門的資料資產共享,以及基於單元格的最細粒度的許可權控制機制。Amazon SageMaker Studio可一站式地完成資料開發、模型開發及相關的生產任務,該服務基於多種專門構建的服務,如互動式查詢服務Amazon Athena、雲上大資料平臺Amazon Elastic MapReduce (Amazon EMR)、雲資料倉儲服務Amazon Redshift、Amazon SageMaker等,為大資料和機器學習提供統一的開發平臺。
- 助力機器學習由實驗轉為實踐,為機器學習提供生產級別的資料處理能力。機器學習專案成功的關鍵是對複雜的資料進行加工和準備。亞馬遜雲科技提供多種靈活可擴充套件、專門構建的大資料服務,幫助客戶進行復雜的資料加工及處理,應對資料規模的動態變化,優化資料質量。其中,Amazon Athena能夠對支援多種開源框架的大資料平臺,包括Amazon EMR、高效能關聯式資料庫Amazon Aurora、NoSQL資料庫服務Amazon DynamoDB、Amazon Redshift等多種資料來源,對這些資料來源進行聯邦查詢,快速完成機器學習建模的資料加工。 以Amazon Redshift、Amazon Managed Streaming for Apache Kafka (Amazon MSK)和 Amazon EMR 為代表的無伺服器分析能力,可以讓客戶無需配置、擴充套件或管理底層基礎設施,即可輕鬆地處理任何規模的資料,為機器學習專案提供兼具效能和成本效益的特徵資料準備。
- 讓資料分析智慧化,賦能業務人員探索創新。亞馬遜雲科技還不斷提供更加智慧的資料分析服務,賦能業務人員進行智慧分析、模型效果驗證以及自主式創新。例如,在日常分析工具中整合機器學習模型預測能力,其中深度整合機器學習Amazon SageMaker模型預測能力的Amazon QuickSight 、在分析結果中新增基於模型預測的Amazon Athena ML,可幫助使用者使用熟悉的技術,甚至通過自然語言來使用機器學習。亞馬遜雲科技還提供如Amazon Redshift ML、可視資料準備工具Amazon Glue Databrew、零程式碼化的機器學習模型工具 Amazon SageMaker Canvas等服務,讓業務人員探索機器學習建模。
全球數十萬計的客戶選擇亞馬遜雲科技開展雲上數智融合之旅
目前,全球數十萬客戶正藉助亞馬遜雲科技大資料及機器學習服務開展業務創新,將機器學習投入實踐,解決現實世界中真實和複雜的資料應用場景。樂我無限(Joyme)運營的全球化直播平臺LiveMe,薈萃了來自200多個國家和地區的近100萬名主播,每月活躍使用者數(MAU)超過3700萬。LiveMe基於亞馬遜雲科技的解決方案搭建了資料研發中心平臺的核心技術服務。Joyme資料研發中心總監楊飛表示:“LiveMe核心業務均部署在亞馬遜雲科技上,通過亞馬遜雲科技的技術賦能,實現了降本增效,加速了業務創新。通過直播內容實時識別技術服務,LiveMe不僅提升了使用者體驗,還大量降低了內容管理的業務成本。通過欺詐交易識別技術服務輔助識別欺詐交易,減少欺詐、拒付類交易,LiveMe每年減少經濟損失可達數百萬美元。未來LiveMe將在系統穩定性、資料驅動以及新技術開發等方面加深與亞馬遜雲科技的合作。”
豐富的合作伙伴解決方案助推客戶數字化轉型
亞馬遜雲科技構建了強大的合作伙伴網路,通過合作伙伴網路成員幫助客戶構建解決方案。亞馬遜雲科技合作伙伴上海欣兆陽(Convertlab)以雲端計算、大資料和人工智慧為代表的數字化技術,為企業營銷提供數字化、自動化、智慧化基礎設施以及相關的專業服務。Convertlab 聯合創始人兼CTO李徵表示:“基於亞馬遜雲科技統一的資料基礎底座, Convertlab構建了相輔相成的一體化資料智慧湖倉架構Data Hub和一體化高效機器學習平臺AI Hub,使資料流轉時效性提升32%,可進行快速的特徵設計與機器學習模型迭代,模型上線效率提升30%。當前已上線5大營銷特徵類別,300多營銷特徵,20多營銷AI模型,更好地賦能客戶智慧營銷,實現業務增長,助推行業數字化轉型。”
此外,亞馬遜雲科技還通過資料科學實驗室、機器學習實驗室和機器學習專業服務等一系列定製化措施,從基礎能力構建到行業前沿知識分享,幫助客戶將“資料驅動轉型”從設想到全面落地,重塑創新引擎。