亞馬遜雲科技宣佈與Hugging Face進一步合作,以加速對大語言模型和視覺模型的訓練、精調和部署,促進生成式AI應用的建立。生成式AI應用可以執行各種任務,包括文字摘要、問題回答、程式碼生成、影像建立以及撰寫論文和文章。

亞馬遜雲科技在生成式AI創新方面擁有深厚歷史。例如,亞馬遜使用AI技術為Amazon Alexa使用者提供對話體驗,每週使用者互動次數達到數十億次,同時也越來越多地使用生成式AI來支援新體驗,如“Create with Alexa”功能。此外,作為亞馬遜搜尋(Amazon Search)的一個小組,M5可以幫助亞馬遜各地團隊將大模型應用到他們的應用程式中,並訓練大模型以提升Amazon.com網站的搜尋結果。亞馬遜雲科技持續在機器學習(ML)的所有領域中創新,包括基礎設施、Amazon SageMaker相關工具和開箱即用的AI服務,比如Amazon CodeWhisperer,它嵌入到程式設計師使用的IDE中,透過註釋來生成建議程式碼,以提高開發人員的生產力。為加速機器視覺與大語言模型的訓練和推理,亞馬遜雲科技還推出了自研訓練晶片 Amazon Trainium與推理晶片Amazon Inferentia。

Hugging Face之所以選擇亞馬遜雲科技作為首選雲供應商,是因為它提供了靈活、可選的全球領先效能工具,例如Amazon SageMaker、Amazon Trainium和Amazon Inferentia,滿足了Hugging Face模型訓練、精調和部署需求。依賴於此,開發人員使用Hugging Face可以輕鬆最佳化效能並降低成本,從而更快地將生成式AI應用投入到生產環境。

“AI的未來已經到來,但並非每個人都能平等享用AI。”Hugging Face執行長Clement Delangue表示,“可訪問性和透明性是以明智和負責任的方式使用這些新功能,從而共享成果和創造新工具的關鍵。Amazon SageMaker和亞馬遜雲科技定製晶片會幫助我們的團隊和更大的機器學習社群,將最新研究成果轉化為人人都可構建的、公開的可複製模型。”

高效能且兼具成本效益的生成式AI

大語言模型和視覺模型的構建、訓練和部署是一個昂貴且耗時的過程,需要深厚的機器學習專業知識的支援。這兩類模型非常複雜,可能包含數千億個引數,因此在很大程度上,許多開發人員無法使用生成式AI。

為了彌補這一差距,Hugging Face與亞馬遜雲科技建立合作,讓開發人員更易透過訪問亞馬遜雲科技的服務,來應用部署Hugging Face模型,尤其是那些生成式AI模型。這樣做的好處是:可以更快地訓練與擴充套件低延遲和高通量的推理任務。例如,由Amazon Trainium支援的Amazon Elastic Compute Cloud (Amazon EC2) Trn1例項提供了更快的訓練時間,與基於GPU的例項相比,可節省高達50%的訓練成本。而由最新一代Amazon Inferentia晶片支援的Amazon EC2 Inf2例項,旨在部署最新一代大語言模型和視覺模型。相比Inf1例項,Inf2 例項吞吐量提升了4倍,延遲降低了10倍。Amazon SageMaker為ML提供工具和工作流,開發人員可以透過Amazon SageMaker等託管服務使用Amazon Trainium和Amazon Inferentia,亦或在Amazon EC2上自行管理。

“生成式AI蘊藏著改變整個行業的巨大潛力,但其成本和所需的專業知識使該技術無法為除少數公司之外的所有公司所用。”亞馬遜雲科技執行長Adam Selipsky表示,“Hugging Face和亞馬遜雲科技讓使用者更易訪問流行的機器學習模型,以最高的效能和最低的成本建立自己的生成式AI應用。此次合作充分說明,生成式AI公司和亞馬遜雲科技的合作可以讓更多客戶對創新技術觸手可及。”

即刻開始使用

客戶可以透過三種方式在亞馬遜雲科技平臺上呼叫Hugging Face模型,如使用SageMaker JumpStart、Hugging Face亞馬遜雲科技深度學習容器( DLC),或者根據教程將已有模型部署到Amazon Trainium或Amazon Inferentia。Hugging Face DLC包含了最佳化的transformer、資料集和標記器庫,使使用者將大規模地精調和部署生成式AI應用程式的時間從幾周縮短到幾小時,並且只需極少的程式碼更改。SageMaker JumpStart和Hugging Face DLC在提供Amazon SageMaker服務的所有區域上均可使用,無需額外費用。閱讀文件或者參與論壇討論(discussion forum)以瞭解更多資訊,或立即使用示例上手學習( sample notebooks)。