整整一年多,生成式AI已經吸足了全球科技界目光。在亞馬遜雲科技大中華區產品部總經理陳曉建看來,生成式AI不僅僅是大模型,還需要大量的基礎模型以外的服務來支撐,如加速晶片,資料庫,資料分析,資料安全服務等等。
作為全球雲端計算領導者,亞馬遜雲科技提供了完整的端到端的生成式AI技術堆疊,從底層的加速層如加速晶片,儲存最佳化,到中間層模型構建工具和服務,再到最上層的生成式AI相關應用,每一層都在針對客戶的不同需求持續創新。
在生成式AI時代的定位
當199IT問到在生成式AI時代,亞馬遜雲科技如何看待自身的定位。陳曉建表示,亞馬遜雲科技本身是一個基礎設施的提供商,初心是做技術的普惠化,在生成式AI的今天,初心未變,亞馬遜雲科技仍然希望透過技術降低使用門檻,能夠讓生成式AI的技術為業務賦能。
除了普惠化之外,負責的AI也是亞馬遜雲科技所秉持的重心。包括六點——公平和偏見、穩定性、可解釋性、治理、透明度、隱私和安全性。
因為AI技術如此之新,如此智慧,所以在使用的時候其實會碰到很多非技術的問題,雖然它很聰明,可以幹各種事情,但是並不是每一件事情都是對社會有利的。所以亞馬遜雲科技強調公平性,它不能按性別、年齡、種族而提供區別對待的服務。
如何保證服務的高可用性,至關重要。另外,要避免有害性,生成式AI本身是一把雙刃劍,很多生成式AI的能力非常強,如果不在有害性方面去做很好的管理,可能會引導到一些並不是非常好的應用場景上。還包括個人隱私等。
陳曉建認為以上這些要點,決定了生成式AI最終能夠跟產業結合會達到什麼效果。
釋放生成式AI的潛力
亞馬遜雲科技圍繞應用場景、工具和基礎設施、資料基座、AI原生應用構建和生成式AI服務,助力企業和開發者釋放生成式AI的潛力。
基礎模型的發展和迭代速度正超越以外任何一項技術,基本以月甚至天為單位持續迭代,而新出現的每一個大模型都在效能和特定領域有著獨特的優勢。在眾多的基礎模型中,應該如何便捷安全的選擇最適合自己業務場景的基礎模型,是每一家企業在構建生成式AI應用時面臨的挑戰。
亞馬遜雲科技正式推出了Amazon Bedrock,該服務與Amazon SageMaker Jumpstart結合,助力對基礎模型有著不同需求的客戶輕鬆、安全地選擇基礎模型。
Amazon Bedrock是企業使用基礎模型構建和擴充套件生成式AI應用程式的最簡單方法,它是一項無伺服器服務,提供了廣泛的模型選擇、資料隱私,並且能夠自定義模型,無需管理任何基礎設施。該服務提供的基礎模型來自Meta, Anthropic, Stability AI, AI21 Labs、Cohere等第三方領先提供商以及自身的Amazon Titan模型等,近期還加入了Meta的下一代開源大模型Llama2以及Anthropic的Claude2等熱門基礎模型。
與Amazon Bedrock相比,Amazon SageMaker需要客戶管理應用程式架構中的模型部署、配置和託管,但擁有更大的靈活度和自由度對基礎模型進行定製,客戶可以從Amazon SageMaker Jumpstart中選擇開源的基礎模型,然後根據自身需求可以選擇全量微調,輕量微調等不同方式,進一步確定微調框架,利用分散式訓練實現微調,從而更好的評估微調效果。
Amazon Bedrock代理功能是一項全新的全託管功能,使開發人員能夠更輕鬆地建立基於生成式AI的應用程式,以完成各種用例的複雜任務,並根據專有知識源提供最新的答案。開發人員只需進行簡單操作,Amazon Bedrock 代理功能就會自動分解任務並建立編排計劃,無需任何手動編碼。該代理透過簡單的 API 介面安全地連線到公司資料,自動將資料轉換為機器可讀的格式,並增加相關資訊以生成最準確的回答。然後,代理可以自動呼叫 API 來滿足使用者的請求。
10多年來,亞馬遜雲科技對全球基礎設施進行深度投資,能夠為客戶提供廣泛的加速器選擇,包括強大而靈活的基於GPU的解決方案,例如基於英偉達最新GPU晶片H100 Tensor Core的Amazon EC2 P5例項,與上一代相比速度快6倍,訓練成本節省40%;還有基於亞馬遜雲科技自研的機器學習推理晶片Amazon Inferentia2推出的Amazon EC2 Inf2例項,與其他類似的EC2例項相比價效比高40%;基於自研機器學習訓練晶片Amazon Trainium推出的Amazon EC2 Trn1例項,與同類例項相比訓練成本節省高達50%。
開箱即用的生成式AI服務
程式設計是生成式AI技術得到快速應用的領域之一。軟體開發者需要花費大量時間編寫相當淺顯和無差別的程式碼,真正用於創新的時間少之又少。從網上覆制程式碼片段則可能無意中複製無效程式碼或有安全隱患的程式碼,或對開原始碼的使用沒有進行有效追溯。
亞馬遜雲科技的解決方案是Amazon CodeWhisperer,它是一款人工智慧編碼夥伴,在基礎模型高階選項中使用,可以實時生成程式碼建議,從根本上提高開發人員的生產力。我們還進行了一項生產力測試,與未使用的參與者相比,使用Amazon CodeWhisperer的參與者完成任務的速度平均快57%,成功率高27%。
同時亞馬遜雲科技最近推出了Amazon Whisperer自定義功能,能夠生成優於之前的程式碼建議,因為它允許客戶使用私有程式碼庫安全地定製 CodeWhisperer程式碼建議,這些私有程式碼庫可涵蓋內部API、資料庫、最佳實踐和架構模式等。
據悉,亞馬遜雲科技透過開箱即用的生成式AI服務及工具,已幫助1000+中小企業和初創公司快速實現生成式AI創新,已賦能10W+中國開發者。
幫助不同型別的客戶使用生成式AI服務
亞馬遜雲科技使命是幫助不同規模、不同體量的客戶降低創新門檻。
具體到生成式AI方面,一類是想要用生成式AI構建比較大規模的,計劃面對上百萬、上億使用者的AI原生的或者大模型要大規模應用的企業(它可能是初創企業),從算力、資料端到端的能力,用雲的方式,透過Amazon Bedrock、Amazon SageMaker讓他們儘可能容易的構建模型,快速發展,並且很容易擴充套件到很大的規模,利用好雲的彈性,以極低的成本去執行。這是亞馬遜雲科技未來重點投入的地方。
對於企業內部來應用,提升協作效率,提升辦公效率,這一類的客戶最重要的應用可能部署的規模不會特別大,但是對業務要求和整個業務的理解,包括到底能不能產生業務價值要求是非常高的。亞馬遜雲科技更多是投入人力包括一些合作伙伴的政策去支援,行業專家加上技術專家滿足客戶需求。
陳曉建表示,“開發生成式AI應用是一個充滿挑戰的系統工程,並不是單純的產品和服務拼接,因此,如何加速客戶最終應用的商業化落地,除了亞馬遜本身的資源以外,我們同樣需要構建強大的合作伙伴生態,與它們一起助力解決生成式AI應用構建中的各種技術問題,加速應用落地。除了雲服務之外,我們還提供解決方案架構師、產品技術專家、人工智慧實驗、資料實驗室、快速原型團隊、專業服務團隊、培訓與認證部門等多個資源共同助力客戶成功,同時我們還攜手生態合作伙伴與初創圈構建生成式AI的完整體系,進一步助力生成式AI技術的落地。”