雲端計算pk本地:誰是生成式AI的未來戰場?

陶然陶然發表於2023-11-30

  來自企業客戶的資料清晰但矛盾。雖然94%的客戶表示,他們今年在人工智慧上的支出增加了,但他們這樣做是因為預算限制,這將從其他計劃中消減資金。此外,客戶計劃在哪裡執行生成式AI的選擇幾乎完全分為公有云和內部/邊緣。更為複雜的是,開發人員報告稱,公有云在功能豐富性和創新速度方面的經驗非常突出。與此同時,各組織對IP洩漏、合規性、法律風險和成本表示了合理的擔憂,這將限制他們對公有云的使用。

  在這篇分析中,我們將分享關於採用大語言模型的最新資料和想法,並討論市場發展時需要考慮的因素。與往常一樣,我們將分享最新的ETR資料,以揭示客戶在平衡風險與時間之間面臨的關鍵問題。

   企業IT支出依然緊張

  下圖來自7月份ETR支出的最新快照。該資料包括1777名高階IT決策者,代表了超過7500億美元的支出能力。

  高階IT決策者在2022年結束時期,預計他們的預算將增長4-5%。但到1月份,這一數字已降至4.1%,儘管全年小幅連續增長,但目前仍為2.9%,遠低於最初的預期。

   預算限制迫使進行權衡

  在預算有限的情況下,生成式AI的迅速發展導致組織機構不得不重新設定優先順序。正如我們在去年與Andy Thurai進行的分析中所分享的那樣,人工智慧投資回報一直難以捉摸。但ChatGPT熱潮促使董事會下達了一項自上而下的命令,並因此改變了企業技術方面的支出重點。

  上圖顯示了ETR追蹤的行業。淨分數或支出動力位於縱軸上,調查中的普及度位於橫軸上。雖然所有行業在2022年都感受到了預算限制的壓力,但AI作為領先的細分市場之一,到了2022年10月,被壓縮到低於40%的紅色虛線——即支出速度的高水位線。ChatGPT在11月份進入市場後,AI支出加速增長。然而,預算並沒有發生明顯變化。

  因此,我們看到其他行業出現了壓縮的情況,這表明在短期內,對生成式AI的資金投入將對市場的其他細分領域產生一定程度的稀釋效應。

   對AI的支出超過其他專案

  正如我們之前提到的,在下面的資料中顯示,94%的客戶報告稱他們將在2023年增加他們在AI上的支出。

  儘管大多數客戶報告稱其支出增長幅度為10%或更低,但有36%的客戶表示他們的支出將增長兩位數。

   高層領導的要求與風險偏好相沖突

  來自高層自上而下的壓力要求企業“搞清楚”生成式AI,這是一項緊迫的任務,實際執行起來更具有挑戰性。下圖顯示了客戶在生產環境中如何使用生成式AI。雖然有34%的客戶表示他們不在評估中,但這個數字較上一季度大幅下降。

  無論如何,在實際生產環境中,有兩件事值得注意:

  1)大多數人仍處在評估階段;

  2)使用案例相當直觀,聊天機器人是最重要的應用領域,其次是程式碼生成、文字摘要和撰寫市場營銷文案。

  我們認為,組織必須真正理解商業案例並確定投資回報率。最大的投資回報驅動因素將是降低勞動力成本。你可以將其歸類為提高生產力,但最終目標是減少對人力資源的需求。這並不一定意味著失業率會上升——它只是意味著價值的主要驅動因素將是減少員工數量。這無疑會改變就業所需的技能。

   組織必須評估GenAI的風險

  一個關鍵挑戰是,在上層動力確實存在的情況下,部署會帶來一系列風險問題。下面這張幻燈片來自Technalysis釋出的一項最新研究,該獨立分析公司由分析師鮑勃·奧唐奈爾運營。它展示了1,000名IT決策者所關注的GenAI相關最重要的問題,包括合規性、智慧財產權洩露、法律問題(如版權侵犯)、資料和工具質量等。

  這些都是對生成AI及其使用方式謹慎的合理原因。

   重新思考雲與本地之間的平衡

  對於GenAI風險的擔憂導致許多組織表示他們將在本地進行GenAI部署。

  下面是ETR提供的一些資料,顯示組織報告了相同比例的私有和公有基礎架構,即公共雲或本地/邊緣部署。雲的吸引力在於它擁有最好的工具,但出於Technalysis調查中提到的原因,私有基礎架構預計將成為一個流行的部署選項。

  但云仍然具有優勢。目前,雲中儲存了大量的資料——我們認為40-45%的工作負載正在雲上執行,也許到明年可能達到50%。正如我們在以前的研究中報導的那樣,雲和本地正在趨於平衡——雲仍在以更快的速度增長——但對於許多傳統應用程式來說,遷移到雲端的商業案例還沒有那麼強大。我們相信,雲端增長的很大一部分來自於現有云工作負載之上的新應用程式或功能。

  本地工作負載正成為注入人工智慧的良機,諸如思科、IBM、戴爾技術和HPE等老牌企業正在尋找機會並積極投資。

   雲依然具有巨大優勢

  事實上,在與開發人員交流時,他們普遍認為雲在人工智慧領域非常強大。以下是我們強調過的八個觀點,開發者告訴我們公共雲滿足了這些需求。我們相信,在考慮雲和本地GenAI解決方案之間的功能權衡時,這些觀點可以作為客戶的參考指南。

  AI的創新速度,建立在像Amazon SageMaker這樣的先前工具之上。整合的簡易性和推動的生產力……使開發人員能夠迅速實現預期結果。我們鼓勵我們的社群訪問thecubeai.com作為一個示例,並註冊我們的私有測試版。我們的團隊使用AWS上現成可用的工具,包括開源LLMs、MongoDB、Milvus作為我們的向量資料庫和其他雲工具,在幾周內迅速構建了這個平臺。

  根據我們收到的查詢,模型訓練需要更多時間,但是MVP(最小可行產品)開發時間僅為正常軟體產品開發週期的十分之一。

  我們在上述第4點中強調了重要性——即模型選項的多樣性——不僅來自雲供應商,還來自於第三方供應商。

  第5點和第6點也非常關鍵——能夠隔離推理請求,使LLM供應商無法訪問任何客戶資料。安全性提供豐富性也是關鍵因素。例如,確保資料保留在特定地區以及對資料傳輸進行加密等功能。

  雲提供了從矽到AI工具鏈、最大程度的資料庫選擇、治理選擇、身份訪問、開源工具可用性以及豐富的合作伙伴生態系統的一流工具。

  因此,儘管HPE和Dell這樣的公司已經宣佈提供LLMs作為服務,但他們的能力如何,以及他們是否真正將LLMs無縫地整合到解決方案中,還並不確定。

  雖然在本地進行工作可以降低風險並且非常合理,但現有企業需要做大量工作來建立全面的解決方案和生態系統合作伙伴堆疊。

   比較雲與現有企業之間客戶支出勢頭

  與現有企業基礎設施供應商相比,雲供應商具有更強勁的業務動力。儘管有關雲最佳化、重返本地和增長放緩等話題屢見不鮮,但資料仍明顯支援雲供應商。

  上面是ETR資料,顯示了幾位有潛力的LLM領導者的淨分數分解。淨分數是一種度量支出速度的指標。它跟蹤新客戶的百分比-這就是酸橙色。深綠色表示與去年相比支出增加6%或更多。灰色表示支出持平,粉紅色表示支出減少6%或更糟,明亮紅色表示流失客戶。將紅色從綠色中減去,就可以得到右側柱形圖中顯示的淨分數。

  在淨分數右側,我們顯示了調查中的回應數量,這是市場影響力的代理變數。因此,正如您所看到的,AWS、微軟和谷歌的淨分數分別為51%、49%和34%,並且N值接近或超過1,000。

  DELL和HPE相比,在市場影響力方面,DELL有著很強的存在感(N超過800),HPE也高達483。但從支出角度來看,雲端計算仍然具有明顯較高的動力。

   追蹤一些關鍵資料平臺

  下面我們展示了Databricks、Snowflake、IBM和Oracle等一些重要的資料平臺名稱的同樣資料。Databricks具有非常可靠的60%淨分數,已經超過了47%的Snowflake,儘管Snowflake在市場影響力上更大。但顯然Databricks正在逐漸接近Snowflake的傳統領域。正如您所看到的,IBM和Oracle的淨分數較低,分別為10%和-1%,但資料集中有大量資料。

   GenAI何時會在利潤表中顯示出來?

  我們預計對人工智慧(包括GenAI)的支出將在2023年下半年開始對利潤表產生明顯影響。

  以AWS為代表,下圖顯示了AWS自2022年第一季度以來的收入增長率。我們認為,在第三季度,減速將趨於穩定,根據當前的預測,由於人工智慧作為助推因素和第四季度的季節性因素,增長將在第四季度重新加速。特別是我們預計GenAI將推動更多的計算和儲存支出,並在資料平臺和相關工具方面產生附加支出。

  這種情況存在一些風險,包括宏觀環境和大數定律的作用,以及競爭,但我們目前的想法是我們正在雲最佳化的尾聲階段,並轉向新的工作負載啟用。

   GenAI的功耗分佈

  John Furrier經常在theCUBE上談論冪律。我們將透過觀察對大型語言模型進行修改後的冪律分佈來進行總結。

  冪律分佈是兩個數量之間的統計關係。簡單地說,冪律分佈可以理解為80/20法則。例如,我們銷售額的80%來自我們產品組合中的20%。在下面的圖表中,我們對這個概念做了一些改進,認為只有少數公司會構建大規模的語言模型。大多數LLM將位於X軸上較長的尾部,並且非常特定於行業,並且它們的規模較小。

  此外,邊緣部署將會非常豐富,並且高度敏感於延遲、經濟性和功耗消耗。

  在這裡,我們想要提出幾點觀點:

  首先,我們認為企業技術創新仍然受到消費者規模的推動。個人電腦晶片、來自搜尋引擎和社交媒體的資料實力、快閃記憶體儲存以及最近的Nvidia遊戲等等,所有這些都透過消費者渠道進入了企業。

  我們相信,大型雲端計算和消費品牌將主導最大模型空間和模型的持續執行。

  與Web不同的是,Web上的冪律曲線就像一堵筆直向下沒有軀幹的牆(橙色線沿Y軸)。我們相信LLM領域將像紅色虛線所示一樣被拉昇並向右上方移動。在這個領域,我們相信開源和第三方工具將填補空白,以及Snowflake和Databricks等雲合作伙伴。

  戴爾、HPE和IBM等本地市場占主導地位的企業將成功,當他們能夠利用LLM多樣性,並將其部署在他們的市場模型中...以一種與雲端計算一樣簡單、更受控制且對於他們特定用例而言更具成本效益的方式。重要的是,我們認為企業人工智慧將需要明確的投資回報率和經濟價值,否則專案將無法成功。

  正如我們之前所說,我們相信主要價值將來自於減少人員數量。

  與此同時,我們相信邊緣計算將由基於低成本、低功耗、高效能系統構建的架構主導?——往往是基於Arm的設計,並且是大規模的。比如特斯拉和蘋果。我們相信邊緣計算的經濟學最終將進入企業併成為一股破壞性力量。

  這可能需要十年左右的時間,但自個人電腦打破大型機以來,企業IT的經濟學一直受消費者規模的推動,我們認為這一浪潮也不例外。人工智慧+資料+規模經濟學將決定未來幾年內行業的基本結構。

  無論您在哪個行業中,我們認為這是一值得做出投資的。然而,應用它需要仔細和深入的思考...

  原文連結:

  

來自 “ https://wikibon.com/breaking-analysis-cloud-vs-on- ”,原文連結:http://blog.itpub.net/28285180/viewspace-2998247/,如需轉載,請註明出處,否則將追究法律責任。

相關文章