Databricks的16億美元融資對企業AI市場意味著什麼?

陶然陶然發表於2021-11-04

  據瞭解,Databricks公司最近在企業人工智慧市場中成為了贏家。這家初創公司日前以380億美元的估值獲得了16億美元的H系列資金。而這個最新一輪的投資是在Databricks公司籌集了10億美元之後幾個月進行的。

  Databricks公司是為統一、處理和分析儲存在不同來源和架構中的資料提供服務和產品的幾家公司之一。其他公司還包括去年進行了大規模首次公開募股(IPO)並擁有900億美元市值的Snowflake公司,以及去年上市的另一家企業人工智慧提供商C3.ai公司。

  為什麼投資者會青睞Databricks這樣的公司?因為這些公司正在解決阻礙企業嘗試啟動機器學習專案以降低運營成本、改進產品和使用者體驗並增加收入的一些最主要的挑戰。

  人們對於Databricks這樣的公司可以為企業人工智慧市場帶來什麼而感到興奮。但該公司的這一鉅額估值是否合理,還是成為市場炒作的副產品仍有待觀察。鑑於這些公司的結構及其商業模式,尚不清楚它們將如何繼續保持投資者預期的增長,以及它們是否能夠承受一些科技巨頭帶來的長期和不可避免的市場競爭。

   解決資料問題

  許多企業正試圖改善資料驅動的運營並啟動機器學習專案,但很難利用他們的資料基礎設施。得益於可擴充套件的雲端計算服務,企業能夠收集大量資料,而無需對IT基礎設施和人才進行前期投資。

  但是,使用這些資料說起來容易做起來難。對於一些大企業來說,資料通常分佈在不同的系統中,並以不同的標準儲存。它們結合了基於模式的傳統資料倉儲和無模式的資料湖,並儲存在企業的內部部署伺服器和雲平臺中。不同的資料儲存可能使用不同的規則來註冊相似的資訊,從而使它們彼此不相容。一些資料庫可能包含敏感資訊,這對將它們提供給不同的資料科學和商業智慧團隊帶來了很大挑戰。

  所有這些問題都使得企業整合資料和準備機器學習模型和商業智慧工具使用資料變得非常困難。事實上,一些調查表明,應用機器學習專案中的主要障礙與資料工程任務和人才有關。

圖中資料解釋了從機器學習模型中獲得可操作見解的大多數關鍵問題

  這是像Databricks這樣的公司正在解決的問題。Databricks公司的聯合創始人包括採用Apache Spark、Delta Lake和ML flow的開發人員,這三個開源專案已經成為在非常大的不同資料來源上執行的機器學習專案的關鍵元件。Apache Spark是一種分析引擎,可以處理各種格式的大量資料;Delta Lake是一個儲存層,將資料湖和資料倉儲結合在一個架構中,可以像傳統資料庫一樣查詢;ML flow是一種用於管理機器學習管道和跟蹤不同版本模型的工具。

  Databricks公司採用主要雲端計算服務Lakehouse使用所有這些專案將不同的資料來源整合在一起,並使資料科學家和分析師能夠從單個平臺執行工作負載。

  該公司的統一平臺使商業智慧和機器學習團隊可以輕鬆協作和共享工作空間,它透過提供對不同資料來源的統一訪問來減少資料工程的負載。而在背後,它可以處理不相容的模式、匿名化以及流資料和批處理資料之間的切換等問題。

  與同一類別中的其他服務一樣,Databricks的平臺支援Microsoft Azure、AWS和Google Cloud,這是大多數企業用來儲存資料的雲端計算基礎設施。這使Databricks公司能夠利用主要雲端計算提供商的堅固且可擴充套件的基礎設施,並避免其客戶遷移資料的需要,但也會給其業務帶來一些風險。

   大客戶

  Databricks公司的服務對於擁有大量未開發資料的企業來說具有巨大的價值。

  例如,阿斯利康公司使用Databricks的平臺來統一數百個內部和公共資料來源。這導致更快和更順暢的查詢、更好的團隊協作和更快的操作,這對於一個花費數十億美元和多年研究尋找有希望的假設和執行實驗的行業來說至關重要。

  匯豐銀行使用該平臺改進其欺詐檢測系統和推薦引擎。該銀行能夠將14個資料庫整合到一個Delta Lake中,並將其提供給資料科學和機器學習團隊使用。Delta Lake的設立是為了滿足一些法律和監管要求,例如在將客戶資料傳送到機器學習模型之前對其進行匿名處理。改進後的資料管道使操作速度提高了幾個數量級,並幫助機器學習團隊加快模型的開發、訓練和調整。其總體結果是客戶體驗得到改善,銀行移動應用程式PayMe公司的使用者參與度增加了4.5倍。

  而如果瞭解一下Databricks公司的競爭對手,就會發現類似的趨勢。C3.ai公司的客戶包括石油和天然氣巨頭、政府機構、大型製造商和醫療保健公司。而Snowflake公司為超市和連鎖餐廳、包裝食品和飲料公司以及醫療保健組織提供服務。

  大型科技公司對企業資料管理和人工智慧服務也很感興趣,但市場僅限於無法建立自己的資料管道或處於機器學習專案初始階段的企業。大多數大型科技公司都擁有內部人才和工具,可以根據自己的需求定製資料基礎設施,並充分利用開源和雲服務。一個有趣的案例研究是Twitter公司使用內部部署和基於雲的資料管理服務來執行機器學習工作負載。

   競爭激烈的市場

  在最新一輪融資中,Databricks公司報告了6億美元的年度經常性收入(ARR),高於2020年的4.25億美元。這種令人興奮的增長吸引了投資者向該公司投入更多資金。Databricks公司獲得380億美元的估值主要是由於投資者押注該公司維持這種增長速度的能力。

  但是,Databricks公司及其競爭對手必須克服一些挑戰,例如市場競爭非常激烈。正如Databricks公司執行長Ali Ghodsi所說,“Data lakehouses是一個新類別,因此這是爭奪市場份額的專案。我們希望儘快構建並完成這一專案。”

  在某些市場中,企業通常利用網路效應或卓越的資料來鎖定客戶,並保持對競爭對手的優勢。在資料處理行業,市場動態是不同的。雖然Databricks公司提供了一種非常有用的技術,但它並不是其他公司無法複製的。由於該公司的技術建立在主要雲端計算提供商提供的雲端計算服務之上,因此客戶轉向競爭對手幾乎沒有障礙。

  這意味著獲得成功將在很大程度上取決於市場參與者的客戶獲取策略以及他們透過持續創新留住客戶的能力。

  而業務的增長還將在很大程度上取決於該公司將獲得的客戶型別。Databricks公司在最新一輪融資中宣佈其擁有5,000個客戶。由於該公司尚未申請首次公開募股(IPO),人們不知道其財務細節。但如果有任何市場競爭的跡象,其收入的很大一部分來自少數一些規模非常大的客戶。例如,C3.ai公司2020年收入的36%來自貝克休斯(Baker Hughes)和恩吉(Engie)公司。根據Snowflake公司提交的S-1檔案,其2020年上半年近30%的收入來自其3,000個客戶中的153個。

  只要這幾家公司能夠獲得願意花費大量資金的大客戶的支援,它們的業務就會增長。但一旦市場飽和,其增長將趨於平穩。然後,他們將不得不向現有客戶追加銷售新服務,而這麼做是非常困難的;如果透過提供更具競爭力的價格來相互搶奪客戶,但這將降低收入。每個大客戶的流失都將對這些公司的財務狀況產生巨大影響。

   市場的未來發展

  市場的競爭性將對推動企業人工智慧公司快速創新產生積極影響。但在某個時候,市場將面臨來自大型科??技公司的激烈競爭。

  全球主要三個雲端計算提供商的產品都可以演變成Databricks提供的那種服務。例如,谷歌公司有BigQuery,微軟公司有Azure Synapse,亞馬遜公司有Redshift。

  一旦市場發展成熟,預計雲端計算巨頭將會採取行動來爭奪更多的份額。鑑於其財力雄厚,這三家雲巨頭可以收購規模較小的資料管理公司,也能夠以更具競爭力的價格收購其客戶。

  在這三家雲巨頭中,應該特別關注的是微軟公司,由於其企業協作工具,該公司已經在Databricks和其他公司蓬勃發展的非技術市場獲得了很大的份額。

  微軟公司也在和Databricks公司開展合作,Databricks公司的很多大客戶都執行在Azure Databricks平臺上。而微軟公司也有將合作伙伴關係轉化為收購的歷史。

  而在與行業媒體的探討中,Ghodsi公司並不排除首次公開募股(IPO)的可能性。但如果這家公司最終成為微軟的子公司,也不會讓人感到驚訝。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/28285180/viewspace-2840613/,如需轉載,請註明出處,否則將追究法律責任。

相關文章