資料湖 vs 倉庫 vs 資料庫

banq發表於2022-01-16

對於外行來說,資料儲存通常在傳統資料庫中處理。但是對於大資料,公司使用資料倉儲和資料湖。

 

什麼是資料庫?

資料庫是儲存結構化資料的儲存位置。我們通常會想到計算機上的資料庫——儲存資料,可以通過多種方式輕鬆訪問。可以說,您可以將智慧手機本身視為一個資料庫,這要歸功於它儲存的有關您的所有資料。

對於所有組織,資料庫的用例包括:

  • 為財務和其他資料建立報告
  • 分析相對較小的資料集
  • 自動化業務流程
  • 稽核資料輸入

流行資料庫:

 

什麼是資料倉儲?

資料庫的下一步是資料倉儲。資料倉儲是您從各種來源積累的資料的大型儲存位置。幾十年來,商業智慧和資料發現/儲存的基礎依賴於資料倉儲。它們特定的靜態結構決定了您可以執行哪些資料分析。

作為跨團隊或部門孤島資料庫共享資料和內容的一種方式,資料倉儲在大中型企業中很受歡迎。資料倉儲幫助組織變得更有效率。使用資料倉儲的組織經常這樣做來指導管理決策——所有那些你經常聽到的“資料驅動”的決策。

提供資料倉儲的熱門公司包括:

  

什麼是資料湖?

資料湖是一個大型儲存庫,它以原始格式儲存大量原始資料,直到您需要它為止。資料湖利用了資料倉儲的最大限制:它們更靈活的能力。

正如我們將在下面看到的,資料湖的用例通常僅限於資料科學研究和測試——因此資料湖的主要使用者是資料科學家和工程師。例如,對於實際構建資料倉儲的公司來說,資料湖是一個轉儲和臨時儲存所有資料的地方,直到資料倉儲啟動並執行。中小型組織可能幾乎沒有理由使用資料湖。

流行的資料湖公司有:

 

相關文章