什麼是資料湖屋Lakehouse? -DZone大資料

banq發表於2020-08-06

“ Data Lakehouse”是資料管理領域中的一種新架構範例,結合了Data Warehouse和Data Lakes的最佳特性。一旦將資料載入到資料湖中,就無需將資料載入到倉庫中進行其他分析或商業智慧。您可以直接查詢便宜但高度可靠的儲存(通常稱為“物件儲存”)中的資料,從而減少了資料管道上的操作開銷。
從高層次看,Data Lakehouse具有以下特徵–
  • 事務支援
  • 模式實施和治理
  • 支援BI工具
  • 儲存應與計算分離
  • 支援最新的儲存格式
  • 支援API訪問
  • 支援結構化和非結構化資料
  • 支援流資料


當前方法的問題所在
如今,越來越多的公司正在雲中構建新的資料倉儲或資料湖。或者,他們正在整合和現代化其本地資料倉儲或資料湖以在雲中執行。但是,他們看不到第一次從其投資中獲得價值。這通常歸因於缺乏用於資料整合,資料質量,資料治理和後設資料管理的適當工具集,或者它們依賴於手工編碼才能滿足這些要求。
手工編碼資料管理專案通常是從與雲提供商的平臺即服務(PaaS)或基礎架構即服務(IaaS)捆綁在一起的工具開始。手工編碼可能適用於原型設計和培訓,但難以維護且不可重用。如果更改或升級技術,平臺或處理引擎,則必須重新設計並重新編碼,這既昂貴又有風險。
使用未整合的多個產品來實現整個資料管理通常是冒險和複雜的。同樣,依靠雲供應商的有限解決方案也有其缺點,因為它們是基本的。雲資料管理需要多雲策略和部署模型。 
 

相關文章