奈學:資料湖有哪些缺點?
資料湖本身是一箇中心化的儲存,能夠儲存任意規模的結構化與非結構化資料。資料湖相比資料倉儲有很多的優勢,但大多是在理想狀態下的,一旦執行起來還有很多技術挑戰。
(一)資料湖的資料可能並不會真正做到實時。在業務環境下,如果把所有資料都放到資料湖裡,那麼從資料湖直接呼叫資料的過程可能比原來資料倉儲更慢,因為從資料湖中提取出來的資料,依然要經過清洗實現標準化後才能更好的利用。具體能否達到需求的低時延效果,還要根據具體應用場景來進行判斷。
(二)把所有的原始資料都放到資料湖,可能會提升資料的使用難度。對於大型企業而言,業務內容豐富,作業系統繁雜,資料使用者往往期望所有的資料都能平民化,就像資料倉儲提供的那種經過了精心處理的資料,能夠輕鬆排程和使用來實現對業務的指導。如果是資料湖提供的原始化資料,其本身是很複雜的,資料專家進行理解和處理時或許難度適中,但大多數的平民使用者能否消化、理解並利用這些資料,將會是一個巨大的疑問。
(三)資料治理問題。資料倉儲裡的資料是經過整理、清晰易懂的。但資料湖的概念是不經處理直接進行堆砌,那麼資料湖就有可能會變成“資料沼澤”,篩選難度會變大。當然,資料湖的優勢就是資料可以先作為資產存放起來,問題就在於如何把這些資料在業務中利用起來。當部署了資料湖之後,資料治理問題將會接踵而至,比如從資料湖到資料池塘,如何將資料進行分流、池塘的資料如何進行整理等。
本文來源於:奈學開發者社群
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69976011/viewspace-2700974/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 奈學:資料湖和資料倉儲的區別有哪些?
- 大資料的優缺點有哪些?_光點科技大資料
- iframe有哪些優點和缺點?
- MySQL Json有哪些缺點MySqlJSON
- 低程式碼有哪些缺點?
- ERP系統有哪些優點和缺點?
- RPA 技術的優缺點有哪些
- HTTPS協議的優缺點有哪些?HTTP協議
- Python有哪些優缺點,你瞭解嗎?Python
- 虛擬伺服器的優缺點有哪些?伺服器
- 手工查殺病毒有哪些優缺點?網路安全學習入門
- 專案管理軟體免費的有哪些缺點?專案管理
- 電子郵件營銷的優缺點有哪些?
- 大資料開發有哪些難點?大資料
- 大資料有哪些作用?_光點科技大資料
- Python中爬蟲模組有哪些?優缺點介紹!Python爬蟲
- CRM客戶關係管理系統有哪些優缺點?
- (1)微服務是什麼?它的優缺點有哪些?微服務
- 資料治理管理平臺有哪些特點
- 大資料技術的特點有哪些大資料
- 谷歌的grpc和facebook的相比thrift 有哪些優勢,又有哪些缺點?谷歌RPC
- 雲資料庫MySQL有什麼作用?有哪些優點?資料庫MySql
- 那麼多人選擇Python,它的優缺點有哪些?Python
- 混合IT是什麼?基礎設施和優缺點有哪些?
- Python垃圾回收機制是什麼?有哪些優缺點?Python
- CRM系統雲部署和本地部署的優缺點有哪些
- Linux中靜態路由指什麼?優缺點有哪些?Linux路由
- IT大佬告訴你大資料有哪些特點,新人學習必知大資料
- MySQL資料庫有哪些優勢特點?Linux學習有用嗎MySql資料庫Linux
- 資料湖
- 資料湖+資料倉儲 = 資料湖庫架構架構
- 大資料分析的優勢有哪些特點大資料
- 一個理想的資料湖應具備哪些功能?
- MySQL有哪些儲存引擎,各自的優缺點,應用場景MySql儲存引擎
- 開源是什麼意思?開源軟體優缺點有哪些?
- Python的優缺點和應用領域有哪些? 【詳細】Python
- 資料庫索引的作用和優點缺點資料庫索引
- 大資料技術特點及優勢有哪些大資料