開源 Amundsen:資料發現和後設資料平臺
在像 Lyft 這樣的現代資料驅動型公司中,平臺上的每一次互動都是由資料驅動的。複雜資料生成、ETL 流程和分析帶來的挑戰使後設資料變得非常重要。
此外,資料資源的種類也在不斷增加。在 Lyft,這些資源包括 Redshift、Presto、Hive、PostgreSQL 中的 SQL 表和檢視,以及 Mode、Superset 和 Tableau 等商業智慧工具中的儀表板。隨著資料資源的增長,瞭解存在哪些資料資源、如何訪問它們以及這些資源中有哪些可用資訊變得越來越困難。
Lyft 開源了 Amundsen,並詳細介紹了支援資料發現引擎的架構。文中比較了用於提取後設資料的拉取模型與推送模型,以及它對拉取模型的好處。
Amundsen 由一個通用資料攝取框架 DataBuilder、一個前端服務、一個處理來自前端的請求的後設資料服務和一個由 ElasticSearch 支援的
搜尋服務組成。
詳細點選標題
相關文章
- DataHub:LinkedIn的後設資料搜尋和發現平臺
- opendatadiscovery/odd-platform:第一個開源資料發現和可觀察性平臺Platform
- Smartbi:資料治理系列之後設資料管理平臺的原理
- 大資料開發實戰:實時資料平臺和流計算大資料
- 智慧警務大資料平臺開發,資料視覺化分析平臺搭建大資料視覺化
- TDS:標籤平臺+API平臺+資料共享平臺,助力資料運營平臺建設API
- 大資料平臺開發公司有哪些?大資料
- Tracardi:開源客戶資料整合與分析平臺
- 前瞻|Amundsen的資料血緣功能
- 全棧全平臺開源專案 CodeRiver 資料庫設計文件全棧資料庫
- 22個大資料開發處理框架平臺和工具大資料框架
- SparkSQL:Parquet資料來源之合併後設資料SparkSQL
- 大資料平臺最常用的30款開源工具大資料開源工具
- 資料視覺化分析平臺開源方案集錦視覺化
- 資料整合平臺,多種異構資料來源連結
- 資料平臺、大資料平臺、資料中臺……還分的清不?大資料
- 資料治理--後設資料
- 關於後臺資料庫設計的考慮(手機平臺)資料庫
- 「免費開源」基於Vue和Quasar的前端SPA專案crudapi零程式碼開發平臺後臺管理系統實戰之後設資料匯出匯入(十五)Vue前端API
- B站大資料開發治理平臺的產品設計心得大資料
- Hi3511平臺開發環境搭建資料開發環境
- 大資料開發需要學習什麼?大資料平臺是什麼?大資料
- 資料庫平臺資料庫
- 大資料和Hadoop平臺介紹大資料Hadoop
- 分析平臺Tableau推出資料和分析平臺新功能
- [平臺建設] 大資料平臺如何實現任務日誌採集大資料
- 如何進行投後資料管理?Smartbi投後資料管理平臺來幫你
- 案例|政務大資料平臺資料安全建設實踐大資料
- 打造“資料金字塔”,小米大資料平臺建設之路大資料
- ETL資料整合,RestCloud資料整合平臺RESTCloud
- 專業資料標註公司和智慧資料標註平臺
- 大資料軟體工具租賃 BI大資料分析平臺定製開發大資料
- 企業客服溝通對話資訊的開源大資料平臺:airy大資料AI
- 淺談資料開發神器——數棧離線開發平臺(BatchWorks)BAT
- 《離線和實時大資料開發實戰》(二)大資料平臺架構 & 技術概覽大資料架構
- vivo資料庫與儲存平臺的建設和探索資料庫
- 美創助力台州市大資料局“公共資料平臺”資料安全建設大資料
- 建設資料採集分析平臺,整合業務資料、消滅資料孤島