開源 Amundsen:資料發現和後設資料平臺
在像 Lyft 這樣的現代資料驅動型公司中,平臺上的每一次互動都是由資料驅動的。複雜資料生成、ETL 流程和分析帶來的挑戰使後設資料變得非常重要。
此外,資料資源的種類也在不斷增加。在 Lyft,這些資源包括 Redshift、Presto、Hive、PostgreSQL 中的 SQL 表和檢視,以及 Mode、Superset 和 Tableau 等商業智慧工具中的儀表板。隨著資料資源的增長,瞭解存在哪些資料資源、如何訪問它們以及這些資源中有哪些可用資訊變得越來越困難。
Lyft 開源了 Amundsen,並詳細介紹了支援資料發現引擎的架構。文中比較了用於提取後設資料的拉取模型與推送模型,以及它對拉取模型的好處。
Amundsen 由一個通用資料攝取框架 DataBuilder、一個前端服務、一個處理來自前端的請求的後設資料服務和一個由 ElasticSearch 支援的
搜尋服務組成。
詳細點選標題
相關文章
- DataHub:LinkedIn的後設資料搜尋和發現平臺
- opendatadiscovery/odd-platform:第一個開源資料發現和可觀察性平臺Platform
- 大資料開發實戰:實時資料平臺和流計算大資料
- Smartbi:資料治理系列之後設資料管理平臺的原理
- Windows Live平臺開發資源Windows
- 智慧警務大資料平臺開發,資料視覺化分析平臺搭建大資料視覺化
- 大資料平臺開發公司有哪些?大資料
- 運維平臺的建設思考-後設資料管理運維
- TDS:標籤平臺+API平臺+資料共享平臺,助力資料運營平臺建設API
- 資料倉儲和後設資料
- 使用開源軟體快速搭建資料分析平臺
- 前瞻|Amundsen的資料血緣功能
- 22個大資料開發處理框架平臺和工具大資料框架
- 運維平臺的建設思考-後設資料管理(五)運維
- 運維平臺的建設思考-後設資料管理(三)運維
- 運維平臺的建設思考-後設資料管理(四)運維
- 運維平臺的建設思考-後設資料管理(二)運維
- 大資料平臺最常用的30款開源工具大資料開源工具
- 資料視覺化分析平臺開源方案集錦視覺化
- Tracardi:開源客戶資料整合與分析平臺
- 開源跨平臺資料格式化框架概覽框架
- 全棧全平臺開源專案 CodeRiver 資料庫設計文件全棧資料庫
- 資料整合平臺,多種異構資料來源連結
- 遊戲開發架構中的資料與後設資料遊戲開發架構
- SparkSQL:Parquet資料來源之合併後設資料SparkSQL
- 資料平臺、大資料平臺、資料中臺……還分的清不?大資料
- 微信公眾平臺開發(九) 資料庫操作資料庫
- 關於後臺資料庫設計的考慮(手機平臺)資料庫
- B站大資料開發治理平臺的產品設計心得大資料
- 02.Django後臺和資料庫的設計Django資料庫
- 「免費開源」基於Vue和Quasar的前端SPA專案crudapi零程式碼開發平臺後臺管理系統實戰之後設資料匯出匯入(十五)Vue前端API
- 大資料開發需要學習什麼?大資料平臺是什麼?大資料
- 直接複製資料檔案實現linux平臺資料庫複製到windows平臺資料庫Linux資料庫Windows
- 資料庫平臺資料庫
- superset-資料探勘展現平臺
- 資料治理--後設資料
- 大資料平臺建設經驗大資料
- 分析平臺Tableau推出資料和分析平臺新功能