Metacat:讓Netflix的大資料變得可發現且有意義
Netflix 撰寫了有關 Metacat 的文章,這是一個充當所有資料儲存的聯合後設資料訪問層的系統。各種計算引擎的集中式服務可以用來訪問不同的資料集。Metacat 採用了一種有趣的架構模式,其中各個後設資料儲存仍然是模式後設資料的真實來源,而 Metacat 並未在其儲存中實現它。
大多數大公司都有大量資料來源,資料格式不同,資料量大。整個企業中的許多人都可以訪問和分析這些資料儲存。在 Netflix,我們的資料倉儲由儲存在 Amazon S3(透過 Hive)、Druid、Elasticsearch、Redshift、Snowflake 和 MySql 中的大量資料集組成。我們的平臺支援 Spark、Presto、Pig 和 Hive 來消費、處理和生成資料集。鑑於資料來源的多樣性,並確保我們的資料平臺可以作為一個“單一”資料倉儲跨這些資料集進行互操作,我們構建了 Metacat。在這篇部落格中,我們將討論我們構建 Metacat 的動機,Metacat 是一種使資料易於發現、處理和管理的後設資料服務。
詳細點選標題
相關文章
- 重磅!Netflix開源大資料發現服務框架Metacat大資料框架
- 如何讓資料清洗工作變得簡單
- 騰訊大資料智慧營銷平臺讓“尋 TA ”變得更容易大資料
- CIO新任務:讓大資料變得像電影一樣視覺化大資料視覺化
- WPF自定義Panel:讓拖拽變得更簡單
- 讓 Birt 報表指令碼資料來源變得既簡單又強大指令碼
- 如何讓開發變得敏捷起來?敏捷
- API開發 – 讓異常變得優雅API
- java如何讓程式碼變得優雅——自定義註解Java
- 讓資料視覺化變得簡單 – JavaScript 圖形庫視覺化JavaScript
- 有意為之?WannaCry變種可傳播加密加密
- 框架讓開發人員變得愚鈍嗎?框架
- 是什麼讓ChatGPT變得如此聰明?仍然未知的大語言模型“能力湧現”現象ChatGPT模型
- 掌握這些技巧,讓Excel批次資料清洗變得簡單高效!Excel
- 是什麼讓資料分析師變得優秀?- Cassie Kozyrkov
- 如何讓你的大檔案上傳變得又穩又快?
- 吳恩達:四個步驟,讓大模型變得更好吳恩達大模型
- SOM:研究發現導航 App 在讓城市交通變得更擁堵APP
- 如何讓python變得更快?Python
- 從RPA獲得資本市場認可,看AI大資料投資AI大資料
- LEARUN快速開發平臺,讓開發變得更簡單
- “大資料自動挖掘”才是現在這些大資料的真正意義大資料
- ·賈伯斯給IT行業帶來十大變革:讓科技變得更酷行業
- Nir Eyal:健身應用大部分都沒用 並且讓我們變得更胖
- 新數科技:讓雲時代企業資料庫轉型變得簡單資料庫
- 語義分析發現:靈玖大資料檢索與分詞大資料分詞
- SVG-讓世界變得柔軟SVG
- 讓你工作變得更加有趣
- Google Chrome被發現零日漏洞 可讓黑客獲取使用者資料GoChrome黑客
- DataGrip 2023:讓資料庫開發變得更簡單、更高效 mac/win啟用版資料庫Mac
- 在 phpunit 的資料提供者中使用 yield 讓變數更具可讀性PHP變數
- Minitab 2021:讓資料分析變得更簡單,更直觀 win版
- SmartRules讓MindManager的互動圖變得更加智慧
- Lombok讓Java再次變得酷酷的 - Grubhub BytesLombokJava
- 讓iOS開發變得更有效率-分類、工具類iOS
- 程式碼的壞味道:可變的資料
- 7個步驟:讓JavaScript變得更好JavaScript
- 讓雲端計算變得順理成章