擁抱開源DevOps引領大資料生態系統
為了開展開源戰略,基於大資料生態系統元件的應用程式必須加強,才能在生產中執行。 DevOps可能是其中的重要組成部分。
使用者一直希望減少對供應商的依賴。但是,當他們瞭解當今大資料生態系統的複雜環境時,他們至少在某種程度上將承擔一定的責任。
新風格的資料工程要求對DevOps進行整體的調整,這就是敏捷性方法的擴充套件,需要開發人員對創新應用在生產中的表現承擔更多的責任。同時,工程師需要以更快的速度學習新的軟體。
許多早期採用者不得不建立基於MapReduce的Hadoop應用程式,只能使用Spark處理引擎重新啟動它們。
如今有各種開源產品用於分析,包括Hadoop SQL查詢工具、機器學習和其他功能。開源資料流媒體空間就有一些例子,隨著一系列新的實時系統不斷進行批處理,這些資料流空間正在不斷髮展。
在流媒體中,分析工具層出不窮。先是早期的競爭者Apache Storm,接著又出現Apache Spark和Apache Flink,而且這一切都發生在短短的幾年之內。
Hadoop聯合創始人、Cloudera首席架構師Doug Cutting表示,這是現代資料工程的本質,今天人們必須做好試用軟體元件的準備。
事實上,很難找到與多個流媒體架構合作的商店,而且其中涉及到很多在職學習。隨著Spark通過最近宣佈的Drizzle外掛在時間流式中新增記錄,就需要更多的學習。
資料工程師正在研究元件如何以不同的組合形式工作,這個過程是從概念驗證轉向生產的重要環節。終端使用者和供應商都屬於這個環節的一部分。
搞清楚你想要什麼
回想一下:當供應商們作為唯一創新來源的日子裡,使用者往往處於被動地位。供應商仍然可能在大資料應用實施方面發揮很大的作用,但被動的使用者就要承受更大的風險。
事實上,產品釋出時間中至少有一些滯後時間與準備軟體的供應商有關。開源大資料應用程式從概念驗證到生產投入的艱難過程並非巧合。
但是,隨著資料商店開始對新的開源應用程式進行變革,需要大量的創新。
為了繼續推進大資料工程,團隊需要非常認真地追求DevOps的信條,或者稱之為DataOps,尤其是要求資料工程師和IT架構師負責將創新思想運用到生產過程中。
本文轉自d1net(轉載)
相關文章
- 擁抱開源,共建生態 - 開源生態與效能提升專場 | CIF 精彩看點
- 微軟開始擁抱開源社群 exFAT檔案系統向Linux開源微軟Linux
- 擁抱資料共享與程式碼開源的新時代
- 擁抱開源,從中受益
- 2024 開源資料工程生態系統全景圖
- 朱豪民:“消費者生態系統”引領IT新航向
- Windows未來可以擁抱開源嗎?Windows
- 開源大資料檔案系統大資料
- [Windows] Windows 10 開啟 WSL 擁抱Linux系統WindowsLinux
- 韓國討論到2020年擁抱開源作業系統作業系統
- 解讀微軟開源MMLSpark:統一的大規模機器學習生態系統微軟Spark機器學習
- 大資料儲存領導廠商創新科加入,攜手龍蜥社群共建開源生態大資料
- 開源大資料生態下的 Flink 應用實踐大資料
- 大資料與 AI 生態中的開源技術總結大資料AI
- 擁抱開源,浪潮將OpenStack之路踐行到底!
- 耐克是如何擁抱網際網路和大資料的?大資料
- 中關村開源生態論壇盛大開幕,有道榮獲“大模型生態領軍企業”稱號中關村大模型
- Linux基金會回應微軟擁抱開源Linux微軟
- 擁抱開源更省錢「GitHub 熱點速覽」Github
- 大資料擁抱雲原生 HashData助力資管數字化轉型大資料
- 擁抱信創 期許未來|綠盟科技融入信創產業生態產業
- Llama 3.2 Vision & Molmo:多模態開源生態系統基礎
- Hadoop高階資料分析 使用Hadoop生態系統設計和構建大資料系統Hadoop大資料
- 改變數字分析生態系統的10個大資料公司變數大資料
- 華中游戲圈全面擁抱鴻蒙生態,58家廠商共聚鴻蒙生態遊戲行業論壇鴻蒙遊戲行業
- 開源共建 | TIS整合資料同步工具ChunJun,攜手完善開源生態
- 擁抱 NamedParameterJdbcTemplateJDBC
- Go 大資料生態開源專案 CDS 中 ClickHouse 使用的建表方案Go大資料
- 汪源做客阿里雲大咖說,論道資料庫開源與儲存生態阿里資料庫
- 擁抱資料未來 希捷與開放計算共成長希捷
- 國產資料庫的開源生態之路 | 直播預告資料庫
- 視開源為癌症 微軟擁抱癌症是找死還是自殺?微軟
- 微軟擁抱開源的步伐又邁進了一步微軟
- 【線上沙龍】金融行業開源治理最佳實踐~讓我們擁抱開源吧行業
- 華為openGauss正式開源,國產資料庫開源生態逐漸走強資料庫
- 大資料分析系統Hadoop的13個開源工具!大資料Hadoop開源工具
- 大資料分析系統Hadoop的13個開源工具大資料Hadoop開源工具
- 大咖說|網易數帆論道 PolarDB 資料庫開源 & 儲存生態資料庫