開源模式下的雲端計算和大資料現狀

技術小能手發表於2018-06-06
開源”模式帶來的好處很多,其中最吸引人的就是可以幫助企業降低成本。另外,開源模式消除了供應商的限制和壁壘,並且可讓技術變得更加協作,合作者會不斷更新開源軟體,使技術得到持續的完善和發展。雲端計算和大資料目前都是熱門話題,兩者的發展與開源技術的結合,及如何在雲上實現大資料專案,都是新的實踐領域。400081521_wx

開源雲端計算現狀

雲端計算髮展到今天,已經成為企業IT基礎設施的主流選擇;以Docker為代表的Container技術,也推動著雲端計算在PaaS層面的發展;而SaaS應用更是方興未艾。雲端計算已經從概念走向實際應用,且將愈加促進資訊化、工業化的整合程式。

敏捷、靈活、可定製,這是各大公司在解釋他們為什麼投資雲端計算時最愛提到的三個詞。與此同時,當今領先的雲供應商雖然心中想著最佳的技術利益,但從財務權益方面來考慮,卻阻止他們提供開放的雲環境。因此,在這個企業IT“雲”化的過程中,開源技術正在成為未來的重要選擇。

開源雲端計算帶來的好處很多,其中最吸引人的就是可以幫助企業降低成本。另外,開源模式消除了供應商的限制和壁壘,並且可讓技術變得更加協作,合作者會不斷更新開源軟體,使該技術得到持續的完善和發展。

有關開源雲端計算的系統、產品與服務正得到不斷地創新推出。以目前擁有最多傳統IT巨頭支援的雲架構開源專案OpenStack為例,在國內外都受到了普遍關注。在OpenStack基金會發布的白皮書中顯示,OpenStack在實際生產環境的部署已得到大幅提升,並且在傳統行業的滲透已經呈現規模化趨勢,在製造業、能源、零售、醫療、交通、保險、媒體等行業長勢喜人。從全球使用者活躍度來看,歐洲和亞洲力量凸顯,中國使用者在其貢獻排行榜上居於前茅。

然而,任何事情都是一把雙刃劍,目前的開源雲也同樣存在著明顯的缺點。比供應商的獨立缺乏支援、開源雲工具的支援問題有待進一步解決。另外,像OpenStack、Docker等時下流行的開源雲端計算應用,都存在著技術成熟度欠缺、缺乏完整性等問題。

開源大資料現狀

移動網際網路、雲端計算等技術的快速水之土日,使全球資料量得到爆炸性增長,大資料時代已經全面到來。從龐雜的資料背後挖掘、分析使用者的行為習慣和喜好,找出更符合使用者“口味”的產品和服務,並結合使用者需求有針對性地調整和優化自身,這就是大資料技術所帶來的巨大價值。

而面對龐大的業務、海量的資料都在不斷的增長,幾乎沒有任何一家傳統的商業方案能夠獨立解決這些業務。企業內部的“合作”已經成為侷限,要想應對這些,需要更多的力量,這無疑給開源模式帶來了新的機遇和挑戰。開源浪潮之所以風生水起,是因為成本低、靈活性強,又有受過培訓的人員,幫助使業更好地挖掘隱藏在大資料當中的價值。

Hadoop無疑是目前大資料領域中最熱的開源技術,它承諾能夠降低成本同時獲得企業級的IT自由度。 Hadoop、R和NoSQL現在是許多企業制定的大資料戰略的三大支柱,無論這些戰略是管理非結構化資料,還是對非結構化資料進行復雜的統計分析。這些開源技術平臺與專有軟體相比的一個優勢就在於,於它們能夠更快速地改進。而且它們也得到許多不同機構的不斷開發和完善。Hadoop已經變得無處不在,EMC、戴爾、IBM、甚至微軟都已經開始躋身Hadoop陣營。

大資料領域的另一位生力軍Spark現在也是名聲大噪,作為通用的並行處理框架,Spark具有類似Hadoop的一些優點,而且Spak在迭代計算上具有比Hadoop更高的效率,還提供了更為廣泛的資料集操作型別的開發等等。眾多優越的效能和比Hadoop更廣泛的適用面讓Spark的進一步發展值得期待。

結語

綜上所述,開源模式確實為企部和開發者署雲環境創造了條件,推動了雲技術的發展。但是,站在使用者的角度看,特別是不具備軟體開發、運維能力的傳統企業,大規模採用開源雲專案仍然存在一定的風險。另外,開源的開放所帶來的一大弊端就是安全問題。也正是出於對這種風險的考慮,目前有很多大資料專案都沒有放在雲環境中執行。

但是,不管怎樣,雲端計算與大資料在應用中產生的價值是有目共睹的,兩者之間的結合,遠比相互分離要好得多。而在選擇雲端計算及大資料的平臺時,企業一定要結合自己的實際情況和需求來選擇適合自己的雲端計算平臺,避免單純為了開源、為了雲而做出盲目的選擇。當然從長遠考慮,與開源想法搭起橋樑要比試圖對開源想法視若無明智得多。

原文釋出時間為:2018-06-6

本文來自雲棲社群合作伙伴“企業網D1Net”,瞭解相關資訊可以關注“企業網D1Net”。


相關文章