漫談 Greenplum 開源背後的動機
這幾天最大的訊息莫過於greenplum的開源,年初開始pivotal就宣佈了greenplum的開源,經過大半年的翹首等待,終於在十月底在歐洲的Postgres大會宣佈開源,並兌現在github上開放程式碼,社群的官網為 http://greenplum.org/ , 其官方部落格也有提到相關事項。
程式碼是採用apache許可,今天已經有社群的朋友嚐鮮從社群取下程式碼,在greenplum上測試了tpch的效能,雖然測試比較粗糙但是結果基本和商業版的一樣,印證了之前greenplum將走向全開源的訊息。雖然裡面關鍵的新一代優化器orca還沒有看到程式碼,但據訊息這部分後續也會開出來,估計這個是其對這個最核心資產的一個謹慎的操作。
總體的印象來看,其採取開放的apache許可,程式碼基本上無保留開源,這次的開源更大程度是公司層面的戰略行為,而不是簡單的市場推廣的戰術行為。
greenplum的開源,在我看來有幾個驅動力。
首先,是受其cloud foundry開源戰略成功的驅動
pivotal在整個emc聯邦的定位來說是偏中介軟體這一層,emc是儲存,vmware是虛擬化,pivotal要搞定的是PaaS。而pivotal的業務上來說,要把雲和大資料這兩個支柱搞定,才能把emc聯邦的疆域穩定下來。雲這一層來說vmware已經是私有云的霸主,而剩下的上層PaaS這一層如果落入他人之手對其來說也是一個大威脅,所以PaaS這一層也是志在必得。
鑑於當時已經在市場有很多對手,2011年的時候cloudfoundry啟動是以開源的模式來去做,把IBM和HP拉上。這個戰略取得了出人意料的巨大成功,現在CF幾乎要變成了PaaS的事實標準,IBM也推出了基於CF的bluemix產品,而pivotal在今年釋出的2014年的財報,極為惹眼的標題:破紀錄的2014年,史上最快的開源產品銷售增長。在短短的一年裡,就獲得4千萬美金的軟體銷售收入,另外也獲得了財富500強中的100個客戶!這對於基礎軟體來說,基本是神話。
說了這麼多,無外乎就是給大家強調一下,整個pivotal在cloudfoudry的巨大成功下,對於開源的認識已經到了商業戰略的層次,已經不需要去討論要不要開源,開源已經成為殺手級的武器!在此背景下我們來去理解greenplum的開源才更容易理解。
其次,Pivotal的大資料戰場,需要新的戰略調整
上面提到,除了雲以外,Pivotal的戰略重心是大資料,Pivotal除了有自己的hadoop發行版以外還有greenplum作為大資料最重要的資產。
但是大資料整個市場都不是太理想,Hadoop發行版除了有Cloudera,Hortonworks,MapR這三個第三方發行版以外,還有Pivotal,IBM,Intel這些廠商本身的發行版,市場最突出的問題是碎片化,Hadoop的門檻低,廠商林立,同質化嚴重,不僅僅難以溢價出售,傳統大廠商靠溢價銷售基礎軟體獲取超額利益的路子開始行不通;更為重要的是越來越多的客戶傾向於使用第三方獨立的發行版。
道理不難理解,使用者更希望的是Linux生態裡面有Redhat和SuSe這樣的發行廠商,而不希望類似AIX或者是Windows Server這種由廠商控制的生態,這個更加加劇了廠商面臨的困境。
Intel由於其發行版的糟糕市場表現,開始陸續解散自己的Hadoop團隊,國內的星環就是在這個背景下誕生,2014年Intel重金投資Cloudera 7.4億美金取得18%的股權,Dell也投入Cloudera的陣營,HP、微軟、Teradata則傾向於直接使用Hortonworks的發行版,HP還投資了Hortonworks。但是Cloudera的優勢明顯,營收是Hortonworks的將近一倍,Cloudera儼然有成為Hadoop生態的新的霸主的陣勢,市場格局開始慢慢固化,Intel有可能是這場戰役的贏家。
在這樣的市場格局裡面,Pivotal的困境可想而知,HD的發行版肯定需要重新調整策略,所以Pivotal聯合IBM、GE等15個弱勢玩家, 在今年3月宣告成立ODP(Open Data Platform)組織,本質上是希望通過支援Hortonworks抗衡Cloudera,取得平衡。但是這個賭注的勝算並不明顯,Cloudera的CEO甚至公開嘲諷ODP,說其出現本身就是Cloudera的一個勝利,Greenplum的開源正是作為ODP的砝碼而出現,Pivotal決定把HD發行版、Gemfire、HAWQ還有Greenplum開源,所以從這個角度我們看到,Greenplum的開源本身,就是Pivotal希望贏回這場戰役的一個砝碼,對其而言,越多人用越好,沒有必要隱藏任何功能。
其實在Greenplum開源之前,MPP資料庫的日子也並不好過,也是市場碎片化,每個廠家也就區區幾千萬美金的營收,市場難以有大的突破,傳統豐厚的DW市場也難以打入,Hadoop生態又是以開源為主,甚至很多類似Impala這樣的產品也在做其類似的功能,傳統的打不開,新市場又難以全面 開啟,而且競爭重重,進退兩難。而Greenplum十多年來的架構也無力進行大的調整。正是在這樣的背景下,倒不如開源,盤活大局。下面這篇文章稱其舉動為“open sourcing code is the modern graceful way to retire an unprofitable product line”。
Greenplum的開源應該是相對比較激進和帶有攻擊性一著棋,成敗難料,但對於整個生態會有比較大的影響,明天的文章裡我再給大家分享一下我對於其影響的看法。
相關文章
- 獨家對話RadonDB設計者 暢談開源背後的初心
- Netty背後的事件驅動機制Netty事件
- Spring Cloud Alibaba 開源背後的故事 | 開源中國專訪SpringCloud
- 隨機數漫談隨機
- 開源筆記軟體 Joplin 背後的故事筆記
- 淺談《動物森友會》背後的設計理念
- 開源網格VPN meshboi及其背後原理
- 漫談計算機架構計算機架構
- 漫談計算機編碼計算機
- 漫談Steampunk:蒸汽動力與復古機械之美
- 談一談支付寶收取提現費背後的真正原因
- 《漫野奇譚》大火的背後:淺談程式化敘事生成和戰棋遊戲設計遊戲設計
- 資料驅動背後的“陷阱”
- UIAppearance漫談UIAPP
- Flink漫談
- 95 後新生代 Committer 賀張儉:談談年輕人的開源觀MIT
- Google AR 互動的開源與幕後Go
- 如何挖掘熱點背後的商機
- 淺談滴滴需求響應式公交背後的技術
- 淺談美顏演算法:美顏SDK的“背後”演算法
- SAP UI 和 Salesforce UI 開發漫談UISalesforce
- 開源夜聊欄目開播:聊聊新晉 CNCF 專案 sealer 背後的故事
- 所有權背後的資料互動
- 016 | 漫談區塊鏈共識機制區塊鏈
- 浪潮資訊工程師:談一談裝置透傳虛擬機器啟動慢背後的原因及其最佳化方法 | 第 51 期工程師虛擬機
- 大資料小視角2:ORCFile與Parquet,開源圈背後的生意大資料
- 漫談逆向工程
- 漫談全景分割
- 誰來背鍋?自動駕駛車禍背後的故事自動駕駛
- mpp 資料庫greenplum官方商業版本與開源版本的差異資料庫
- 漫談2020年國產單機:不可避免的陣痛期 前路依然漫長
- 新特性:postgresql的vacuum漫談SQL
- 漫談Hadoop的思想之源:GoogleHadoopGo
- MySQL 索引機制背後的隱藏之道MySql索引
- 遊戲與教育:談討遊戲背後的教育價值遊戲
- 開源OLAP引擎測評報告(SparkSql、Presto、Impala、HAWQ、ClickHouse、GreenPlum)SparkSQLREST
- 即將開源 | 2億使用者背後的Flutter應用框架Fish ReduxFlutter框架Redux
- Vercel 與 Next.js:開源全明星團隊背後的商業邏輯JS
- 朋友圈那串神秘字元背後的開源專案「GitHub 熱點速覽」字元Github