漫談 Greenplum 開源背後的動機

李元佳發表於2015-10-30

這幾天最大的訊息莫過於greenplum的開源,年初開始pivotal就宣佈了greenplum的開源,經過大半年的翹首等待,終於在十月底在歐洲的Postgres大會宣佈開源,並兌現在github開放程式碼,社群的官網為 http://greenplum.org/ , 其官方部落格也有提到相關事項

程式碼是採用apache許可,今天已經有社群的朋友嚐鮮從社群取下程式碼,在greenplum上測試了tpch的效能,雖然測試比較粗糙但是結果基本和商業版的一樣,印證了之前greenplum將走向全開源的訊息。雖然裡面關鍵的新一代優化器orca還沒有看到程式碼,但據訊息這部分後續也會開出來,估計這個是其對這個最核心資產的一個謹慎的操作。 

總體的印象來看,其採取開放的apache許可,程式碼基本上無保留開源,這次的開源更大程度是公司層面的戰略行為,而不是簡單的市場推廣的戰術行為。

greenplum的開源,在我看來有幾個驅動力。

首先,是受其cloud foundry開源戰略成功的驅動

pivotal在整個emc聯邦的定位來說是偏中介軟體這一層,emc是儲存,vmware是虛擬化,pivotal要搞定的是PaaS。而pivotal的業務上來說,要把雲和大資料這兩個支柱搞定,才能把emc聯邦的疆域穩定下來。雲這一層來說vmware已經是私有云的霸主,而剩下的上層PaaS這一層如果落入他人之手對其來說也是一個大威脅,所以PaaS這一層也是志在必得。

鑑於當時已經在市場有很多對手,2011年的時候cloudfoundry啟動是以開源的模式來去做,把IBMHP拉上。這個戰略取得了出人意料的巨大成功,現在CF幾乎要變成了PaaS的事實標準,IBM也推出了基於CFbluemix產品,而pivotal在今年釋出的2014年的財報,極為惹眼的標題:破紀錄的2014年,史上最快的開源產品銷售增長。在短短的一年裡,就獲得4千萬美金的軟體銷售收入,另外也獲得了財富500強中的100個客戶!這對於基礎軟體來說,基本是神話。

說了這麼多,無外乎就是給大家強調一下,整個pivotalcloudfoudry的巨大成功下,對於開源的認識已經到了商業戰略的層次,已經不需要去討論要不要開源,開源已經成為殺手級的武器!在此背景下我們來去理解greenplum的開源才更容易理解。

其次,Pivotal的大資料戰場,需要新的戰略調整

上面提到,除了雲以外,Pivotal的戰略重心是大資料,Pivotal除了有自己的hadoop發行版以外還有greenplum作為大資料最重要的資產。

但是大資料整個市場都不是太理想,Hadoop發行版除了有ClouderaHortonworksMapR這三個第三方發行版以外,還有PivotalIBMIntel這些廠商本身的發行版,市場最突出的問題是碎片化fragmentedHadoop的門檻低,廠商林立,同質化嚴重,不僅僅難以溢價出售,傳統大廠商靠溢價銷售基礎軟體獲取超額利益的路子開始行不通;更為重要的是越來越多的客戶傾向於使用第三方獨立的發行版。

道理不難理解,使用者更希望的是Linux生態裡面有RedhatSuSe這樣的發行廠商,而不希望類似AIX或者是Windows Server這種由廠商控制的生態,這個更加加劇了廠商面臨的困境。

Intel由於其發行版的糟糕市場表現,開始陸續解散自己的Hadoop團隊,國內的星環就是在這個背景下誕生,2014Intel重金投資Cloudera 7.4億美金取得18%的股權,Dell也投入Cloudera的陣營,HP、微軟、Teradata則傾向於直接使用Hortonworks的發行版,HP還投資了Hortonworks。但是Cloudera的優勢明顯,營收是Hortonworks的將近一倍,Cloudera儼然有成為Hadoop生態的新的霸主的陣勢,市場格局開始慢慢固化,Intel有可能是這場戰役的贏家。

在這樣的市場格局裡面,Pivotal的困境可想而知,HD的發行版肯定需要重新調整策略,所以Pivotal聯合IBMGE15個弱勢玩家, 在今年3月宣告成立ODPOpen Data Platform)組織,本質上是希望通過支援Hortonworks抗衡Cloudera,取得平衡。但是這個賭注的勝算並不明顯,ClouderaCEO甚至公開嘲諷ODP,說其出現本身就是Cloudera的一個勝利Greenplum的開源正是作為ODP的砝碼而出現,Pivotal決定把HD發行版、GemfireHAWQ還有Greenplum開源,所以從這個角度我們看到,Greenplum的開源本身,就是Pivotal希望贏回這場戰役的一個砝碼,對其而言,越多人用越好,沒有必要隱藏任何功能。

其實在Greenplum開源之前,MPP資料庫的日子也並不好過,也是市場碎片化,每個廠家也就區區幾千萬美金的營收,市場難以有大的突破,傳統豐厚的DW市場也難以打入,Hadoop生態又是以開源為主,甚至很多類似Impala這樣的產品也在做其類似的功能,傳統的打不開,新市場又難以全面 開啟,而且競爭重重,進退兩難。而Greenplum十多年來的架構也無力進行大的調整。正是在這樣的背景下,倒不如開源,盤活大局。下面這篇文章稱其舉動為“open sourcing code is the modern graceful way to retire an unprofitable product line”。

Greenplum的開源應該是相對比較激進和帶有攻擊性aggressive一著棋,成敗難料,但對於整個生態會有比較大的影響,明天的文章裡我再給大家分享一下我對於其影響的看法。

相關文章