2014年值得關注的十個Hadoop大資料創業公司

ctocio發表於2014-04-24

  開源大資料框架Apache Hadoop已經成了大資料處理的事實標準,同時也幾乎成了大資料的代名詞,雖然這多少有些以偏概全。

  根據Gartner的估計,目前的Hadoop生態系統市場規模在7700萬美元左右,2016年,該市場規模將快速增長至8.13億美元。

  但是在Hadoop這個快速擴增的藍海中游泳並非易事,不僅開發大資料基礎設施技術產品這件事很難,銷售起來也很難,具體到大資料基礎設施工具如Hadoop、NoSQL資料庫和流處理系統則更是難上加難。客戶需要大量培訓和教育,付費使用者需要大量支援和及時跟進的產品開發工作。而跟企業級客戶打交道往往並非創業公司團隊的強項。此外,大資料基礎設施技術創業通常對風險投資規模也有較高要求。

  儘管困難重重,Hadoop創業公司依然如雨後春筍冒出,除了Cloudera、Datameer、DataStax和MapR等已經功成名就的Hadoop創業公司外,最近CIO雜誌評出了2014年十大最值得關注的Hadoop創業公司,瞭解這些公司的產品和商業模式對企業大資料技術創業者和大資料應用使用者來說都非常有參考價值:

  一、Platfora

platfora

  業務:所提供的大資料分析解決方案能夠將Hadoop中的原始資料轉換成可互動的,基於記憶體計算的商業智慧服務。

  簡介:創立於2011年,迄今已募集6500萬美元。

  入選理由:Platfora的目標是簡化複雜難用的Hadoop,推動Hadoop在企業市場的應用。Platfora的做法是簡化資料採集和分析流程,將Hadoop中的原始資料自動轉化成可以互動的商業智慧服務,無需ETL或者資料倉儲。(參考閱讀:Hadoop只是窮人的ETL)

  二、Alpine Data Labs

alpine data

  業務:提供基於Hadoop的資料分析平臺

  簡介:創立於2010年,迄今累計融資2350萬美元。

  入選理由:複雜的高階分析和機器學習應用通常都需要指令碼和程式碼開發高手實現,這進一步推高了資料科學家的技術門檻。實際上大資料企業高管和IT經理都沒時間也沒興致學習程式設計技術,或者去了解複雜的Hadoop。Alpine Data通過SaaS服務的方式大幅降低了預測分析的應用門檻。

  三、Altiscale

altiscale

  業務:提供Hadoop即服務(HaaS)

  簡介:創立於2012年3月,迄今融資1200萬美元。

  入選理由:大資料正在鬧人才荒,而通過雲端計算提供Hadoop相關服務無疑是普及Hadoo的一條捷徑,根據TechNavio的估計,2016年HaaS市場規模將高達190億美元,是塊大蛋糕。但是HaaS市場的競爭已經日趨激烈,包括亞馬遜EMR、微軟的Hadoop on Azure,以及Rackspace的Hortonworks雲服務等都是重量級玩家,Altiscale還需要與Hortonworks、Cloudera、Mortar Data、Qubole、Xpleny展開直接競爭。

  四、Trifacta

trifacta

  業務:提供平臺幫助使用者將複雜的原始資料轉化成乾淨的結構化格式供分析使用。

  簡介:創立於2012年,迄今融資1630萬美元。

  入選理由:大資料技術平臺和分析工具之間存在一個巨大的瓶頸,那就是資料分析專家需要花費大量精力和時間轉化資料,而且業務資料分析師們往往也並不具備獨立完成資料轉化工作的技術能力。為了解決這個問題Trifacta開發出了“預測互動”技術,將資料操作視覺化,而且Trifacta的機器學習演算法還能同時觀察使用者和資料屬性,預測使用者意圖,並自動給出建議。Trifata的競爭對手是Paxata、Informatica和CirroHow。

  五、Splice Machine

splice machine

  業務:提供面向大資料應用的,基於Hadoop的SQL相容資料庫。

  簡介:創立於2012年,迄今融資1900萬美元。

  入選理由:新的資料技術使得傳統關係型資料庫的一些流行功能如ACID合規、交易一致性和標準的SQL查詢語言等得以在廉價可擴充套件的Hadoop上延續。Splice Machine保留了NoSQL資料庫所有的優點,例如auto-sharding,容錯、可擴充套件性等,同時又保留了SQL。

  六、DataTorrent

datarorrent

  業務:提供基於Hadoop平臺的實時流處理平臺

  簡介:創立於2012年,2013年6月獲得800萬美元A輪融資。

  入選理由:大資料的未來是快資料,而DataTorrent正是要解決快資料的問題。

  七、Qubole

qubole

  業務:提供大資料DaaS服務,基於“真正的自動擴充套件Hadoop叢集”。

  簡介:創立於2011年,累計融資700萬美元。

  入選理由:大資料人才一將難求,對於大多數企業來說,像使用SaaS企業應用一樣使用Hadoop是一個現實的選擇。

  八、Continuuity 

continuuity

  業務:提供基於Hadoop的大資料應用託管平臺

  簡介:創立於2011年,累計獲得1250萬美元融資,創始人兼CEO Todd Papaioannou曾是雅虎副總裁雲架構負責人,去年夏天Todd離開Continuuity後,聯合創始人CTO Jonathan Gray接替擔任CEO一職。

  入選理由:Continuuity的商業模式非常聰明也非常獨特,他們繞過非常難纏的Hadoop專家,直接向Java開發者提供應用開發平臺,其旗艦產品Reactor是一個基於Hadoop的Java整合化資料和應用框架,Continuuity將底層基礎設施進行抽象處理,通過簡單的Java和REST API提供底層基礎設施服務,為使用者大大簡化了Hadoop基礎設施的複雜性。Continuuity最新發布的服務——Loom是一個叢集管理方案,通過Loom建立的叢集可以使用任意硬體和軟體堆疊的模板,從單一的LAMP伺服器和傳統應用伺服器如JBoss到包含數千個節點的大規模的Hadoop叢集。叢集還可以部署在多個雲服務商的環境中(例如Rackspace、Joyent、Openstack等)而且還能使用常見的SCM工具。

  九、Xplenty

xplenty

  業務:提供HaaS服務

  簡介:創立於2012年,從Magma風險投資獲得金額不詳的融資。

  入選理由:雖然Hadoop已經成了大資料的事實工業標準,但是Hadoop的開發、部署和維護對技術人員的技能依然有著極高要求。Xplenty的技術通過無需編寫程式碼的Hadoop開發環境提供Hadoop處理服務,企業無需投資軟硬體和專業人才就能快速享受大資料技術。

  十、Nuevora

nuevora

  業務:提供大資料分析應用

  簡介:創立於2011年,累計獲得300萬早期投資。

  入選理由:Nuevora的著眼點是大資料應用最早啟動的兩個領域:營銷和客戶接觸。Nuevora的nBAAP(大資料分析與應用)平臺的主要功能包括基於最佳時間預測演算法的定製分析應用,nBAAP基於三個關鍵大資料技術:Hadoop(大資料處理)、R(預測分析)和Tableau(資料視覺化)

相關文章