全球的資料正在以幾何數字增長,藉助這股資料浪潮在全球範圍內迅速成長起來一大批Hadoop的初創型公司。作為Apache的一個開源分支Hadoop幾乎已經成為了大資料的代言詞。據Gartner估計,目前的Hadoop生態系統市場價值大約為77,000,000; 該研究公司預計,這一數字到2016年將迅速增加到8.13億美元。

在Hadoop市場快速發展的大環境下,出現了大量的初創型企業來分這將近十億美元的大餡餅。

超人氣Hadoop初創公司前兩名

1、Platfora

 

\
 

他們做什麼:Platfora主要為企業提供相關的大資料解決方案,並且將Hadoop的袁術資料進行轉換,為企業提供更智慧的商業指導。

總部:加州San Mateo。

負責人:本·維特,誰曾在DataStax出任產品副總裁。

成立時間: 2011

資金實力: 6500萬美元。最新一輪由TENAYA資本主導的融資38000000美元。並且花旗風險投資公司,思科,Allegis資本,安德森霍洛維茨,Battery Ventures公司,薩特山風險投資公司等多家知名風投參與了本輪融資。

上榜原因:Platfora成立的目的在於簡化Hadoop。雖然企業採用了Hadoop作為大資料的解決方案,但並不能快速從這些資料中獲取價值。Platfora的解決方案在Hadoop上做了一個殼,讓企業資料分析師可以更好的利用組織資料與相關結果。

關鍵客戶包括:康卡斯特,迪斯尼,Edmunds.com和華盛頓郵報。

競爭格局: Platfora競爭對手Datameer,IBM,SAP,SAS,高山資料等。

不同之處:Platfora聲稱擁有了第一個基於Hadoop的可向外擴充套件的記憶體大資料分析平臺,Platfora的重點在於簡化Hadoop與大資料分析之間的複雜過程,讓資料更清晰更快速的展現在需要它的人面前。

2、Alpine Data Labs

 

\
 

他們所做的事情:提供一個基於Hadoop的資料分析平臺。

公司總部:加利福尼亞州舊金山

執行總裁:喬奧托,銷售和服務於Greenplum的原高階副總裁。

成立時間: 2010

資金實力:350萬美元的資金總額,包括16美元的B系列融資,從Sierra Ventures公司,風險投資公司的使命,UMC資本和羅伯特·博世風險投資。

上榜原因:多數高管和經理沒有時間或技能程式碼,以便蒐集資料的見解,也沒有時間去學習複雜的新的基礎設施像Hadoop。相反,他們希望看到大畫面。麻煩的是,複雜的高階分析和機器學習通常需要編寫指令碼和編碼的專業知識,這可以限制對資料的訪問科學家。通過使預測分析通過SaaS訪問的高山資料緩解這個問題。

Alpine Data Labs據提供了一個視覺化的拖放和拖放的方式,允許資料分析員(或任何指定的使用者)在整個組織與大型資料集工作,制定和完善模型,並在大規模協作,而無需程式碼。資料是在現場環境分析,不遷移或取樣,通過一個Web應用程式,可以在本地託管。

Alpine Data Labs利用Hadoop和MPP資料庫的並行處理能力和實現了MapReduce和SQL資料探勘演算法。使用者使用其資料互動,直接在那裡已經坐。然後,他們可以設計分析工作流程,而不必擔心資料移動。所有這一切都是在Web瀏覽器中完成,和阿爾卑斯資料然後轉換這些視覺化的工作流為在資料庫或MapReduce的任務序列。

主要客戶包括:索尼,哈瓦斯媒體,斯卡拉,簽證,Xactly公司,全國廣播公司,停住,黑莓,和摩根士丹利。

競爭格局:高山將爭奪兩個大型老牌(SAS,IBM,SPSS,以及SAP),而該初創公司如Nuevora,Platfora,晴空塔,革命Analytics(分析),和快速我。

關鍵的區別:Alpine Data Labs認為,大多數競爭方案要麼是基於桌面或沒有任何協作能力的單點解決方案。相比之下,Alpine Data Labs提供了一個“的SharePoint樣”的感覺。在協作和搜尋外,還提供了在同一屋簷下的建模和機器學習。高山也是無資料移動陣營的一部分。無論如何,如果一個公司的資料是在Hadoop的或MPP資料庫,高山發出指令,通過其在群集分析,而沒有移動資料。

提供Hadoop平臺與服務的企業

3、Altiscale

 

\
 

主營業務:提供的Hadoop作為一種服務(HAAS)。

總部:帕洛阿爾託,加利福尼亞州

執行總裁: Raymie Stata的,誰曾雅虎技術長。

成立時間: 2012年3月

資金實力: Altiscale由1200萬美元從通用催化劑和紅杉資本首輪投資的支援,已經來自個人的資助者。

上榜原因:Altiscale的服務的目的是Hadoop的抽象的複雜性。Altiscale的服務主要目的是解決Hadoop的抽象性與複雜性,為工程師搭建一個完整的Hadoop環境,並且對其進行維護與管理。讓使用者可以更專注於他們的資料與應用。當客戶的需求發生變化的時候,Altiscale也會做出相應的調整與變化。

主要客戶:MarketShare公司。

主要競爭對手:微軟Azure、Qubole與Xpleny等。

關鍵業務區別: Altiscale認為自己是“唯一一家真正提供了一個完整的Hadoop生產環境的方案服務商。

4、Trifacta

 

\
 

主營業務:為企業提供整體服務平臺,將原始資料進行轉換與整理,將結構化資料進行分析處理。

公司總部:加利福尼亞州舊金山

執行總裁:喬Hellerstein,誰在除了作為Trifacta的CEO也是電腦科學的教授在伯克利。

成立時間: 2012

資金來源: Trifacta由16300000美元的註冊資金,由Accel Partners公司,XSEED資本,集體的資料,Greylock合夥和個人投資者前後兩輪的資金支援。

上榜原因: Trifacta有一個在資料鏈技術平臺。為企業解決大資料與分析工具之間的瓶頸問題,為業務分析師節省大量的時間與精力。

為了解決這個問題,Trifacta使用“預測互動”技術,以提升資料處理成視覺體驗,使使用者能夠快速,輕鬆地識別感興趣或關注的功能。分析師強調視覺特徵,Trifacta的預測演算法同時觀察使用者行為和資料的性質來預測使用者的意圖,並提出建議,而不需要使用者的規範。因此,資料轉換的繁瑣的任務就變成一個輕量級的體驗,更為靈活,效率比傳統方法。

主要客戶:洛克希德·馬丁公司、強生集團。

競爭格局: Trifacta將與Paxata,Informatica和CirroHow競爭。

關鍵的區別: Trifacta認為,資料轉換的問題,需要一個全新的互動模式-一個用機器智慧,夫妻人類的商業洞察力。Trifacta的平臺結合了智慧推理與“預測互動”技術視覺互動,收人與資料之間的差距。

秒級別的大資料處理速度

5、Splice Machine

 

\
 

他們所做的事情:為客戶提供基於Hadoop的相容性資料庫設計方案。

公司總部:加利福尼亞州舊金山

負責人:Monte Zweben,誰以前曾在美國航空航天局艾姆斯研究中心,在那裡他擔任人工智慧科副主任。後來,他創辦並擔任藍尼軟體公司執行長。

成立時間: 2012

資金:他們是由1900萬美元的主語合作伙伴和莫爾多風險投資公司的資金支援。

上榜原因:企業的應用程式與Web開發人員一直遠離傳統的關係型資料庫,由於快速發展的資料量以及不斷變化的資料型別,需要更加靈活的解決方案來解決架構的問題。

現在,隨著新興的資料庫解決方案,功能,使得RDBMS如此受歡迎了這麼久,如ACID相容,事務完整性,以及標準的SQL,可在成本效益和可擴充套件的Hadoop平臺之上。熔接機認為,這使開發人員能夠得到最好的兩個世界在一個通用的資料庫平臺。

Splice Machine為企業提供了關於NoSQL所有的資料庫有點,比如自動切片,可擴充套件性以及容錯性與高可用性。並且為企業優化了複雜的資料庫查詢,而且不需要重寫所有的資料應用以及BI工具。

通過利用分散式計算,Splice Machine可以通過簡單地增加更多的商品伺服器從TB級到PB級規模。Splice Machine是能夠提供這種可擴充套件性,而不會犧牲SQL功能或酸合規是RDBMS的基石。

競爭格局:競爭對手包括Cloudera的,MemSQL,NuoDB,Datastax和VoltDB。

關鍵的區別:Splice Machine聲稱擁有在資料庫中利用Hadoop解決實時時間分析的能力。

6、DataTorrent

 

\
 

他們做了什麼:提供基於Hadoop的實時流處理平臺。

總部:加利福尼亞州聖克拉拉市

負責人:富晃,誰是以前的工程團隊在雅虎,在那裡他擔任工程執行副總裁的創始成員之一。

成立時間: 2012

資金來源:該公司關閉了800萬美元的系列2013年6月A輪August Capital公司領導的一輪,並加入了由AME雲創投。該公司此前取得75萬美元的種子資金來自莫拉多風險投資公司和法扎德Nazem。

上榜理由: DataTorrent認為,他們可以很好的解決資料延遲問題,尤其是對實時資料分析要求很高的環境中。

對於一些見解,到時候的資料儲存到磁碟上,進行分析,並回答了 – 它已經太晚了。舉例來說,如果一個黑客挾持了信用卡帳戶,並設法使一些購買,即使在幾分鐘內切斷信用卡,但這個時候持卡者已經遭受了重大的損失。DataTorrent認為,企業需要掌握實時資料,並且對其進行快速分析與判斷。

不同於傳統的批量處理,可以採取小時,DataTorrent聲稱能夠數億每秒的資料項的執行。這使企業處理,監控,並根據其在實時資料做出決策。

競爭格局: DataTorrent的主要競爭對手來自IBM(InfoSphere流)和風暴開源專案。

關鍵的區別: DataTorrent最關鍵的地方就是在於它的資料分析速度。

大型的Hadoop託管平臺

7、Qubole

 

\
 

他們做了什麼:提供大資料作為一種服務有一個“真正的自動縮放Hadoop叢集。”

總部:加州山景城

執行總裁:Ashish Thusoo。

成立時間: 2011

資金來源:該公司是由700萬美元的風險投資公司光速和查爾斯河風險投資公司A系列融資支援。

上榜理由:由於Hadoop是一個相對較新的技術,完全掌握並且可以熟練運用是一個非常困難的事情。通過託管的解決方案Qubole希望使Hadoop成為一個易於使用的技術。

Qubole為企業提供Hadoop的初始設定與維護工作。為企業達到削減成本與專案自動化管理的相關事情。

客戶包括:Pinterest,MediaMath,Saavn。

競爭格局: Qubole將與Altiscale,亞馬遜電子病歷,寶資料成為競爭對手。

關鍵的區別: Qubole指向其專有技術,提供真正的自動縮放和儲存優化。

8、Continuuity

 

\
 

他們做什麼:提供一個基於Hadoop的大資料應用託管平臺。

總部:帕洛阿爾託,加利福尼亞州

負責人:喬納森·格雷,誰是以前的HBase的軟體工程師的Facebook。

成立時間: 2011

資金來源: 12500000美元從Battery Ventures公司,啟明創投,安德森霍洛維茨,資料集合和放大的合作伙伴。

上榜理由: Continuuity想出了一個巧妙的方法來解決Hadoop的專家的缺乏:他們提供了針對Java開發人員應用程式開發平臺。較低階別的基礎設施是由Continuuity平臺的所有抽象出來。

該公司的旗艦產品,電抗器,是一個基於Java的整合資料和應用程式框架層在Apache Hadoop,HBase的,和其他的Hadoop生態系統組成部分的頂部。它表面經過簡單的Java和REST API的基礎設施的能力,從不必要的複雜性遮蔽的終端使用者。

競爭格局:截至目前,Continuuity具有獨特的優勢。間接的競爭對手來自哈斯營(AWS電子病歷,Altiscale,InfoChimps這類,迫擊炮資料等)。

關鍵的區別: Continuuity是針對Java開發人員的大資料解決方案。

大資料的視覺化平臺

9、Xplenty

 

\
 

他們所做的事情:提供HaaS。

總部:以色列特拉維夫

執行總裁:Yaniv Mor。

成立時間: 2012

資金來源:資金來源不詳。

Xplenty提供了基於Hadoop的雲環境,裡面有自由編輯器與設計環境,使企業可以節省大量的硬體投入,並且在軟體與相關的維護人員上也有大量的預算節省。

採用拖拽的操作介面,無需編寫複雜的指令碼或任何型別的程式碼。憑藉其伺服器自動配置功能,使用者可以簡單地指向一個資料來源,配置資料轉換任務,並告訴該平臺在哪裡寫的結果。Xplenty的平臺使用SQL術語。因此,對於資料分析,學習曲線應該是最小的。

客戶包括DealPly技術,Fiverr,鐵源,WalkMe。

競爭格局:主要的競爭來自亞馬遜的電子病歷。其他哈斯競爭對手包括Altiscale,迫擊炮資料,Qubole,以及最近與微軟的Hadoop在Azure上。Rackspace公司即將推出基於Hortonworks’分配自己的哈斯產品。

關鍵的區別:根據Xplenty,競爭性服務還是針對開發人員,而Xplenty目標的資料和商業智慧(BI)的使用者誰不知道如何編寫程式碼,但誰需要將資料轉移到一個大的資料平臺。

10、Nuevora

 

\
 

他們所做的事情:提供大資料分析應用。

總部:加州聖拉蒙

執行總裁: Phani Nagarjuna。

成立時間: 2011

資金: 300萬美元的風險投資Fortisure早期資金。

上榜理由: Nuevora的nBAAP (大資料分析及應用服務)的平臺功能基於最佳實踐驅動的預測演算法的專用分析應用程式。 nBAAP是基於三個關鍵大資料技術: Hadoop的(資料處理) , R(預測分析) ,和的Tableau (視覺化) 。

在這一切之上, Nuevora的演算法上的資料(事務,社交媒體,移動,戰役)中不同來源的合作,以快速識別,以配合特定的目標,個人的營銷策略模式和預測。

該平臺包括預構建的應用程式,為客戶的營銷業務流程 – 獲取,保留,向上銷售,交叉銷售,盈利能力和客戶生命週期價值( LTV ) 。隨著對個別客戶的情況下,唯一的“最後一英里”的配置, Nuevora的應用程式,能讓企業組織預測客戶的行為。

競爭格局:當Nuevora評估的競爭格局,它在零上的大型諮詢公司,如埃森哲,和其他預測性分析的公司,如高山資料實驗室。

然而,由於在陽光下幾乎每一個營銷平臺,目前包括某種形式的分析引擎,我也希望他們能與主要的營銷自動化供應商,如ExactTarget (使用Pentaho的其大資料分析)競爭。

關鍵的區別: Nuevora給終端使用者使用“閉環校準引擎”,它可以幫助企業跟上僅基於最新資料的最中肯的見解,不斷地重新調整他們的預測能力。