大資料創業的五點須知

ctocio發表於2013-08-30

  大資料是當今最熱門的科技詞彙,同時也是最困難的創業專案。CSC對Infochimps的收購表明,那些無法順利拿到第二輪融資的大資料創業公司面臨著要麼關張,要麼被人收購的命運,例如Drawn to Scale、Ravel Data和Nodeable等,當然還有很多很多大家沒有注意到的大資料創業公司。

  Gigaom作者Derrick Harris近日就大資料創業公司的成長和融資問題撰文指出,大資料創業公司要想生存發展並贏得投資人的芳心必須注意一下幾點:明智地選擇你的戰場和目標使用者並圍繞你的技術建立社群。大資料需要的不是啦啦隊,而是實幹家。Harris的觀點可以歸納為五點,IT經理網摘譯整理如下:

  1.基礎設施非常難

  不僅開發基礎設施技術產品很難,銷售起來也很難,具體到大資料基礎設施工具如Hadoop、NoSQL資料庫和流處理系統則更是難上加難。客戶需要大量培訓和教育,付費使用者需要大量支援和及時跟進的產品開發工作。

  這意味著需要大量的資金支援,例如Greenplum在2010年獲得1億美元投資但仍然不足以完成所有工作,最終不得不選擇賣給EMC。今天最出名的幾家大資料創業公司融的錢更多,例如Cloudera。基礎設施類的大資料創業公司通常需要數百萬美元種子資金啟動,但是A輪融資的道路異常艱辛。

  新興的大資料創業公司還必須與那些在客戶那裡已經有一些知名度甚至合作專案的公司競爭,例如Cloudera、Hortonworks、10gen、亞馬遜AWS、IBM、Oracle等。

  反觀大資料應用創業則相對簡單的多,無論面向垂直行業應用還是資料視覺化這樣的通用大資料應用都是如此。因為這些大資料應用的價值對於客戶來說更為直觀,距離業務也更近,進入企業IT系統的摩擦也更小。

  2.雲端計算是朋友

  無論你是銷售大資料基礎設施還是應用,雲端計算都是更有效的業務載體。選擇雲端計算不僅僅是在雲端託管,更重要的是通過雲端計算向客戶提供服務。你將擁有更多控制權,同時在有限的資源上優化執行也會讓你對產品的理解更加透徹。

  雲端計算也降低了潛在使用者試用產品的成本和門檻,從NewRelic到亞馬遜AWS都從雲端計算+大資料模式中獲益。

  參考閱讀:大資料與雲端計算是天作之合

  3.開發者是朋友

  如果你主要從事大資料分析,例如ClearStory、Platfora或者CRM營銷應用,資料分析師就是你的朋友。無論那種情況,最好的辦法就是圍繞以開發者和市場人員為主的目標受眾進行開發和營銷工作,CIO反而不是很好的目標受眾!

  專注CIO而非開發者往往會導致你在實際簽約時碰到棘手問題。圍繞開發者營銷的戰術被很多雲端計算創業公司和純大資料軟體公司所採用,例如Splunk和Tableau。

  再比如Infochimps和Continuuity的產品類似(兩者都被迫按落雲頭,迫降在使用者資料中心),但Continuuity完全面向開發者,這意味著能積累更多技術粉絲。

  4.將資料科學家推向前臺中央

  這既是市場也是銷售策略,資料科學家才是能夠展示資料和平臺威力的人,他們也是會議上最受歡迎的演講者。

  但大資料科學家也需要慎重選擇傳播內容。如今大家都接受了Hadoop和NoSQL,所以沒必要每次開會言必稱4V之類的科普。至於如何配置和整合大資料系統也只能吸引小部分聽眾,除非你的專案規模超大。

  Cloudera比競爭對手出名的原因有很多,但其中Jeff hammerbacher絕對是一位舉足輕重的人物。不要空談大資料大資料的價值和架構,站在聽眾的立場說說具體能做哪些分析,如何做。

  5.開源有多重要,取決於你自己

  幾乎所有的大資料公司都依賴開源軟體,有些是“借”來的,如Hadoop、Storm以及各種資料庫,有些是自行開發的,有些則是混合模式,例如在HBase上增加的一些功能應用。這些開源專案如此流行是因為社群的力量。

  開源絕不是看起來那麼輕鬆,不是說你在Github上放點程式碼就談得上回饋社群了。開源的目的是將使用相同程式碼的人聚攏成社群,並不斷改進程式碼。這裡與第三點中我們提到的吸引開發者有關。只有更多的使用者和開發者對你產生興趣了,在你的產品上花時間和精力了,才有可能最終掏錢。

  不計其數的創業公司都將程式碼開源了,但那些真正能推動專案並建設社群的公司才能脫穎而出。例如Neo Technology的Neo4j、Concurrent的Casading以及10gen的MongoDB。甚至Twitter這樣面向大眾的公司都開源了Storm和Mesos等專案。

相關文章