Google創新之道:混合研究方法

劉江發表於2012-07-24

原文連結: http://cacm.acm.org/magazines/2012/7/151226-googles-hybrid-approach-to-research/fulltext

組織創新挑戰巨大,因為電腦科學本身涵蓋越來越廣、雜,從數學推理、工程方法論到實證方法組成。而且實證方法顯然越來越重要,因為計算機系統規模越來越大而複雜,分析技術無法正確描述其屬性,而且動態,資料量與實時互動反饋的資料巨大。

計算機領域擴充套件迅速,最新研究成果不再限於大學,越來越多地來自大小公司。研究成果的發表也不再限於學術期刊,而更多來自工業界的開源軟體、標準規範和平臺化的商業系統。面向使用者的和貼近應用和產品的研究日益重要。短線,通過使用者反饋和實際數字、真實的限制作為檢驗。在已有領域探索新方法。迭代式的。從一開始就用生產程式碼體現,不會開發複雜的研究原型,並儘快投入服務運營。消除了從研究到工程研發之間科技轉化的巨大風險。即使失敗,也能收集到寶貴的資料供日後繼續探索參考。

Google的使命與能力的影響

整個Google都專注於快速創新,這是由公司的技術和業務模式中三方面優勢所支援的: - 規模效應,計算抽象平臺,資料中心,遮蔽異構的複雜。 - 基於服務的交付模式,簡化研發流程,小團隊能幹大事情,促進使用者參與與實證研究。 - 人才充足。

Google的混合式研究

Google對創新的關注,它的服務模式,龐大的使用者群體,人才濟濟的團隊,電腦科學研究演進式的本質,導致了它的混合研究模式:模糊研究與工程的界限,鼓勵團隊靈活地平衡兩者。在需求變化時,人員和專案也會保持高度流動性,使研究與工程不脫節。選擇的方向應該具備兩個條件:潛在影響能抵消風險的方向,能夠通過Google的產品與服務和學術界產生影響。基本結果的廣泛傳播,有如下好處:收集有價值的反饋,培養未來的新人,提供協作,孕育進一步的工作。

長期研究分解為多個短期、可測量的部分。這對團隊激勵和公司業務都有好處。但有時仍然會從事長期研究,比如Google Translate(海量語料)、Chrome(各種複雜安全特性)和Google Health。如果無法成功,無畏地改變方向(Google Health)。

這種積小勝為大贏的辦法與電腦科學演進本質對應。但是,如果一些步驟必須不同方向上有大的飛躍時,這種辦法就不靈了。

研究模式舉例

  • 產品團隊做出研究性成果。如MapReduce、GFS和BigTable。
  • 研究成果創造新產品。如Google Translate和Voice Search。
  • 研究成果應用於已有產品。如新的多媒體指紋技術應用於YouTube。
  • 工程與研究共同解決工程問題。如許多演算法問題和高效能問題。
  • 工程組的研究專案轉交給研究組。如YouTube推薦。

怎樣定義成功?

研究專案的成功應該從學術或者商業來衡量,如果兩者兼顧更理想。商業上的成功在Google更容易衡量, 我們已經從系統、語音識別、語言翻譯、機器學習、市場演算法和計算機視覺等諸多研究進展在獲益良多。

學術影響主要指對學術界、其他公司或者行業、整個電腦科學領域的影響。當然,這種影響傳統上來自學術論文,Google每年發表的論文數都在增長(從2003年的13篇,到2006年的130篇,2011年則達到279篇)。其中有些論文廣受讚譽和引用。但是我們感覺論文並非知識傳播的唯一方法:Google員工還領導了1000個開源專案,並參與了許多標準(比如擔任HTML5的編輯),並開發了數以百計的開放API供公眾訪問我們的服務。某些情況下,我們會結合使用不同的渠道,在發表最初的論文概述思想(MapReduce, GFS, BigTable)之後,還開發某一方面(Protocol Buffers)的開源實現。在另一些情況下,專案從第一天開始就是開源的:Android和Chromium可能是最著名的兩個例子,而且也證明了這種方式的有效。

討論

技術公司之所以要在科學研究上投資,主要出於這樣幾個原因:這對公司的產品與服務非常重要,能獲得聲譽,對公眾利益有貢獻,降低被新技術未加防範而帶來的風險。

Google的科學研究基於這樣的前提:將研究與研發聯絡起來,能夠給研究團隊提供強大、生產環境級的基礎設施和較大的使用者基數,由此將不僅帶來創新性的研究,而且能獲得新的高價值商業能力。將研究與研發結合,能夠減少甚至消除傳統的技術轉化過程,這在其他公司裡已經證明是非常大的挑戰。我們大多數專案都包括從研究階段到產品階段的人員。這種緊密協作和整合能進一步確認所研究問題的真實性:研究是在真實系統和真實使用者基礎上進行的。我們靈活的組織也為員工提供了多樣的機會,並對我們的創新文化和延攬優秀人才的能力產生了積極影響。

當然,這種緊密結合也會帶來一些風險。與使用者和產品團隊離得太近,很容易陷入其中,錯過新的趨勢。為了降低風險,我們通過各種專案(訪問學者、實習生或者學者研究資金專案)與學術界保持聯絡。我們還鼓勵將研究結果寫成論文,但是人們的確不時批評Google在對外公開上做得不好。原因之一是Google的研究人員有很多獲得影響力的渠道,發表論文只是其中之一。因此,Google發表論文較少,但是已發表的那些論文卻更有影響力,因為其中說的都是經過考驗、已經實現的系統經驗,而不只是一些設想。混合研究模型的另一個潛在問題是,更容易陷入到漸進式研究的路子上去。因此,我們也支援正規化性的變革,其中Google無人駕駛汽車專案Chauffeur就是最好的例子。

結語

世界上許多電腦科學研究問題都與Google的業務、技術領袖和使用者息息相關。Google的電腦科學研究最大程度地結合了研究與研發,不僅產生了創新性的研究成果和技術,也使公司獲得了有價值的新能力。混合方法使我們能在一般研究專案無法企及的規模進行實驗,產生有更廣的學術與商業影響的研究成果。我們還為團隊成員在研究與研發中提供靈活的機會。雖然這種混合研究方式有賴於Google許多特殊的資源,但我們認為,這對於其他技術公司也是有借鑑意義的。

參考

  1. Baluja, S. and Covell, M. Waveprint: Efficient wavelet-based audio fingerprinting. In Pattern Recognition, 2008.

  2. Buderi, R. Engines of Tomorrow: How The World's Best Companies Are Using Their Research Labs To Win The Future. Simon & Schuster, 2000.

  3. Chang, F. et al. Bigtable: A distributed storage system for structured data. In Proceedings of OSDI 2006.

  4. Dean, J. and Ghemawat, S. MapReduce: Simplified data processing on large clusters. In Proceedings of OSDI 2004.

  5. Dodgson, M., Gann, D. and Salter, A. The Management of Technological Innovation: Strategy and Practice. Oxford University Press, 2008.

  6. Enkel, E., Gassmann, O. and Chesbrough, H. Open R&D and open innovation: Exploring the phenomenon. In R&D Management, 2009.

  7. Ghemawat, S., Gobioff, H., and Leung, S.T. Google file system. In Proceedings of ACM SIGOPS 2003.

  8. Leifer, R., O'Connor, G. and Rice, M. Implementing radical innovation in mature firms: The role of hubs. In The Human Side of Managing Technological Innovation. R. Katz, Ed., Oxford University Press, 2004.

  9. Reis, C., Barth, A., and Pizano, C. Browser security: Lessons from Google Chrome. ACM Queue 7, 5 (May 2009).

  10. Schalkwyk, J. Google Search by Voice: A case study. In Advances in Speech Recognition: Mobile Environments, Call Centers, and Clinics. A. Neustein Ed., Springer, 2010.

  11. Stokes, D.E. Pasteur's Quadrant—Basic Science and Technological Innovation. Brookings Institution Press, 1997.

  12. Uszkoreit, J., Ponte, J., Popat, A., and Dubiner, M. Large scale parallel document mining for machine translation. In Proceedings of COLING 2010.

作者

Alfred Spector (azs@google.com) 是Google研究與特殊專案副總裁。

Peter Norvig (pnorvig@google.com) 是Google的研究總監。

Slav Petrov (slav@google.com) 是Google的高階研究科學家。

附註

更多參考文獻可以在這裡找到: http://research.google.com/pubs/papers.html 。

感謝與Dan Huttenlocher(2008年夏訪問Google)的多次討論,感謝Bill Coughran, Úlfar Erlingsson, Fernando Pereira, Matt Welsh和John Wilkes的貢獻與審稿。還要感謝其他匿名審稿人有價值的反饋。

相關文章