提高軟體質量實踐――Facebook篇

發表於2012-11-05

來源:Bill Liu 的部落格@billliu_seattle

Facebook從04年的哈佛校園的學生專案在短短的7-8年的時間中快速增長為擁有10億使用者的世界上最大的社交網路,又一次見證了網際網路創業成功的奇蹟。同時它的產品研發流程也成為了眾多網際網路產品公司的追逐物件。今天我們來看一下facebook在產品質量控制方面的實踐。有人說,現在的google象早期的微軟,現在的facebook象早期的Google. 我覺得無不道理。 雖然facebook已經早已不是創業公司,但是不難看出它在產品研發和質量控制仍然保持著創業公司的風格。在產品研發上,他們以小的研發團隊為核心,遵循幾個非常重要的原則:

Be there from start to ship: 每個工程師自始至終負責產品。從最開始的一個想法,到開發原型,到內部稽核,反饋,到產品開發,上線和維護,全部有工程師自己搞定。

Show work early and often:  facebook非常看重反饋,尤其早期內部反饋。他們鼓勵工程師有了想法後,儘快開發出原型,儘快得到反饋。

Gets your hands dirty: 動手去做,去實現。

Don’t fall in love: 網際網路產品是不斷變化的,不需要等到把一個產品設計的很完美了才釋出。

提高軟體質量實踐―― Facebook 篇

 

為了遵循以上原則,facebook工程師採用以下質量控制手段來保證產品質量:

開發對質量負責: 開發從設計,實現,測試,到部署都要自己做。其它做工具,流程的工程師通過開發工具和流程來幫助開發人員更為簡單方便地做測試,做部署和做監控。每個開發人員有自己單獨的測試環境,測試環境就是執行在開發本地機器上,部署非常簡單快速。測試環境用的是真實的使用者資料。

持續整合和測試自動化:每週釋出一次。星期天晚上,要釋出的構建從主線上分支出來到釋出分支,到星期二的中午如果沒有大的問題,就可以上線了。所有的測試執行控制在10分鐘以內,所以不需要考慮不執行哪些測試用例。執行所有測試用例。 (只是聽說,沒有經過考證。)

內測 (dog food):釋出之前,公司員工使用要釋出的功能。2-3天之內可以有幾百個或上千個人在使用新功能。負責要釋出功能的開發人員在星期天晚上到星期二中午之間會做大量的測試 (一邊上班,一邊刷微博,豈不是很爽 )。

釋出風險控制:新功能本身質量可能有問題,新功能也可能影響其它現有功能。為了減少或控制這些風險。Facebook開發了一整套完善的釋出,控制,監控流程和工具。做到:1.測試通過後,產品質量基本有保證。2.即使有漏測的bug,只會影響很少量的使用者。3.及時監控到問題。4.及時修復。

產品監控:監控產品的系統的執行狀態。

 

Facebook之所以採取這種質量控制策略和它的產品特點密切相關:

1. 使用者對社交產品質量的容忍度相對較高。比如發微博,現在連不上,等一會在連線也可以,現在釋出不出去可以等一會再發,粉絲數量統計有誤,沒有人太關心。其實facebook並不認為自己的質量差。他們認為產品的質量高低不是有多少個failed測試用例,有多少個bug來確定的,而是有使用者對質量的期望值來決定的。如果使用者對產品質量的期望值很高很高,一個bug漏掉了都會照成質量差的印象,使用者很有可能放棄使用。相反,如果使用者的期望值一般,100個bug漏掉了都不會影響使用者繼續使用。所以facebook產品釋出的條件是滿足使用者對質量的期望值即可。

2. 相對寬鬆的產品釋出週期。不想微軟或google很多產品已經在市場上,使用者對下一版本的釋出時間和新增加功能的期望很高,這往往給產品開發組的壓力很大。Facebook基本沒有這個問題,它有適合自己的釋出期限,不用受到外界干擾。

3. 產品釋出和監控流程比較完善,即使有漏測的bug,對使用者的影響可以控制在最小而且可以及時發現及時修復。

 

Facebook質量控制中引以為豪而且倍受矚目的就是“沒有專職測試工程師”。我這裡需要專門討論一下:

1. 什麼是“專職測試工程師”? 頭銜裡面有“測試”的工程師?專門找bug的工程師?專門做質量控制的工程師?等等。

2. Facebook的確沒有帶“測試”頭銜的工程師,也沒有專門執行產品找bug的工程師。每個人都是開發工程師。但是他們的實際工作有區別,有的專門做面對使用者的產品,有的專門做測試,開發工具,有的專門做產品的構建和持續整合工具和流程,有的專門做釋出和監控的工具和流程。如果按照傳統意義上的開發和測試的劃分的話,除了第一類外,其他都可以看做專職測試工程師。

3. Facebook不是惟一一個沒有帶“測試”頭銜工程師的公司,很多軟體公司都沒有,比如twitter.

4. 很多人把專職測試工程師指專門執行產品找bug的工程師。微軟在2005年去掉STE (software test engineer )崗位,就已經沒有這一型別的專職測試工程師了。

所以個人認為,專職測試工程師是個非常模糊的結論。尤其現在我們對產品質量控制方法的不斷演變和提高,“測試”的概念不僅僅是指找bug了,所有圍繞提高產品質量的工作都是測試。頭銜上有沒有“測試”不重要,有沒有“測試”崗位不重要,重要的是如何有效保證和提高產品質量。

 

【本系列前3篇

提高軟體質量實踐――Google 篇》、

軟體質量控制實踐――Microsoft 篇(上)

軟體質量控制實踐――Microsoft 篇(下)

 

 

相關文章