程式碼評審的不可能三角

doodlewind發表於2018-09-25

Code Review 是保證程式碼質量的重要手段之一,但許多研發團隊中它常常由於各種原因並未得到真正的落地。為什麼會這樣呢?本文希望用一個非常簡單的觀點來理解這個現象,並據此給出一點優化的想法。

觀點

我們的觀點可以用一句話概括,那就是程式碼評審非常難同時滿足高覆蓋率、強約束力和低開銷這三個條件。這三個條件分別有什麼含義呢?

  • 高覆蓋率,意味著評審需要覆蓋專案中幾乎所有的提交,而不是隻評審新人的程式碼或者是批改暑假作業般的隨機「抽查」。
  • 強約束力,意味著在保證評審本身質量的基礎上,評審中指出的問題都需要得到切實的解決,否則不應合併程式碼或釋出正式版本。
  • 低開銷 (overhead),意味著評審不應占用過多寶貴的開發時間,更不應像某些會議那樣提起來就讓人皺眉頭。

論證

滿足上述三個條件的程式碼評審,應該是每一位對程式碼質量有追求的開發同學都不會排斥的。但為什麼我們認為這樣的評審可行性不高呢?簡單地組合一下上述的條件,就不難發現矛盾了。

  • 同時滿足高覆蓋率強約束力的評審,時間是不可控的:為一些強調程式碼質量的開源專案貢獻過 non-trivial 程式碼的同學,應該都知道即便是一個簡單的 fix,其 PR 都可能因為實現手法和維護者的理解有偏差而長期保持在 Open 狀態(俗稱合不進去),更別說全新的特性與 API 了。
  • 同時滿足高覆蓋率低開銷的評審,很容易流於形式:如果制度上約定必須對全部程式碼做評審,又不能耽誤版本進度,那麼這時候只要時間稍微一緊,評審就會變成日常回復 LGTM (Look Good To Me) 的走過場了。
  • 同時滿足強約束力低開銷的評審,很難覆蓋到全部的程式碼庫:一個版本中通常會有一些全新的特性。如果評審者並未參與這個新特性的開發,那麼全量評審一個新特性的上千行程式碼,其難度跟開啟一個沒有讀過的開源專案並馬上指出其中的 bug 差不多。

折中

如果上述三者不可得兼,我們應該如何權衡呢?在目前的大環境下,多數軟體專案快速迭代的性質與我們對「早點下班」的渴望,使得低開銷這一條件通常很難被犧牲。那麼在覆蓋率約束力之間該如何取捨呢?讓我們回到「程式碼評審有什麼作用」這個話題上吧。我們知道程式碼評審可以:

  • 減少程式碼中的暗坑
  • 提高被評審者的程式碼質量
  • 讓團隊成員熟悉程式碼

如果評審本身就形同虛設,上面這些好處自然也只是空談而已。因此,我們仍然很難放棄對約束力的要求。那麼,如何改善這時覆蓋率的問題呢?這裡給出兩點不成熟的想法供參考。

首先,來自 Google Subversion 團隊的經驗可以給我們一些啟發:他們將程式碼評審與即時通訊、會議、文件一起,視作團隊中的溝通方式,而不是流程。這樣,溝通方式之間就可以取長補短地提高團隊效率。實際上,在評審全新特性時「讀不過來」的問題,就可以通過設計階段的文件來緩解:文件與評審同樣是一對多的溝通,並且對文件中方案的討論顯然比直接討論細節要更容易。一個需要 2 周時間左右開發出的全新特性,按照 問題定義 → 基本思路 → 實現概述 → 改進優化 的結構化方式編寫的文件,其長度應該僅在千字左右,編寫文件所需時間與開發時間應當不在一個量級,還能夠節約在缺失文件時向其他同學當面溝通該特性的時間(當然,對那種順手就能搞定的需求也要求文件化,就有些繁冗了)。

另外,程式碼評審的覆蓋率問題,還可以通過一定的提交約定來優化。在筆者翻譯的 conventional-commits 規範中,每一次提交都可以通過形如 fix / feat / chore / refactor 的不同型別來做區分,來達成細粒度的可讀提交歷史。那麼,在評審的 Pull Request / Merge Request 粒度上,為什麼不能同樣地應用該規範呢?如果我們按照這種方式區分了 PR 型別,這裡就有不少的想象空間:

  • 可以首先將評審的資源集中在 refactorperf 一類 PR 的評審上。
  • 對於 feat 型別存在大量新程式碼的 PR,只需其提供了確保團隊成員理解的文件,那麼就只需要保證方案設計可接受,做保證程式碼風格、命名、路徑等隱式約定一致級別的評審即可。
  • 我們可以選擇性忽略測試階段可能數量眾多的常規 fix 類 PR,但對版本釋出後補充的 hotfix 類 PR,仍然需要評審。
  • 對不影響程式碼質量的 choredoc 類 PR 可以忽略評審。

總之,程式碼評審是一種溝通方式,希望它能夠成為團隊日常開發「文化」的一部分,而非束縛效率的死板流程。希望本文的想法對同樣被評審困擾的同學有幫助 :)

P.S. 我們 base 廈門的前端工具(編輯器)團隊缺人中,有意戳這裡瞭解詳情哈。

相關文章