原文連結:本著什麼原則,才能寫出優秀的程式碼?
作為一名程式設計師,最不愛乾的事情,除了開會之外,可能就是看別人的程式碼。
有的時候,新接手一個專案,開啟程式碼一看,要不是身體好的話,可能直接氣到暈厥。
風格各異,沒有註釋,甚至連最基本的格式縮排都做不到。這些程式碼存在的意義,可能就是為了證明一句話:又不是不能跑。
在這個時候,大部分程式設計師的想法是:這爛程式碼真是不想改,還不如直接重寫。
但有的時候,我們看一些著名的開源專案時,又會感嘆,程式碼寫的真好,優雅。為什麼好呢?又有點說不出來,總之就是好。
那麼,這篇文章就試圖分析一下好程式碼都有哪些特點,以及本著什麼原則,才能寫出優秀的程式碼。
初級階段
先說說比較基本的原則,只要是程式設計師,不管是高階還是初級,都會考慮到的。
這只是列舉了一部分,還有很多,我挑選四項簡單舉例說明一下。
- 格式統一
- 命名規範
- 註釋清晰
- 避免重複程式碼
以下用 Python 程式碼分別舉例說明:
格式統一
格式統一包括很多方面,比如 import
語句,需要按照如下順序編寫:
- Python 標準庫模組
- Python 第三方模組
- 應用程式自定義模組
然後每部分間用空行分隔。
import os
import sys
import msgpack
import zmq
import foo
再比如,要新增適當的空格,像下面這段程式碼;
i=i+1
submitted +=1
x = x*2 - 1
hypot2 = x*x + y*y
c = (a+b) * (a-b)
程式碼都緊湊在一起了,很影響閱讀。
i = i + 1
submitted += 1
x = x * 2 - 1
hypot2 = x * x + y * y
c = (a + b) * (a - b)
新增空格之後,立刻感覺清晰了很多。
還有就是像 Python 的縮排,其他語言的大括號位置,是放在行尾,還是另起新行,都需要保證統一的風格。
有了統一的風格,會讓程式碼看起來更加整潔。
命名規範
好的命名是不需要註釋的,只要看一眼命名,就能知道變數或者函式的作用。
比如下面這段程式碼:
a = 'zhangsan'
b = 0
a
可能還能猜到,但當程式碼量大的時候,如果滿屏都是 a
,b
,c
,d
,那還不得原地爆炸。
把變數名稍微改一下,就會使語義更加清晰:
username = 'zhangsan'
count = 0
還有就是命名要風格統一。如果用駝峰就都用駝峰,用下劃線就都用下劃線,不要有的用駝峰,有點用下劃線,看起來非常分裂。
註釋清晰
看別人程式碼的時候,最大的願望就是註釋清晰,但在自己寫程式碼時,卻從來不寫。
但註釋也不是越多越好,我總結了以下幾點:
- 註釋不限於中文或英文,但最好不要中英文混用
- 註釋要言簡意賅,一兩句話把功能說清楚
- 能寫文件註釋應該儘量寫文件註釋
- 比較重要的程式碼段,可以用雙等號分隔開,突出其重要性
舉個例子:
# =====================================
# 非常重要的函式,一定謹慎使用 !!!
# =====================================
def func(arg1, arg2):
"""在這裡寫函式的一句話總結(如: 計算平均值).
這裡是具體描述.
引數
----------
arg1 : int
arg1的具體描述
arg2 : int
arg2的具體描述
返回值
-------
int
返回值的具體描述
參看
--------
otherfunc : 其它關聯函式等...
示例
--------
示例使用doctest格式, 在`>>>`後的程式碼可以被文件測試工具作為測試用例自動執行
>>> a=[1,2,3]
>>> print [x + 3 for x in a]
[4, 5, 6]
"""
避免重複程式碼
隨著專案規模變大,開發人員增多,程式碼量肯定也會增加,避免不了的會出現很多重複程式碼,這些程式碼實現的功能是相同的。
雖然不影響專案執行,但重複程式碼的危害是很大的。最直接的影響就是,出現一個問題,要改很多處程式碼,一旦漏掉一處,就會引發 BUG。
比如下面這段程式碼:
import time
def funA():
start = time.time()
for i in range(1000000):
pass
end = time.time()
print("funA cost time = %f s" % (end-start))
def funB():
start = time.time()
for i in range(2000000):
pass
end = time.time()
print("funB cost time = %f s" % (end-start))
if __name__ == '__main__':
funA()
funB()
funA()
和 funB()
中都有輸出函式執行時間的程式碼,那麼就適合將這些重複程式碼抽象出來。
比如寫一個裝飾器:
def warps():
def warp(func):
def _warp(*args, **kwargs):
start = time.time()
func(*args, **kwargs)
end = time.time()
print("{} cost time = {}".format(getattr(func, '__name__'), (end-start)))
return _warp
return warp
這樣,通過裝飾器方法,實現了同樣的功能。以後如果需要修改的話,直接改裝飾器就好了,一勞永逸。
進階階段
當程式碼寫時間長了之後,肯定會對自己有更高的要求,而不只是格式,註釋這些基本規範。
但在這個過程中,也是有一些問題需要注意的,下面就來詳細說說。
炫技
第一個要說的就是「炫技」,當對程式碼越來越熟悉之後,總想寫一些高階用法。但現實造成的結果就是,往往會使程式碼過度設計。
這不得不說說我的親身經歷了,曾經有一段時間,我特別迷戀各種高階用法。
有一次寫過一段很長的 SQL,而且很複雜,裡面甚至還包含了一個遞迴呼叫。有「炫技」嫌疑的 Python 程式碼就更多了,往往就是一行程式碼包含了 N 多魔術方法。
然後在寫完之後漏出滿意的笑容,感慨自己技術真牛。
結果就是各種被罵,更重要的是,一個星期之後,自己都看不懂了。
其實,程式碼並不是高階方法用的越多就越牛,而是要找到最適合的。
越簡單的程式碼,越清晰的邏輯,就越不容易出錯。而且在一個團隊中,你的程式碼並不是你一個人維護,降低別人閱讀,理解程式碼的成本也是很重要的。
脆弱
第二點需要關注的是程式碼的脆弱性,是否細微的改變就可能引起重大的故障。
程式碼裡是不是充滿了硬編碼?如果是的話,則不是優雅的實現。很可能導致每次效能優化,或者配置變更就需要修改原始碼。甚至還要重新打包,部署上線,非常麻煩。
而把這些硬編碼提取出來,設計成可配置的,當需要變更時,直接改一下配置就可以了。
再來,對引數是不是有校驗?或者容錯處理?假如有一個 API 被第三方呼叫,如果第三方沒按要求傳參,會不會導致程式崩潰?
舉個例子:
page = data['page']
size = data['size']
這樣的寫法就沒有下面的寫法好:
page = data.get('page', 1)
size = data.get('size', 10)
繼續,專案中依賴的庫是不是及時升級更新了?
積極,及時的升級可以避免跨大版本升級,因為跨大版本升級往往會帶來很多問題。
還有就是在遇到一些安全漏洞時,升級是一個很好的解決辦法。
最後一點,單元測試完善嗎?覆蓋率高嗎?
說實話,程式設計師喜歡寫程式碼,但往往不喜歡寫單元測試,這是很不好的習慣。
有了完善,覆蓋率高的單元測試,才能提高專案整體的健壯性,才能把因為修改程式碼帶來的 BUG 的可能性降到最低。
重構
隨著程式碼規模越來越大,重構是每一個開發人員都要面對的功課,Martin Fowler 將其定義為:在不改變軟體外部行為的前提下,對其內部結構進行改變,使之更容易理解並便於修改。
重構的收益是明顯的,可以提高程式碼質量和效能,並提高未來的開發效率。
但重構的風險也很大,如果沒有理清程式碼邏輯,不能做好迴歸測試,那麼重構勢必會引發很多問題。
這就要求在開發過程中要特別注重程式碼質量。除了上文提到的一些規範之外,還要注意是不是濫用了物件導向程式設計原則,介面之間設計是不是過度耦合等一系列問題。
那麼,在開發過程中,有沒有一個指導性原則,可以用來規避這些問題呢?
當然是有的,接著往下看。
高階階段
最近剛讀完一本書,Bob 大叔的《架構整潔之道》,感覺還是不錯的,收穫很多。
全書基本上是在描述軟體設計的一些理論知識。大體分成三個部分:程式設計正規化(結構化程式設計、物件導向程式設計和函數語言程式設計),設計原則(主要是 SOLID),以及軟體架構(其中講了很多高屋建翎的內容)。
總體來說,這本書中的內容可以讓你從微觀(程式碼層面)和巨集觀(架構層面)兩個層面對整個軟體設計有一個全面的瞭解。
其中 SOLID 就是指物件導向程式設計和麵向物件設計的五個基本原則,在開發過程中適當應用這五個原則,可以使軟體維護和系統擴充套件都變得更容易。
五個基本原則分別是:
- 單一職責原則(SRP)
- 開放封閉原則(OCP)
- 里氏替換原則(LSP)
- 介面隔離原則(ISP)
- 依賴倒置原則(DIP)
單一職責原則(SRP)
A class should have one, and only one, reason to change. – Robert C Martin
一個軟體系統的最佳結構高度依賴於這個系統的組織的內部結構,因此每個軟體模組都有且只有一個需要被改變的理由。
這個原則非常容易被誤解,很多程式設計師會認為是每個模組只能做一件事,其實不是這樣。
舉個例子:
假如有一個類 T
,包含兩個函式,分別是 A()
和 B()
,當有需求需要修改 A()
的時候,但卻可能會影響 B()
的功能。
這就不是一個好的設計,說明 A()
和 B()
耦合在一起了。
開放封閉原則(OCP)
Software entities should be open for extension, but closed for modification. – Bertrand Meyer, Object-Oriented Software Construction
如果軟體系統想要更容易被改變,那麼其設計就必須允許新增程式碼來修改系統行為,而非只能靠修改原來的程式碼。
通俗點解釋就是設計的類對擴充套件是開放的,對修改是封閉的,即可擴充套件,不可修改。
看下面的程式碼示例,可以簡單清晰地解釋這個原則。
void DrawAllShape(ShapePointer list[], int n)
{
int i;
for (i = 0; i < n; i++)
{
struct Shape* s = list[i];
switch (s->itsType)
{
case square:
DrawSquare((struct Square*)s);
break;
case circle:
DrawSquare((struct Circle*)s);
break;
default:
break;
}
}
}
上面這段程式碼就沒有遵守 OCP 原則。
假如我們想要增加一個三角形,那麼就必須在 switch
下面新增一個 case
。這樣就修改了原始碼,違反了 OCP 的封閉原則。
缺點也很明顯,每次新增一種形狀都需要修改原始碼,如果程式碼邏輯複雜的話,發生問題的概率是相當高的。
class Shape
{
public:
virtual void Draw() const = 0;
}
class Square: public Shape
{
public:
virtual void Draw() const;
}
class Circle: public Shape
{
public:
virtual void Draw() const;
}
void DrawAllShapes(vector<Shape*>& list)
{
vector<Shape*>::iterator I;
for (i = list.begin(): i != list.end(); i++)
{
(*i)->Draw();
}
}
通過這樣修改,程式碼就優雅了很多。這個時候如果需要新增一種型別,只需要增加一個繼承 Shape
的新類就可以了。完全不需要修改原始碼,可以放心擴充套件。
里氏替換原則(LSP)
Require no more, promise no less.– Jim Weirich
這項原則的意思是如果想用可替換的元件來構建軟體系統,那麼這些元件就必須遵守同一個約定,以便讓這些元件可以相互替換。
里氏替換原則可以從兩方面來理解:
第一個是繼承。如果繼承是為了實現程式碼重用,也就是為了共享方法,那麼共享的父類方法就應該保持不變,不能被子類重新定義。
子類只能通過新新增方法來擴充套件功能,父類和子類都可以例項化,而子類繼承的方法和父類是一樣的,父類呼叫方法的地方,子類也可以呼叫同一個繼承得來的,邏輯和父類一致的方法,這時用子類物件將父類物件替換掉時,當然邏輯一致,相安無事。
第二個是多型,而多型的前提就是子類覆蓋並重新定義父類的方法。
為了符合 LSP,應該將父類定義為抽象類,並定義抽象方法,讓子類重新定義這些方法。當父類是抽象類時,父類就是不能例項化,所以也不存在可例項化的父類物件在程式裡,也就不存在子類替換父類例項(根本不存在父類例項了)時邏輯不一致的可能。
舉個例子:
看下面這段程式碼:
class A{
public int func1(int a, int b){
return a - b;
}
}
public class Client{
public static void main(String[] args){
A a = new A();
System.out.println("100-50=" + a.func1(100, 50));
System.out.println("100-80=" + a.func1(100, 80));
}
}
輸出;
100-50=50
100-80=20
現在,我們新增一個功能:完成兩數相加,然後再與 100 求和,由類 B
來負責。即類 B
需要完成兩個功能:
- 兩數相減
- 兩數相加,然後再加 100
現在程式碼變成了這樣:
class B extends A{
public int func1(int a, int b){
return a + b;
}
public int func2(int a, int b){
return func1(a,b) + 100;
}
}
public class Client{
public static void main(String[] args){
B b = new B();
System.out.println("100-50=" + b.func1(100, 50));
System.out.println("100-80=" + b.func1(100, 80));
System.out.println("100+20+100=" + b.func2(100, 20));
}
}
輸出;
100-50=150
100-80=180
100+20+100=220
可以看到,原本正常的減法運算髮生了錯誤。原因就是類 B
在給方法起名時重寫了父類的方法,造成所有執行相減功能的程式碼全部呼叫了類 B
重寫後的方法,造成原本執行正常的功能出現了錯誤。
這樣做就違反了 LSP,使程式不夠健壯。更通用的做法是:原來的父類和子類都繼承一個更通俗的基類,原有的繼承關係去掉,採用依賴、聚合,組合等關係代替。
介面隔離原則(ISP)
Clients should not be forced to depend on methods they do not use. –Robert C. Martin
軟體設計師應該在設計中避免不必要的依賴。
ISP 的原則是建立單一介面,不要建立龐大臃腫的介面,儘量細化介面,介面中的方法要儘量少。
也就是說,我們要為各個類建立專用的介面,而不要試圖去建立一個很龐大的介面供所有依賴它的類去呼叫。
在程式設計中,依賴幾個專用的介面要比依賴一個綜合的介面更靈活。
單一職責與介面隔離的區別:
- 單一職責原則注重的是職責;而介面隔離原則注重對介面依賴的隔離。
- 單一職責原則主要是約束類,其次才是介面和方法,它針對的是程式中的實現和細節; 而介面隔離原則主要約束介面。
舉個例子:
首先解釋一下這個圖的意思:
「犬科」類依賴「介面 I」中的方法:「捕食」,「行走」,「奔跑」; 「鳥類」類依賴「介面 I」中的方法「捕食」,「滑翔」,「飛翔」。
「寵物狗」類與「鴿子」類分別是對「犬科」類與「鳥類」類依賴的實現。
對於具體的類:「寵物狗」與「鴿子」來說,雖然他們都存在用不到的方法,但由於實現了「介面 I」,所以也 必須要實現這些用不到的方法,這顯然是不好的設計。
如果將這個設計修改為符合介面隔離原則的話,就必須對「介面 I」進拆分。
在這裡,我們將原有的「介面 I」拆分為三個介面,拆分之後,每個類只需實現自己需要的介面即可。
依賴倒置原則(DIP)
High-level modules should not depend on low-level modules. Both should depend on abstractions. Abstractions should not depend on details. Details should depend on abstractions.– Robert C. Martin
高層策略性的程式碼不應該依賴實現底層細節的程式碼。
這話聽起來就讓人聽不明白,我來翻譯一下。大概就是說在寫程式碼的時候,應該多使用穩定的抽象介面,少依賴多變的具體實現。
舉個例子:
看下面這段程式碼:
public class Test {
public void studyJavaCourse() {
System.out.println("張三正在學習 Java 課程");
}
public void studyDesignPatternCourse() {
System.out.println("張三正在學習設計模式課程");
}
}
上層直接呼叫:
public static void main(String[] args) {
Test test = new Test();
test.studyJavaCourse();
test.studyDesignPatternCourse();
}
這樣寫乍一看並沒有什麼問題,功能也實現的好好的,但仔細分析,卻並不簡單。
第一個問題:
如果張三又新學習了一門課程,那麼就需要在 Test()
類中增加新的方法。隨著需求增多,Test()
類會變得非常龐大,不好維護。
而且,最理想的情況是,新增程式碼並不會影響原有的程式碼,這樣才能保證系統的穩定性,降低風險。
第二個問題:
Test()
類中方法實現的功能本質上都是一樣的,但是卻定義了三個不同名字的方法。那麼有沒有可能把這三個方法抽象出來,如果可以的話,程式碼的可讀性和可維護性都會增加。
第三個問題:
業務層程式碼直接呼叫了底層類的實現細節,造成了嚴重的耦合,要改全改,牽一髮而動全身。
基於 DIP 來解決這個問題,勢必就要把底層抽象出來,避免上層直接呼叫底層。
抽象介面:
public interface ICourse {
void study();
}
然後分別為 JavaCourse
和 DesignPatternCourse
編寫一個類:
public class JavaCourse implements ICourse {
@Override
public void study() {
System.out.println("張三正在學習 Java 課程");
}
}
public class DesignPatternCourse implements ICourse {
@Override
public void study() {
System.out.println("張三正在學習設計模式課程");
}
}
最後修改 Test()
類:
public class Test {
public void study(ICourse course) {
course.study();
}
}
現在,呼叫方式就變成了這樣:
public static void main(String[] args) {
Test test = new Test();
test.study(new JavaCourse());
test.study(new DesignPatternCourse());
}
通過這樣開發,上面提到的三個問題得到了完美解決。
其實,寫程式碼並不難,通過什麼設計模式來設計架構才是最難的,也是最重要的。
所以,下次有需求的時候,不要著急寫程式碼,先想清楚了再動手也不遲。
這篇文章寫的特別辛苦,主要是後半部分理解起來有些困難。而且有一些原則也確實沒有使用經驗,單靠文字理解還是差點意思,體會不到精髓。
其實,文章中的很多要求我都做不到,總結出來也相當於是對自己的一個激勵。以後對程式碼要更加敬畏,而不是為了實現功能草草了事。寫出健壯,優雅的程式碼應該是每個程式設計師的目標,與大家共勉。
如果覺得這篇文章還不錯的,歡迎點贊和轉發,感謝~
推薦閱讀:
參考資料: