什麼是“版本控制”?我為什麼要關心它呢? 版本控制是一種記錄一個或若干檔案內容變化,以便將來查閱特定版本修訂情況的系統。 在本書所展示的例子中,我們對儲存著軟體原始碼的檔案作版本控制,但實際上,你可以對任何型別的檔案進行版本控制。
如果你是點陣圖形或網頁設計師,可能會需要儲存某一幅圖片或頁面佈局檔案的所有修訂版本(這或許是你非常渴望擁有的功能),採用版本控制系統(VCS)是個明智的選擇。 有了它你就可以將某個檔案回溯到之前的狀態,甚至將整個專案都回退到過去某個時間點的狀態,你可以比較檔案的變化細節,查出最後是誰修改了哪個地方,從而找出導致怪異問題出現的原因,又是誰在何時報告了某個功能缺陷等等。 使用版本控制系統通常還意味著,就算你亂來一氣把整個專案中的檔案改的改刪的刪,你也照樣可以輕鬆恢復到原先的樣子。 但額外增加的工作量卻微乎其微。
本地版本控制系統
許多人習慣用複製整個專案目錄的方式來儲存不同的版本,或許還會改名加上備份時間以示區別。 這麼做唯一的好處就是簡單,但是特別容易犯錯。 有時候會混淆所在的工作目錄,一不小心會寫錯檔案或者覆蓋意想外的檔案。
為了解決這個問題,人們很久以前就開發了許多種本地版本控制系統,大多都是採用某種簡單的資料庫來記錄檔案的歷次更新差異。
本地版本控制.
其中最流行的一種叫做 RCS,現今許多計算機系統上都還看得到它的蹤影。 甚至在流行的 Mac OS X 系統上安裝了開發者工具包之後,也可以使用 rcs
命令。 它的工作原理是在硬碟上儲存補丁集(補丁是指檔案修訂前後的變化);通過應用所有的補丁,可以重新計算出各個版本的檔案內容。
集中化的版本控制系統
接下來人們又遇到一個問題,如何讓在不同系統上的開發者協同工作? 於是,集中化的版本控制系統(Centralized Version Control Systems,簡稱 CVCS)應運而生。 這類系統,諸如 CVS、Subversion 以及 Perforce 等,都有一個單一的集中管理的伺服器,儲存所有檔案的修訂版本,而協同工作的人們都通過客戶端連到這臺伺服器,取出最新的檔案或者提交更新。 多年以來,這已成為版本控制系統的標準做法。
集中化的版本控制.
這種做法帶來了許多好處,特別是相較於老式的本地 VCS 來說。 現在,每個人都可以在一定程度上看到專案中的其他人正在做些什麼。 而管理員也可以輕鬆掌控每個開發者的許可權,並且管理一個 CVCS 要遠比在各個客戶端上維護本地資料庫來得輕鬆容易。
事分兩面,有好有壞。 這麼做最顯而易見的缺點是中央伺服器的單點故障。 如果當機一小時,那麼在這一小時內,誰都無法提交更新,也就無法協同工作。 如果中心資料庫所在的磁碟發生損壞,又沒有做恰當備份,毫無疑問你將丟失所有資料——包括專案的整個變更歷史,只剩下人們在各自機器上保留的單獨快照。 本地版本控制系統也存在類似問題,只要整個專案的歷史記錄被儲存在單一位置,就有丟失所有歷史更新記錄的風險。
分散式版本控制系統
於是分散式版本控制系統(Distributed Version Control System,簡稱 DVCS)面世了。 在這類系統中,像 Git、Mercurial、Bazaar 以及 Darcs 等,客戶端並不只提取最新版本的檔案快照,而是把程式碼倉庫完整地映象下來。 這麼一來,任何一處協同工作用的伺服器發生故障,事後都可以用任何一個映象出來的本地倉庫恢復。 因為每一次的克隆操作,實際上都是一次對程式碼倉庫的完整備份。
分散式版本控制.
更進一步,許多這類系統都可以指定和若干不同的遠端程式碼倉庫進行互動。籍此,你就可以在同一個專案中,分別和不同工作小組的人相互協作。 你可以根據需要設定不同的協作流程,比如層次模型式的工作流,而這在以前的集中式系統中是無法實現的。