SVN和Git對比梳理

散盡浮華發表於2016-09-25

 

在日常運維工作中,經常會用到版本控制系統,目前用到最廣泛的版本控制器就是SVN和Git,那麼這兩者之間有什麼不同之處呢?
SVN(Subversion)是集中式管理的版本控制器,而Git是分散式管理的版本控制器!這是兩者之間最核心的區別。
SVN只有一個單一的集中管理的伺服器,儲存所有檔案的修訂版本,而協同工作的人們都通過客戶端連到這臺伺服器,取出最新的檔案或者提交更新。
Git每一個終端都是一個倉庫,客戶端並不只提取最新版本的檔案快照,而是把原始的程式碼倉庫完整地映象下來。每一次的提取操作,實際上都是一次對程式碼倉庫的完整備份。Git不僅僅是個版本控制系統,它也是個內容管理系統(CMS),工作管理系統等。如果你是一個具有使用SVN背景的人,你需要做一定的思想轉換,來適應Git提供的一些概念和特徵。

---------------------------------------------------------------------------------------------------

集中式版本控制系統:
版本庫是集中存放在中央伺服器的,而幹活的時候,用的都是自己的電腦,所以要先從中央伺服器取得最新的版本,然後開始幹活,幹完活了,再把自己的活推送給中央伺服器。中央伺服器就好比是一個圖書館,你要改一本書,必須先從圖書館借出來,然後回到家自己改,改完了,再放回圖書館。

集中式版本控制系統最大的毛病就是必須聯網才能工作,如果在區域網內還好,頻寬夠大,速度夠快,可如果在網際網路上,遇到網速慢的話,可能提交一個10M的檔案就需要5分鐘,這還不得把人給憋死啊。

分散式版本控制系統:
首先,分散式版本控制系統根本沒有“中央伺服器”,每個人的電腦上都是一個完整的版本庫,這樣,你工作的時候,就不需要聯網了,因為版本庫就在你自己的電腦上。既然每個人電腦上都有一個完整的版本庫,那多個人如何協作呢?比方說你在自己電腦上改了檔案A,你的同事也在他的電腦上改了檔案A,這時,你們倆之間只需把各自的修改推送給對方,就可以互相看到對方的修改了。

和集中式版本控制系統相比,分散式版本控制系統的安全性要高很多,因為每個人電腦裡都有完整的版本庫,某一個人的電腦壞掉了不要緊,隨便從其他人那裡複製一個就可以了。而集中式版本控制系統的中央伺服器要是出了問題,所有人都沒法幹活了。

在實際使用分散式版本控制系統的時候,其實很少在兩人之間的電腦上推送版本庫的修改,因為可能你們倆不在一個區域網內,兩臺電腦互相訪問不了,也可能今天你的同事病了,他的電腦壓根沒有開機。因此,分散式版本控制系統通常也有一臺充當“中央伺服器”的電腦,但這個伺服器的作用僅僅是用來方便“交換”大家的修改,沒有它大家也一樣幹活,只是交換修改不方便而已。

當然,Git的優勢不單是不必聯網這麼簡單,後面我們還會看到Git極其強大的分支管理,把SVN等遠遠拋在了後面。

那麼Git和SVN兩者之間具體有哪些不同?下面詳細做下對比:
----------------------------------------------------------------------------------------------------------------
一、搞清楚兩種模式:集中式VS分散式
(1)SVN屬於集中式的版本控制系統
集中式的版本控制系統都有一個單一的集中管理的伺服器,儲存所有檔案的修訂版本,而協同工作的人們都通過客戶端連到這臺伺服器,取出最新的檔案或者提交更新。

SVN的特點概括起來主要由以下幾條:
1)每個版本庫有唯一的URL(官方地址),每個使用者都從這個地址獲取程式碼和資料;
2)獲取程式碼的更新,也只能連線到這個唯一的版本庫,同步以取得最新資料;
3)提交必須有網路連線(非本地版本庫);
4)提交需要授權,如果沒有寫許可權,提交會失敗;
5)提交併非每次都能夠成功。如果有其他人先於你提交,會提示“改動基於過時的版本,先更新再提交”… 諸如此類;
6)衝突解決是一個提交速度的競賽:手快者,先提交,平安無事;手慢者,後提交,可能遇到麻煩的衝突解決。

好處:每個人都可以一定程度上看到專案中的其他人正在做些什麼。而管理員也可以輕鬆掌控每個開發者的許可權。
缺點:中央伺服器的單點故障。
若是當機一小時,那麼在這一小時內,誰都無法提交更新、還原、對比等,也就無法協同工作。如果中央伺服器的磁碟發生故障,並且沒做過備份或者備份得不夠及時的話,還會有丟失資料的風險。最壞的情況是徹底丟失整個專案的所有歷史更改記錄,被客戶端提取出來的某些快照資料除外,但這樣的話依然是個問題,你不能保證所有的資料都已經有人提取出來。

簡單來說,SVN原理上只關心檔案內容的具體差異。每次記錄有哪些檔案作了更新,以及都更新了哪些行的什麼內容。

(2)Git屬於分散式的版本控制系統
Git記錄版本歷史只關心檔案資料的整體是否發生變化。Git 不儲存檔案內容前後變化的差異資料。
實際上,Git 更像是把變化的檔案作快照後,記錄在一個微型的檔案系統中。每次提交更新時,它會縱覽一遍所有檔案的指紋資訊並對檔案作一快照,然後儲存一個指向這次快照的索引。為提高效能,若檔案沒有變化,Git 不會再次儲存,而只對上次儲存的快照作一連線。

在分散式版本控制系統中,客戶端並不只提取最新版本的檔案快照,而是把原始的程式碼倉庫完整地映象下來。這麼一來,任何一處協同工作用的伺服器發生故障,事後都可以用任何一個映象出來的本地倉庫恢復。這類系統都可以指定和若干不同的遠端程式碼倉庫進行互動。籍此,你就可以在同一個專案中,分別和不同工作小組的人相互協作。你可以根據需要設定不同的協作流程。

另外,因為Git在本地磁碟上就儲存著所有有關當前專案的歷史更新,並且Git中的絕大多數操作都只需要訪問本地檔案和資源,不用連網,所以處理起來速度飛快。用SVN的話,沒有網路或者斷開VPN你就無法做任何事情。但用Git的話,就算你在飛機或者火車上,都可以非常愉快地頻繁提交更新,等到了有網路的時候再上傳到遠端的映象倉庫。換作其他版本控制系統,這麼做幾乎不可能,抑或是非常麻煩。

Git特點:
1)Git中每個克隆(clone)的版本庫都是平等的。你可以從任何一個版本庫的克隆來建立屬於你自己的版本庫,同時你的版本庫也可以作為源提供給他人,只要你願意。
2)Git的每一次提取操作,實際上都是一次對程式碼倉庫的完整備份。
3)提交完全在本地完成,無須別人給你授權,你的版本庫你作主,並且提交總是會成功。
4)甚至基於舊版本的改動也可以成功提交,提交會基於舊的版本建立一個新的分支。
5)Git的提交不會被打斷,直到你的工作完全滿意了,PUSH給他人或者他人PULL你的版本庫,合併會發生在PULL和PUSH過程中,不能自動解決的衝突會提示您手工完成。
6)衝突解決不再像是SVN一樣的提交競賽,而是在需要的時候才進行合併和衝突解決。

除此之外:
1)Git也可以模擬集中式的工作模式
Git版本庫統一放在伺服器中
可以為 Git 版本庫進行授權:誰能建立版本庫,誰能向版本庫PUSH,誰能夠讀取(克隆)版本庫
團隊的成員先將伺服器的版本庫克隆到本地;並經常的從伺服器的版本庫拉(PULL)最新的更新;
團隊的成員將自己的改動推(PUSH)到伺服器的版本庫中,當其他人和版本庫同步(PULL)時,會自動獲取改變
2)Git 的集中式工作模式非常靈活
你完全可以在脫離Git伺服器所在網路的情況下,如移動辦公/出差時,照常使用程式碼庫
你只需要在能夠接入Git伺服器所在網路時,PULL和PUSH即可完成和伺服器同步以及提交
Git提供rebase 命令,可以讓你的改動看起來是基於最新的程式碼實現的改動
3)Git有更多的工作模式可以選擇,遠非 Subversion能比的。

二、用法上理解
(1)Git是分散式的,而SVN不是分佈而是集中式的,需要說明的是Git並不是目前唯一的分散式版本控制系統,還有比如Mercurial等,所以說它們差不許多。不過話說回來Git跟Svn一樣有自己的集中式版本庫和Server端,但Git更傾向於分散式開發,因為每一個開發人員的電腦上都有一個LocalRepository以即使沒有網路也一樣可以Commit,檢視歷史版本記錄,建立專案分支等操作,等網路再次連線上Push到Server端。
從上面看GIt真的很棒,但是GIt adds Complexity,剛開始使用會有些疑惑,因為需要建兩個Repositories(Local Repositories & Remote Repositories),指令很多,除此之外你需要知道哪些指令在Local Repository,哪些指令在Remote Repository。

(2)Git把內容按後設資料方式儲存,而SVN是按檔案:因為git目錄是處於你的機器上的一個克隆版的版本庫,它擁有中心版本庫上所有的東西,例如標籤,分支,版本記錄等。.git目錄的體積大小跟.svn比較,你會發現它們差距很大。

(3)Git沒有一個全域性版本號,而SVN有:目前為止這是跟SVN相比Git缺少的最大的一個特徵。

(4)Git的內容的完整性要優於SVN: GIT的內容儲存使用的是SHA-1雜湊演算法。這能確保程式碼內容的完整性,確保在遇到磁碟故障和網路問題時降低對版本庫的破壞。

(5)Git下載下來後,在OffLine狀態下可以看到所有的Log,SVN不可以。

(6)剛開始用時很狗血的一點,SVN必須先Update才能Commit,忘記了合併時就會出現一些錯誤,git還是比較少的出現這種情況。
(7)克隆一份全新的目錄以同樣擁有五個分支來說,SVN是同時復製5個版本的檔案,也就是說重複五次同樣的動作。而Git只是獲取檔案的每個版本的 元素,然後只載入主要的分支(master)在我的經驗,克隆一個擁有將近一萬個提交(commit),五個分支,每個分支有大約1500個檔案的 SVN,耗了將近一個小時!而Git只用了區區的1分鐘!

(8)版本庫(repository):SVN只能有一個指定中央版本庫。當這個中央版本庫有問題時,所有工作成員都一起癱瘓直到版本庫維修完畢或者新的版本庫設立完成。而 Git可以有無限個版本庫。或者,更正確的說法,每一個Git都是一個版本庫,區別是它們是否擁有活躍目錄(Git Working Tree)。如果主要版本庫(例如:置於GitHub的版本庫)發生了什麼事,工作成員仍然可以在自己的本地版本庫(local repository)提交,等待主要版本庫恢復即可。工作成員也可以提交到其他的版本庫!

(9)分支(Brach)不同。
分支在SVN中一點不特別,分支在SVN就是版本庫中的另外一個完整目錄,且這個目錄擁有完整的實際檔案。如果你想知道是否合併了一個分支,你需要手工執行像這樣的命令svn propget svn:mergeinfo,來確認程式碼是否被合併。所以,經常會發生有些分支被遺漏的情況。如果工作成員想要開啟新的分支,那將會影響“全世界”!每個人都會擁有和你一樣的分支。如果你的分支是用來進行破壞工作(安檢測試),那將會像傳染病一樣,你改一個分支,還得讓其他人重新切分支重新下載,十分狗血。而 Git,每個工作成員可以任意在自己的本地版本庫開啟無限個分支。舉例:當我想嘗試破壞自己的程式(安檢測試),並且想保留這些被修改的檔案供日後使用, 我可以開一個分支,做我喜歡的事。完全不需擔心妨礙其他工作成員。只要我不合並及提交到主要版本庫,沒有一個工作成員會被影響。等到我不需要這個分支時, 我只要把它從我的本地版本庫刪除即可。無痛無癢。

然而,處理GIT的分支卻是相當的簡單和有趣。你可以從同一個工作目錄下快速的在幾個分支間切換。你很容易發現未被合併的分支,你能簡單而快捷的合併這些檔案。Git的分支名是可以使用不同名字的。例如:我的本地分支名為OK,而在主要版本庫的名字其實是master。最值得一提,我可以在Git的任意一個提交點(commit point)開啟分支!(其中一個方法是使用gitk –all 可觀察整個提交記錄,然後在任意點開啟分支。)

(10)提交(Commit)上的不同:在SVN,當你提交你的完成品時,它將直接記錄到中央版本庫。當你發現你的完成品存在嚴重問題時,你已經無法阻止事情的發生了。如果網路中斷,你根本沒辦法提交!而Git的提交完全屬於本地版本庫的活動。而你只需“推”(git push)到主要版本庫即可。Git的“推”其實是在執行“同步”(Sync)。

最後總結一下:
SVN的特點是簡單,只是需要一個放程式碼的地方時用是OK的。
Git的特點版本控制可以不依賴網路做任何事情,對分支和合並有更好的支援(這應該算是開發者最關心的地方)。

相關文章