Git算不算程式設計師的必備技能?

weixin_34377065發表於2018-04-26

點選關注非同步圖書,置頂公眾號

每天與你分享 IT好書 技術乾貨 職場知識

Git算不算程式設計師的必備技能?

​​參與文末話題討論,每日贈送非同步圖書。

——非同步小編

Git的背後有著一個非常精彩的成功故事。2005年4月,Linus Torvalds因不滿當時任何一個可用的開源版本控制系統,就親自著手實現了Git

時至今日,如果我們在Google中搜尋“git version control”這幾個關鍵詞,都會看到數以百萬計的返回結果。Git已經儼然成為了新型開源專案的一個標準。許多大型的開源專案都已經或正在計劃遷移到Git上來。Git算不算程式設計師的必備技能?答案是肯定

為什麼要用Git?

站在巨人的肩膀上,我們要特別感謝Linus Torvalds、Junio C. Hamano以及Git專案的眾多提交者,是他們給開發者社群帶來了這個奇妙的工具。

  • Git允許我們利用分支來開展工作:在一個由多個開發者並行協作的專案中,開發者各自會有很多不同的開發路線。Git的優勢在於,它提供了一整套針對開發鏈的重新整合工具,以便我們對其進行合併、變基和撿取等操作。
  • 工作流上的靈活性:Git非常靈活。不但單一開發者可以用它,敏捷團隊也可以找到使用它工作的合適方法,甚至一個由眾多開發者在不同的工作地點參與的大型國際專案也可以用它開發出一個很好的工作流。
  • 適合奉獻合作:大多數開源專案所依靠的都是開發者的無私奉獻。因此,讓這種無私奉獻的方式儘可能地簡單化是一件非常重要的事。而這在一個集中式的版本控制系統中通常是很難做到的,因為我們不可能讓所有人都有許可權去寫版本庫。但如果我們使用Git,那麼每個人都先可以克隆一個獨立的工作版本庫,然後再對其進行後續的改動。
  • 高效能:Git在處理擁有許多檔案且歷史悠久的專案時速度也依然是非常快的。例如,使用Git將Linux核心原始碼的當前版本切換到6年前的舊版本時,在一臺MacBook Air上所需的時間不到1分鐘。考慮這兩個版本之間有著超過200000次的提交和40000個更改檔案,這已經足以讓人印象深刻了。
  • 強大的抗故障和抗攻擊能力:由於專案歷史被分散儲存在多個分散式版本庫中,因此資料嚴重流失的可能性不大。再加上版本庫中有著巧妙簡單的資料結構,這確保了其中的資料即使在遙遠的未來也仍然會被正確地解釋。而且,它還使用了統一的加密校驗,這使得攻擊者難以對版本庫進行篡改。
  • 離線開發與多點開發:分散式的體系結構可以使得離線開發或者邊旅行邊開發的方式變得非常容易。而且該結構在多點開發模式下,我們既不需要設定中央伺服器,也不需要固定的網路連線。
  • 強大的開源社群:除官方提供的詳細文件外,你還可以在該社群找到無數相關的手冊、論壇、維基網站等,另外還有各種工具生態系統、託管平臺、出版物、服務以及針對各個開發環境的外掛,整個社群都正在茁壯成長。
  • 可擴充套件性:Git為使用者提供了許多實用命令,其中包括了能使我們更便於直接訪問其遠端版本庫的命令。這可以讓Git變得非常靈活,這種靈活性將允許其各種獨立應用提供比預設的Git版本更為強大的功能。

為什麼要用工作流

Git非常靈活。可為多種不同的角色所用,從偶爾需要版本化少量shell指令碼的單一系統管理員,到Linux核心專案中的上百個開發人員,一切皆有可能。當然,這種靈活性不是沒有代價的。在開始用Git來開展工作之前,你還必須要做一組決定。例如以下幾種。

Git中固然已經是分散式版本庫。但你是真的打算只在本地工作,還是更願意建立一箇中央版本庫?

Git支援push和pull兩種資料傳輸型別,但我們需要同時使用它們嗎?如果讓你選,你會選哪一個?為什麼不是另一個?

分支與合併是Git中兩個強大的功能。但是,我們應該開多少個分支呢?是根據每個軟體功能來開?還是針對每個發行版來開?還是隻該有一個分支?

為了便於入門,下面我們來總結一下工作流及其作用

  • 工作流指的是相關專案的日常操作規程。
  • 工作流會給出具體的步驟。
  • 工作流會顯示必要的命令和選項。
  • 工作流非常適用於密切的團隊合作,而目前的這些現代軟體專案通常就出自這樣的合作。

一些工作流可能並不是目標問題唯一正確的解決方案,但它們是一個很好的起點,我們可以從中為自己的專案開發出高效的工作流。

我們之所以會重點介紹商業專案中敏捷開發團隊的工作,是因為我們相信目前許多專業開發者(包括作者)都處於這樣的工作環境中。當然,這裡並不包括那些具有特殊要求的大型專案,因為這些專案通常有著很誇張的工作流,而且我們相信這些也不是大多數開發者會感興趣的專案。另外,這裡也不包括那些開源專案的開發,雖然這些專案也可以用Git規劃出一個很有意思的工作流。

分散式版本控制,有什麼過人之處

在具體探討分散式版本控制的概念之前,讓我們先來快速回顧一下傳統的集中式版本控制架構。

圖1.1中所顯示的就是一個集中式版本控制系統(例如CVS或Subversion)的典型佈局。每個開發者都在他或她自己的計算機上有一個包含所有專案檔案的工作目錄(即工作區)。當該開發者在本地做了修改之後,他或她就會定期將修改提交給某臺中央伺服器。然後,開發者在執行更新操作的同時也會從該伺服器上撿取出其他開發者所做的修改。這臺中央伺服器上儲存著這些檔案(即版本庫)的當前版本和歷史版本。因此,這些被並行開發的分支,以及各種被命名(標記)的版本都將會被集中管理。

Git算不算程式設計師的必備技能?

​圖1.1 集中式版本控制

而在分散式版本控制系統(見圖1.2)中,開發者環境與伺服器環境之間是沒有分隔的。每一個開發者都同時擁有一個用於當前檔案操作的工作區與一個用於儲存該專案所有版本、分支以及標籤的本地版本庫(我們稱其為一份克隆)。每個開發者的修改都會被載入成一次次的新版本提交(commit), 首先提交到其本地版本庫中。然後,其他開發者就會立即看到新的版本。通過推送(push)和拉回(pull)命令,我們可以將這些修改從一個版本庫傳送到另一個版本庫中。這樣一來,從技術上來看,這裡所有的版本庫在分散式架構上的地位是同等的。因此從理論上來講,我們不再需要藉助伺服器,就可以將某一臺開發工作機上所做的所有修改直接傳送給另一開發工作機。當然在具體實踐中,Git中的伺服器版本庫也扮演了重要的角色,例如以下這些特型版本庫。

Git算不算程式設計師的必備技能?

​​圖1.2 分散式版本控制

  • 專案版本庫(blessed repository):該版本庫主要用於儲存由“官方”建立併發行的版本。
  • 共享版本庫(shared repository):該版本庫主要用於開發團隊內人員之間的檔案交換。在小型專案中,專案版本庫本身就可以勝任這一角色了。但在多點開發的條件下,我們可能就會需要幾個這樣的專用版本庫。
  • 工作流版本庫(workflow repository):工作流版本庫通常只用於填充那些代表工作流中某種特定進展狀態的修改,例如稽核通過後的狀態等。
  • 派生版本庫(fork repository):該版本庫主要用於從開發主線分離出某部分內容(例如,分離出那些開發耗時較長,不適合在一個普通釋出週期中完成的內容),或者隔離出可能永遠不會被包含在主線中的、用於實驗的那部分開發進展。

下面,我們再來看看分散式系統相對於集中式的優點有哪些。

  • 高效能:幾乎所有的操作都無需進行網路訪問,均可直接在本地執行。
  • 高效的工作方式:開發者可通過多個本地分支在不同任務之間進行快速切換。
  • 離線功能:開發者可以在沒有伺服器連線的情況下執行提交、建立分支、版本標籤等操作。之後再將其上傳伺服器。
  • 靈活的開發程式:我們可以在團隊和公司中為其他部門建立專用的版本庫,例如為方便與測試人員交流而建的版本庫。這樣相關修改就很容易釋出,因為只是特定版本庫上的一次推送。
  • 備份作用:由於每個開發者都持有一份擁有完整歷史版本的版本庫副本,所以因伺服器故障而導致資料丟失的可能性是微乎其微的。
  • 可維護性:對於那些難以對付的重構工作,我們可以在將成功傳送給其原始版本庫之前,先在該版本庫的副本上嘗試一下。

版本庫,分散式的基礎所在

其實,版本庫本質上就是一個高效的資料儲存結構而已,由以下部分組成。

檔案(即blob):這裡既包含了文字也包含了二進位制資料,這些資料將不以檔名的形式被儲存。

目錄(即Tree):目錄中儲存的是與檔名相關聯的內容,其中也會包含其他目錄。

版本(即commit):每一個版本所定義的都是相應目錄的某個可恢復的狀態。每當我們建立一個新的版本時,其作者、時間、註釋以及其之前的版本都將會被儲存下來。

對於所有的資料,它們都會被計算成一個十六進位制雜湊值(例如像1632acb65b01 c6b621d6e1105205773931bb1a41這樣的值)。這個雜湊值將會被用作相關物件的引用,以及日後恢復資料時所需的鍵值(見圖1.3)。

Git算不算程式設計師的必備技能?

​圖1.3 版本庫中的物件儲存


也就是說,一個提交物件的雜湊值實際上就是它的“版本號”,如果我們持有某一提交的雜湊值,就可以用它來檢查對應版本是否存在於某一版本庫中。如果存在,我們就可以將其恢復到當前工作區相應的目錄中。如果該版本不存在,我們也可以從其他版本庫中單獨匯入(拉回)該提交所引用的全部物件。

接下來,我們來看看採用這種雜湊值和這種既定的版本庫結構究竟有哪些優勢。

  • 高效能:通過雜湊值來訪問資料是非常快的。
  • 冗餘度——釋放儲存空間:相同的檔案內容只需儲存一次即可。
  • 分散式版本號:由於相關雜湊值是根據檔案,作者和日期來計算的,所以版本也可以“離線”產生,不用擔心將來會因此而發生版本衝突。
  • 版本庫間的高效同步:當我們將某一提交從一個版本庫傳遞給另一個版本庫時,只需要傳送那些目標版本庫中不存在的物件即可。而正是因為有了雜湊值的幫助,我們才能很快地判斷相關物件是否已經存在。
  • 資料完整性:由於雜湊值是根據資料的內容來計算的,所以我們可以隨時通過Git來檢視某一雜湊值是否與相關資料匹配。以檢測該資料上可能的意外變化或惡意操作。
  • 自動重新命名檢測:被重新命名的檔案可以被自動檢測到,因為根據該檔案內容計算出的雜湊值並沒有發生變化。也正因為如此,Git中並沒有專用的重新命名命令,只需移動命令即可。

分支的建立與合併很簡單

對於大多數版本控制系統來說,分支的建立與合併通常會因其特殊性而被認為是高階擴充操作。但由於Git最初就是為了方便那些散落在世界各地的Linux核心開發者而建立的,合併多方努力的結果一直都是其面臨的最大挑戰之一,所以Git的設計目標之一就是要讓分支的建立與合併操作變得儘可能地簡單且安全。

在下面的圖1.4中,我們向你展示了開發者是如何通過建立分支的方式來進行並行開發的。圖中的每一個點都代表了該專案的一個版本(即commit)。而由於在Git中,我們只能對整個專案進行版本化,所以每個點同時也代表了屬於同一版本的各個檔案。

Git算不算程式設計師的必備技能?

​圖1.4 因開發者的並行開發而出現的分支建立操作

如上所示,圖中兩位開發者的起點是同一個版本。之後兩人各自做了修改,並提交了修改。這時候,對於這兩位開發者各自的版本庫來說,該專案已經有了兩個不同的版本。也就是說,他們在這裡建立了兩個分支。接下來,如果其中一個開發者想要匯入另一個人的修改,他/她就可以用Git來進行版本合併。如果合併成功了,Git就會建立一個合併提交,其中會包含兩位開發者所做的修改。這時如果另一位開發者也取回了這一提交,兩位開發者的專案就又回到了同一個版本。

在上面的例子中,分支的建立是非計劃性的,其原因僅僅是兩個開發者在並行開發同一個軟體罷了。在Git中,我們當然也可以開啟有針對性的分支,即顯式地建立一個分支(見圖1.5)。顯式分支通常主要用於協調某一種功能性的並行開發。

Git算不算程式設計師的必備技能?

​圖1.5 針對不同任務的顯式分支

版本庫在執行拉回和推送操作時,可以具體指定其針對的是哪一些分支。當然,除了這些簡單的分支建立和合並處理外,我們也可以對分支執行以下動作。

  • 移植分支:我們可以直接將某一分支中的提交轉移到另一個版本庫中。
  • 只傳送特定修改:我們可以將某一分支中的某一次或某幾次提交直接複製到另一個分支中。這就是所謂的撿取處理。
  • 清理歷史:我們可以對分支歷史進行改造、排序和刪除。這有利於為該專案建立更好的歷史文件。我們稱這種處理為互動式重訂(interactive rebasing)。

另外,如果你是一個繁忙的專案管理者,還在猶豫不決是否要採用Git

該讀什麼書?

Git算不算程式設計師的必備技能?

​《Git高手之路》

Jakub Narębski 著

點選封面購買紙書


本書面向所有的Git使用者,全面細緻地向讀者介紹有關Git的各項實用技巧,充分發掘它的潛力,更好地實現專案版本管理。學習本書,可以幫助讀者更好地運用Git,提升軟體開發效率。

本書作者Jakub Narębski自Git誕生之初就參與了Git的開發工作。他是gitweb子系統(Git原始Web介面)的主要貢獻者之一,是非官方的gitweb維護者。

Git算不算程式設計師的必備技能?

《Git學習指南》

【德】René Preißel(普萊貝爾), Bjørn Stachmann(斯拉赫曼) 著

點選封面購買紙書


Git 是當今最流行的版本控制系統。本書並不偏重理論介紹,也不面面俱到,而是一本學習Git的實用指南。本書首先介紹了Git 的基礎知識,然後關注于敏捷開發,並給出工作流展示瞭解決現實問題所需的命令和選項。

Git算不算程式設計師的必備技能?

​《Git版本控制管理(第2版)》

【美】Jon Loeliger , Matthew McCullough 著

點選封面購買紙書

市面上絕無僅有的Git圖書 全面剖析Git的用法 同時涵蓋GitHub

本書可以讓讀者迅速上手Git,用它來跟蹤、分支、合併和管理程式碼變更。本書通過一系列步驟式教程,引導讀者迅速掌握從Git基礎知識到高階使用技巧在內的所有知識,並提供友好而嚴謹的建議,以幫助讀者熟悉Git的許多功能。

本書在上一版的基礎之上進行了全面更新,包含了操作樹的技巧,全面覆蓋了reflog和stash的用法,還全面介紹了GitHub倉庫。一旦你掌握了Git系統的靈活性之後,你可以以近乎無限的各種方式來管理程式碼開發,而本書則會告訴你怎麼來做。

今日互動

你用過Git嗎?截止時間4月29日17時,留言+轉發本活動到朋友圈,小編將抽獎選出5名讀者贈送e讀版100元非同步社群代金券一張,(留言點贊最多的自動獲得一張)。

Git算不算程式設計師的必備技能?

推薦閱讀

2018年4月新書書單

非同步圖書最全Python書單

一份程式設計師必備的演算法書單

第一本Python神經網路程式設計圖書

Git算不算程式設計師的必備技能?

​長按二維碼,可以關注我們喲

每天與你分享IT好文。


在“

非同步圖書
”後臺回覆“
關注
”,即可免費獲得
2000門線上視訊課程
;推薦朋友關注根據提示獲取贈書連結,免費得非同步e讀版圖書一本。趕緊來參加哦!

掃一掃上方二維碼,回覆“關注”參與活動!

點選閱讀原文,直接購買《Git高手指南》

閱讀原文​



相關文章