Git 看這一篇就夠了

小齊本齊發表於2020-10-14

上一篇講 Git 的文章發出來沒想到效果特別好,很多讀者都要求繼續深入的寫。

那今天齊姐簡單講下 Git 的實現原理,知其所以然才能知其然;並且梳理了日常最常用的 12 個命令,分為三大類分享給你。

本文的結構如下:

  1. 作者和開發原由
  2. Git 的資料模型
  3. 常用命令
  4. 資源推薦

作者和開發原由

Talk is cheap. Show me the code.

這句話就出自 Linux 和 Git 的作者
Linus Torvalds

原本 Linux 核心的版本控制系統是用的 BitKeeper,然而 2005 年,BitMover 公司不再讓 Linux 開發團隊免費使用了。。

Linus 一聽,不給用了?老子自己寫!

於是,大佬十天之內完成了 Git 的第一個版本。

所以 Git 是一個免費的、開源的版本控制系統。

版本控制系統

版本控制其實每個人都用過,那些年修改過的簡歷:

小齊簡歷 2012 版
小齊簡歷 2013 版
小齊簡歷 2014 版
小齊簡歷 2015 版
小齊簡歷 2016 版
小齊簡歷 2017 版
小齊簡歷 2018 版
小齊簡歷 2019 版
...

還有那些年打死都不再改的畢業論文:

畢業論文最終版
畢業論文最最終版
畢業論文最最最終版
畢業論文最最最最終版
畢業論文最終不改版
畢業論文最終真不改版
畢業論文最終真真不改版
畢業論文最終打死不改版
畢業論文最終打死不改版 2
...

沒錯,這就是本地版本控制系統。

很明顯,好處是簡單,但是隻能一個人在這改,無法和他人完成合作。那麼以下兩種主流的版本控制系統應運而生。

1. 集中化版本控制系統

Centralized Version Control Systems (CVCS)

比如:CVS, Subversion, Perforce, etc.

這種版本控制系統有一個單一的集中管理的伺服器,儲存所有檔案的最新版本,大家可以通過連線到這臺伺服器上來獲取或者提交檔案。

這種模式相對本地版本控制系統是有所改進的,但是缺點也很明顯,如果伺服器當機,那麼輕則耽誤工作、重則資料丟失。於是分散式版本控制系統應運而生。

2. 分散式版本控制系統

Distributed Version Control Systems (DVCS)

比如:Git, Mercurial, Bazaar, etc.

分散式的版本控制系統會把程式碼倉庫完整地映象下來,這樣任何一個伺服器發生故障,都可以用其他的倉庫來修復。

更進一步,這種模式可以更方便的和不同公司的人進行同一專案的開發,因為兩個遠端程式碼倉庫可以互動,這在之前的集中式系統中是無法做到的。

那麼什麼叫“把程式碼倉庫完整地映象下來”呢?

CVCS 每個版本存放的是當前版本與前一個版本的差異,因此也被稱作基於差異的版本控制 (delta-based);

Git 儲存的是所有檔案的一個快照 (snapshot),如果有的檔案沒有修改,那就只保留一個 reference 指向之前儲存的檔案。

不是很好理解?那接著看吧~

Git 的資料模型

1. 什麼是快照 (snapshot) 呢?

首先我們來學兩個 Git 中的術語:

  • blob, 就是單個的檔案;
  • tree, 就是一個資料夾。

快照則是被追蹤的最頂層的樹。

比如我的“公眾號”資料夾的這麼一個結構:

那麼一個快照就是追蹤的“公眾號”這顆樹。

2. 本地庫的資料模型

Git 記錄了每個快照的 parent,也就是當前這個資料夾的上一個版本。

那麼快照的迭代更新的過程就可以表示為一個有向無環圖,是不是很熟悉?我們在「拓撲」那篇文章裡講過,忘了的小夥伴快去公眾號內回覆「拓撲」獲取拓撲的入門文章吧~

每個快照其實都對應了一次 commit,我們用程式碼來表示一下:

class commit {
  array<commit> parents
  String author
  String message
  Tree snapshot
}

這就是 Git 的資料模型。

blob, tree, snapshot 其實都一樣,它們在 Git 中都是物件,都可以被引用或者被搜尋,會基於它們的 SHA-1 hash 進行定址。

git cat-file -t: 檢視每個 SHA-1 的型別;
git cat-file -p: 檢視每個物件的內容和簡單的資料結構。

但是通過這個雜湊值來搜尋也太不方便了,畢竟這是一串 40 位的十六進位制字元,就是第二部分 git log 裡輸出的那個編碼

因此,Git 還給了一個引用 reference

比如,我們常見的 HEAD 就是一個特殊的引用。

本地庫就是由 物件引用 構成的,或者叫 Repositories.

在硬碟上,Git 只儲存 物件引用,所有的 Git 命令都對應提交一個快照。

那有哪些常用命令呢?

常用命令

本章分三大部分介紹日常常用命令:

  • 本地操作
  • 和遠端庫的互動
  • 團隊協作 - 分支

本地操作

在學習常用命令之前,你首先需要知道的 Git 的「三個分割槽」和對應的檔案的「三種狀態」:

  • 工作區:就是你本地實際寫程式碼的地方,無論你是用 vim 直接改也好,還是在 IDE 裡寫,都無所謂。

    • 對應的檔案狀態是:modified,已修改,但還沒儲存到資料庫中。
  • 暫存區:就是臨時存放的地方。

    • 對應的檔案狀態是:staged,Git 已經對該檔案做了標記,下次提交知道要包含它。
  • 本地庫:存放本地歷史版本資訊。

    • 對應的檔案狀態是:committed,檔案已經安全的儲存在本地資料庫中。

1. $ git add

工作區改完了程式碼,就用 git add 提交到暫存區。

這裡如果檔案改動的比較多,但又不是每個都需要提交,我會設定 git ignore file,就表示這些檔案不要提交,比如在 build project 的時候會自動生成的那些檔案等等。

2. &dollar; git commit -m "comment"

從暫存區提交到本地庫,就需要用 commit。

一般後面都會跟個 -m 加句 comment,簡單說下改動的內容或者原因,我們公司大家預設也會把 Jira連結附上,這樣就知道這個改動對應哪個任務。

那如果想再改,再重新 git add 即可,但是 commit 這句需要改成

$ git commit --amend

這樣就還是一條 git log 資訊。

3. &dollar; git log

git log 可以檢視到提交過的資訊,從近到遠顯示每次 commit 的 comment 還有作者、日期等資訊,比如大概長這個樣子:

commit 5abcd17dggs9s0a7a91nfsagd8ay76875afs7d6
Author: Xiaoqi<xiaoqi@163.com>
Date: xxx xxx xxx
改了 Test 檔案

commit 後面的這個編號,是每次歷史記錄的一個索引。比如如果需要對版本進行前進或者後退的時候,就需要用到它。

這樣列印的 log 太多,更簡潔的列印方式是:

$ git log --oneline

就一行列印出來了。

或者:

$ git reflog

更常用一些。

4. &dollar; git reset

那我們剛剛說過,如果需要前進或退回到某個版本,就用

$ git reset --hard <編號>

這樣就直接跳到了這個編號對應的那個版本。

那麼這個 hard 是什麼意思呢?

這裡有 3 個引數:hard, soft, mixed,我們一一來說一下。

回到我們最重要的這張圖上來:

我們剛剛說的前進或後退到某一版本,是對本地庫進行的操作。

那有個問題:
本地庫的程式碼跳到那個版本之後,工作區和暫存區的程式碼就和本地庫的不同步了呀!

那這些引數就是用來控制這些是否同步的。

&dollar; git reset --hard xxx

三個區都同步,都跳到這個 xxx 的版本上。

&dollar; git reset --soft xxx

前面兩個區不同步,就只有本地庫跳到這個版本。

&dollar; git reset --mixed xxx

暫存區同步,工作區不動。

所以呢,用的多的就是 hard.

遠端互動

和遠端庫的互動主要是,也就是寫入和讀取。

5. $ git push

小齊寫完了程式碼,要提交到公司的程式碼庫裡,這個過程要用 git push.

當然了,這麼用會被打的。。畢竟還要 cr 呢。

5. $ git clone

新來的實習生首先要 clone 整個專案到本地來,然後才能增刪改查。

當然了實際工作中也沒人這麼用。。因為每家公司都會有自己包裝的工具。不過如果是做 Github 上的開源專案,就用得上了。

6. $ git pull

小齊提交了新的程式碼之後,領導要審查呀,所以用 git pull 把最新的程式碼拉取下來瞅瞅。

實際上呢,

git pull = fetch + merge

7. $ git fetch

git fetch 這個操作是將遠端庫的資料下載到本地庫,但是工作區中的檔案沒有更新。

而要談 get merge,我們還需要先講下分支

mergegit pull 預設的選項,合併其實還有另外一種方法:rebase,中文叫做變基

8. $ git rebase

rebase 的作用更多的是來整合分叉的歷史,可以將某個分支上的所有修改都移到另一分支上,就像是變了基底。

分支與合併

首先我們來看幾個關於分支的基本操作:

9. 檢視分支:

$ git branch

類似於ls,能夠列出當前所有分支。

git branch -v 能夠顯示更多資訊。

10. 建立分支:

$ git branch <branchName>

11. 切換分支:

$ git checkout <branchName>

有了分支之後必然會有合併:

12. 合併分支:

$ git merge <branchName>

而合併時就可能會有衝突,什麼時候會有衝突呢?:

在同一個檔案的同一個位置修改時。

因為 Git 會努力的把你們改動不同的地方合併在一起,但如果實在是在同一個地方改的,那它也沒辦法了,只能留給程式設計師去手動處理了。

當然了,每個命令延伸下去還有無限多個,本文不可能涵蓋全部,所以在此重磅推薦齊姐精心挑選的三大學習資源,大家可以自行享用~

學習資源

git help

其實我個人使用最多的是git help

真心方便又好用啊!

比如 git help pull:

先介紹了有哪些引數,然後 description 詳細解釋了它的工作原理,下面還有圖解,有木有太香!!

不過這種方式更像是 cheatsheet,當你已經知道了這個命令、只是忘了它的用法的時候去查。

如果你想系統的學習,那麼下面 ? 的更適合你。

Pro Git

這本書是強烈推薦了!!

Pro Git 這本書不僅講了 Git 的基礎用法、高階用法,以及最後還深入講解了 Git 的原理,非常細緻全面。

書的電子版也能在網站上直接下載。

英文版:

  • https://git-scm.com/book/en/v2

中文版:

  • https://git-scm.com/book/zh/v2

玩遊戲

Practice makes perfect!

推薦一個寶藏資源:玩遊戲來練 Git

專案:https://github.com/pcottle/learnGitBranching

網址:https://learngitbranching.js.org/

我熟悉很多工具都是通過小遊戲來練習的,比如 vim 的操作,還是蠻推薦這種方式的。就不劇透啦,大家自己去探索吧~

相關文章