每天5分鐘玩轉Docker容器技術（三）

阿里云云棲社群發表於2017-12-28

base 映象

上一節我們介紹了最小的 Docker 映象，本節討論 base 映象。

base 映象有兩層含義：

不依賴其他映象，從 scratch 構建。
其他映象可以之為基礎進行擴充套件。

所以，能稱作 base 映象的通常都是各種 Linux 發行版的 Docker 映象，比如 Ubuntu, Debian, CentOS 等。

我們以 CentOS 為例考察 base 映象包含哪些內容。

下載映象：docker pull centos

檢視映象資訊：

映象大小不到 200MB。

等一下！
一個 CentOS 才 200MB ？
平時我們安裝一個 CentOS 至少都有幾個 GB，怎麼可能才 200MB !

相信這是幾乎所有 Docker 初學者都會有的疑問，包括我自己。下面我們來解釋這個問題。

Linux 作業系統由核心空間和使用者空間組成。如下圖所示：

rootfs

核心空間是 kernel，Linux 剛啟動時會載入 bootfs 檔案系統，之後 bootfs 會被解除安裝掉。

使用者空間的檔案系統是 rootfs，包含我們熟悉的 /dev, /proc, /bin 等目錄。

對於 base 映象來說，底層直接用 Host 的 kernel，自己只需要提供 rootfs 就行了。

而對於一個精簡的 OS，rootfs 可以很小，只需要包括最基本的命令、工具和程式庫就可以了。相比其他 Linux 發行版，CentOS 的 rootfs 已經算臃腫的了，alpine 還不到 10MB。

我們平時安裝的 CentOS 除了 rootfs 還會選裝很多軟體、服務、圖形桌面等，需要好幾個 GB 就不足為奇了。

base 映象提供的是最小安裝的 Linux 發行版。

下面是 CentOS 映象的 Dockerfile 的內容：

第二行 ADD 指令新增到映象的 tar 包就是 CentOS 7 的 rootfs。在製作映象時，這個 tar 包會自動解壓到 / 目錄下，生成 /dev, /proc, /bin 等目錄。

注：可在 Docker Hub 的映象描述頁面中檢視 Dockerfile 。

支援執行多種 Linux OS

不同 Linux 發行版的區別主要就是 rootfs。

比如 Ubuntu 14.04 使用 upstart 管理服務，apt 管理軟體包；而 CentOS 7 使用 systemd 和 yum。這些都是使用者空間上的區別，Linux kernel 差別不大。

所以 Docker 可以同時支援多種 Linux 映象，模擬出多種作業系統環境。

上圖 Debian 和 BusyBox（一種嵌入式 Linux）上層提供各自的 rootfs，底層共用 Docker Host 的 kernel。

這裡需要說明的是：

1. base 映象只是在使用者空間與發行版一致，kernel 版本與發行版是不同的。
例如 CentOS 7 使用 3.x.x 的 kernel，如果 Docker Host 是 Ubuntu 16.04（比如我們的實驗環境），那麼在 CentOS 容器中使用的實際是是 Host 4.x.x 的 kernel。

① Host kernel 為 4.4.0-31

② 啟動並進入 CentOS 容器

③ 驗證容器是 CentOS 7

④ 容器的 kernel 版本與 Host 一致

2. 容器只能使用 Host 的 kernel，並且不能修改。
所有容器都共用 host 的 kernel，在容器中沒辦法對 kernel 升級。如果容器對 kernel 版本有要求（比如應用只能在某個 kernel 版本下執行），則不建議用容器，這種場景虛擬機器可能更合適。

映象的分層結構

Docker 支援通過擴充套件現有映象，建立新的映象。

實際上，Docker Hub 中 99% 的映象都是通過在 base 映象中安裝和配置需要的軟體構建出來的。比如我們現在構建一個新的映象，Dockerfile 如下：

① 新映象不再是從 scratch 開始，而是直接在 Debian base 映象上構建。

② 安裝 emacs 編輯器。

③ 安裝 apache2。

④ 容器啟動時執行 bash。

構建過程如下圖所示：

可以看到，新映象是從 base 映象一層一層疊加生成的。每安裝一個軟體，就在現有映象的基礎上增加一層。

問什麼 Docker 映象要採用這種分層結構呢？

最大的一個好處就是 - 共享資源。

比如：有多個映象都從相同的 base 映象構建而來，那麼 Docker Host 只需在磁碟上儲存一份 base 映象；同時記憶體中也只需載入一份 base 映象，就可以為所有容器服務了。而且映象的每一層都可以被共享，我們將在後面更深入地討論這個特性。

這時可能就有人會問了：如果多個容器共享一份基礎映象，當某個容器修改了基礎映象的內容，比如 /etc 下的檔案，這時其他容器的 /etc 是否也會被修改？

答案是不會！

修改會被限制在單個容器內。

這就是我們接下來要學習的容器 Copy-on-Write 特性。

可寫的容器層

當容器啟動時，一個新的可寫層被載入到映象的頂部。
這一層通常被稱作“容器層”，“容器層”之下的都叫“映象層”。

所有對容器的改動 - 無論新增、刪除、還是修改檔案都只會發生在容器層中。

只有容器層是可寫的，容器層下面的所有映象層都是隻讀的。

下面我們深入討論容器層的細節。

映象層數量可能會很多，所有映象層會聯合在一起組成一個統一的檔案系統。如果不同層中有一個相同路徑的檔案，比如 /a，上層的 /a 會覆蓋下層的 /a，也就是說使用者只能訪問到上層中的檔案 /a。在容器層中，使用者看到的是一個疊加之後的檔案系統。

新增檔案在容器中建立檔案時，新檔案被新增到容器層中。
讀取檔案在容器中讀取某個檔案時，Docker 會從上往下依次在各映象層中查詢此檔案。一旦找到，立即將其複製到容器層，然後開啟並讀入記憶體。
修改檔案在容器中修改已存在的檔案時，Docker 會從上往下依次在各映象層中查詢此檔案。一旦找到，立即將其複製到容器層，然後修改之。
刪除檔案在容器中刪除檔案時，Docker 也是從上往下依次在映象層中查詢此檔案。找到後，會在容器層中記錄下此刪除操作。

只有當需要修改時才複製一份資料，這種特性被稱作 Copy-on-Write。可見，容器層儲存的是映象變化的部分，不會對映象本身進行任何修改。

這樣就解釋了我們前面提出的問題：容器層記錄對映象的修改，所有映象層都是隻讀的，不會被容器修改，所以映象可以被多個容器共享。

構建映象

對於 Docker 使用者來說，最好的情況是不需要自己建立映象。幾乎所有常用的資料庫、中介軟體、應用軟體等都有現成的 Docker 官方映象或其他人和組織建立的映象，我們只需要稍作配置就可以直接使用。

使用現成映象的好處除了省去自己做映象的工作量外，更重要的是可以利用前人的經驗。特別是使用那些官方映象，因為 Docker 的工程師知道如何更好的在容器中執行軟體。

當然，某些情況下我們也不得不自己構建映象，比如：

找不到現成的映象，比如自己開發的應用程式。
需要在映象中加入特定的功能，比如官方映象幾乎都不提供 ssh。

所以本節我們將介紹構建映象的方法。同時分析構建的過程也能夠加深我們對前面映象分層結構的理解。

Docker 提供了兩種構建映象的方法：

docker commit 命令
Dockerfile 構建檔案

docker commit

docker commit 命令是建立新映象最直觀的方法，其過程包含三個步驟：

執行容器
修改容器
將容器儲存為新的映象

舉個例子：在 ubuntu base 映象中安裝 vi 並儲存為新映象。

第一步，執行容器

-it 引數的作用是以互動模式進入容器，並開啟終端。412b30588f4a 是容器的內部 ID。

安裝 vi

確認 vi 沒有安裝。

安裝 vi。

儲存為新映象
在新視窗中檢視當前執行的容器。

silly_goldberg 是 Docker 為我們的容器隨機分配的名字。

執行 docker commit 命令將容器儲存為映象。

新映象命名為 ubuntu-with-vi。

檢視新映象的屬性。

從 size 上看到映象因為安裝了軟體而變大了。

從新映象啟動容器，驗證 vi 已經可以使用。

以上演示瞭如何用 docker commit 建立新映象。然而，Docker 並不建議使用者通過這種方式構建映象。原因如下：

這是一種手工建立映象的方式，容易出錯，效率低且可重複性弱。比如要在 debian base 映象中也加入 vi，還得重複前面的所有步驟。
更重要的：使用者並不知道映象是如何建立出來的，裡面是否有惡意程式。也就是說無法對映象進行審計，存在安全隱患。

既然 docker commit 不是推薦的方法，我們幹嘛還要花時間學習呢？

原因是：即便是用 Dockerfile（推薦方法）構建映象，底層也 docker commit 一層一層構建新映象的。學習 docker commit 能夠幫助我們更加深入地理解構建過程和映象的分層結構。

Dockerfile 構建映象

Dockerfile 是一個文字檔案，記錄了映象構建的所有步驟。

第一個 Dockerfile

用 Dockerfile 建立上節的 ubuntu-with-vi，其內容則為：

下面我們執行 docker build 命令構建映象並詳細分析每個細節。

① 當前目錄為 /root。

② Dockerfile 準備就緒。

③ 執行 docker build 命令，-t 將新映象命名為 ubuntu-with-vi-dockerfile，命令末尾的 . 指明 build context 為當前目錄。Docker 預設會從 build context 中查詢 Dockerfile 檔案，我們也可以通過 -f 引數指定 Dockerfile 的位置。

④ 從這步開始就是映象真正的構建過程。首先 Docker 將 build context 中的所有檔案傳送給 Docker daemon。build context 為映象構建提供所需要的檔案或目錄。
Dockerfile 中的 ADD、COPY 等命令可以將 build context 中的檔案新增到映象。此例中，build context 為當前目錄 /root，該目錄下的所有檔案和子目錄都會被髮送給 Docker daemon。

所以，使用 build context 就得小心了，不要將多餘檔案放到 build context，特別不要把 /、/usr 作為 build context，否則構建過程會相當緩慢甚至失敗。

⑤ Step 1：執行 FROM，將 ubuntu 作為 base 映象。
ubuntu 映象 ID 為 f753707788c5。

⑥ Step 2：執行 RUN，安裝 vim，具體步驟為 ⑦、⑧、⑨。

⑦ 啟動 ID 為 9f4d4166f7e3 的臨時容器，在容器中通過 apt-get 安裝 vim。

⑧ 安裝成功後，將容器儲存為映象，其 ID 為 35ca89798937。

這一步底層使用的是類似 docker commit 的命令。

⑨ 刪除臨時容器 9f4d4166f7e3。

⑩ 映象構建成功。

通過 docker images 檢視映象資訊。

映象 ID 為 35ca89798937，與構建時的輸出一致。

在上面的構建過程中，我們要特別注意指令 RUN 的執行過程 ⑦、⑧、⑨。Docker 會在啟動的臨時容器中執行操作，並通過 commit 儲存為新的映象。

檢視映象分層結構

ubuntu-with-vi-dockerfile 是通過在 base 映象的頂部新增一個新的映象層而得到的。

這個新映象層的內容由 RUN apt-get update && apt-get install -y vim 生成。這一點我們可以通過 docker history 命令驗證。

docker history 會顯示映象的構建歷史，也就是 Dockerfile 的執行過程。

ubuntu-with-vi-dockerfile 與 ubuntu 映象相比，確實只是多了頂部的一層 35ca89798937，由 apt-get 命令建立，大小為 97.07MB。docker history 也向我們展示了映象的分層結構，每一層由上至下排列。

注：表示無法獲取 IMAGE ID，通常從 Docker Hub 下載的映象會有這個問題。

作者：cloudman6

原文

每天5分鐘玩轉Docker容器技術（二）
2019-02-27
Docker
每天5分鐘玩轉Docker容器技術（一）
2017-12-25
Docker
每天5分鐘玩轉Docker容器技術（四）
2018-01-04
Docker
【Docker】(9)---每天5分鐘玩轉 Docker 容器技術之映象
2021-10-12
Docker
Network Policy - 每天5分鐘玩轉 Docker 容器技術（171）
2020-12-09
Docker
Prometheus Operator - 每天5分鐘玩轉 Docker 容器技術（177）
2020-12-09
PrometheusDocker
PV & PVC - 每天5分鐘玩轉 Docker 容器技術（150）
2020-12-07
Docker
回收 PV - 每天5分鐘玩轉 Docker 容器技術（152）
2018-04-09
Docker
每天5分鐘玩轉容器技術（1）
2017-05-02
Helm 架構 - 每天5分鐘玩轉 Docker 容器技術（161）
2020-12-08
架構Docker
Kubernetes Dashboard - 每天5分鐘玩轉 Docker 容器技術（173）
2018-05-27
Docker
再次實踐 MySQL chart - 每天5分鐘玩轉 Docker 容器技術
2018-05-11
MySqlDocker
外部 Storage Provider - 每天5分鐘玩轉 Docker 容器技術（149）
2020-12-06
IDEDocker
Liveness 探測 - 每天5分鐘玩轉 Docker 容器技術（143）
2020-12-06
Docker
並行執行 Job - 每天5分鐘玩轉 Docker 容器技術（134）
2018-02-26
並行Docker
MySQL 使用 PV 和 PVC - 每天5分鐘玩轉 Docker 容器技術（154）
2020-12-07
MySqlDocker
ELK 完整部署和使用 - 每天5分鐘玩轉 Docker 容器技術（90）
2020-12-01
Docker
什麼是 stack？- 每天5分鐘玩轉 Docker 容器技術（111）
2020-12-03
Docker
通過 Service 訪問 Pod - 每天5分鐘玩轉 Docker 容器技術（136）
2018-03-02
Docker
RUN vs CMD vs ENTRYPOINT - 每天5分鐘玩轉 Docker 容器技術（17）
2017-11-13
Docker
用 Weave Scope 監控叢集 - 每天5分鐘玩轉 Docker 容器技術（175）
2020-12-09
Docker
部署 Graylog 日誌系統 - 每天5分鐘玩轉 Docker 容器技術（92）
2020-12-01
Docker
如何用 Graylog 管理日誌？ - 每天5分鐘玩轉 Docker 容器技術（93）
2020-12-01
Docker
萬能資料收集器 Fluentd - 每天5分鐘玩轉 Docker 容器技術（91）
2020-12-01
Docker
Kubernetes 叢集日誌管理 - 每天5分鐘玩轉 Docker 容器技術（180）
2020-12-10
Docker
在滾動更新中使用 Health Check - 每天5分鐘玩轉 Docker 容器技術（146）
2020-12-06
Docker
用 k8s 管理機密資訊 - 每天5分鐘玩轉 Docker 容器技術（155）
2020-12-07
K8SDocker
容器技術｜Docker三劍客之docker-swarm
2018-09-29
DockerSwarm
容器技術｜Docker三劍客之docker-compose
2018-07-25
Docker
Docker--容器技術
2019-03-13
Docker
docker容器技術原理
2021-03-25
Docker
Docker | Docker技術基礎梳理(三) - 容器生命週期管理
2019-01-21
Docker
Docker技術( 容器虛擬化技術 )
2019-10-18
Docker
Docker容器技術與Docker介紹
2022-06-13
Docker
容器技術之Docker映象
2020-05-23
Docker
玩轉docker之自定義PHP容器
2020-09-20
DockerPHP
ServicePlugin/Agent-每天5分鐘玩轉OpenStack（73）
2017-11-13
Plugin
容器技術之Docker網路
2020-05-24
Docker