Nodejs Docker 映象體積優化實踐

lvwxx發表於2019-04-10

你討厭部署你的應用程式花費很長時間嗎? 對於單個容器來說,超過gb並不是最佳實踐。每次部署新版本時都要處理數十億位元組,這對我們來說並不太合適。

本文將通過Nodejs程式展示如何優化Docker映象的幾個簡單步驟,使它們更小、更快、更適合生產環境。

簡單的一段Node.js專案

首先寫一段基於express的簡單web伺服器程式

// package.json
{
  "name": "docker-test",
  "version": "1.0.0",
  "description": "",
  "main": "app.js",
  "scripts": {
    "start": "node app"
  },
  "author": "",
  "license": "ISC",
  "dependencies": {
    "express": "^4.16.4"
  },
  "devDependencies": {
    "eslint": "^5.16.0"
  }
}
複製程式碼
// app.js
const express = require('express')
const app = express()

app.get('/', function(req, res){
  res.send('hello world')
})

app.listen(3000)
複製程式碼

在根目錄下新建Dockerfile並寫入以下程式碼

# Dockerfile
FROM node

COPY . /home/app

RUN cd /home/app && npm install

WORKDIR /home/app

CMD ['npm', 'start']
複製程式碼

執行

  • docker build -t myapp .
  • docker images

結果

可以看到這段最簡單的nodejs程式有920MB,請不要這樣做。接下來我們將逐步的減少這個映象的體積。

優化docker生產環境映象

  • 使用Node.js Alpine 映象

    大幅減小映象體積的最簡單和最快的方法是選擇一個小得多的基本映象。Alpine是一個很小的Linux發行版,可以完成這項工作。只要選擇Node.js的Alpine版本,就會有很大的改進。

    FROM node:alpine
    
    COPY . /home/app
    
    RUN cd /home/app && npm install
    
    WORKDIR /home/app
    
    CMD ['npm', 'start']
    複製程式碼

    build之後

    結果

    可以看到整整減少了800MB,這是一個非常大的優化。

  • 生成環境下不打包開發的依賴包

    但我們還能繼續優化。我們正在安裝所有依賴項,即使我們最終只需要生成環境下的依賴包。如果只打包生產環境的以來不會怎麼樣,繼續改進一下。

      FROM node:alpine
    
      COPY . /home/app
    
      RUN cd /home/app && npm install --production
    
      WORKDIR /home/app
    
      CMD ['npm', 'start']
    複製程式碼

    build之後

    結果

    我們又減少了6MB,因為我們目前只有一個開發依賴,可以想象在一個正常的專案中這也將是非常大的優化。

  • 使用基礎版本的 Alpine 映象組合Nodejs

    如果我們使用基礎版本的 Alpine 映象,然後自己安裝Nodejs結果會怎麼樣呢?

      FROM alpine:latest
    
      RUN apk add --no-cache --update nodejs nodejs-npm
    
      COPY . /home/app
    
      RUN cd /home/app && npm install --production
    
      WORKDIR /home/app
    
      CMD ['npm', 'start']
    複製程式碼

    build之後

    結果

    現在只剩下了65MB,相比剛開始已經減少了10倍多。

  • 多階段構建

    • Docker映象是分層的,Dockerfile中的每個指令都會建立一個新的映象層,映象層可以被複用和快取。當Dockerfile的指令修改了,複製的檔案變化了,或者構建映象時指定的變數不同了,對應的映象層快取就會失效,某一層的映象快取失效之後,它之後的映象層快取都會失效。

    • 因此我們還可以將RUN指令合併,但是需要記住的是,我們只能將變化頻率一致的指令合併。

    • 我們應該把變化最少的部分放在Dockerfile的前面,這樣可以充分利用映象快取。

    • 通過最小化映象層的數量,我們可以得到更小的映象。

上述示例中,原始碼會經常變化,則每次構建映象時都需要重新安裝NPM模組,這顯然不是我們希望看到的。因此我們可以先拷貝package.json,然後安裝NPM模組,最後才拷貝其餘的原始碼。這樣的話,即使原始碼變化,也不需要重新安裝NPM模組。

  FROM alpine AS builder
  WORKDIR /home/app
  RUN apk add --no-cache --update nodejs nodejs-npm
  COPY package.json package-lock.json ./
  RUN npm install --production

  FROM alpine
  WORKDIR /home/app
  RUN apk add --no-cache --update nodejs
  COPY --from=builder /usr/src/app/node_modules ./node_modules
  COPY . .
  CMD [ 'npm', 'start' ]
複製程式碼

結果

最終的映象只有51MB,比最開始大概減少了17倍!並且後續的 build 速度也大大提升。

每一條 FROM 指令都是一個構建階段,多條 FROM 就是多階段構建,雖然最後生成的映象只能是最後一個階段的結果,但是,能夠將前置階段中的檔案拷貝到後邊的階段中,這就是多階段構建的最大意義。

在上面的Dockerfile檔案中,我們先 copy 了package.json,然後 npm install,在第二階段構建時,我們直接 copy 了第一階段已經下載好的node_moduls,在下一次 build 時,如果沒有新增依賴,docker將使用快取中的node_modules,這樣就減少了部署的時間。

使用 docker inspect imageId命令 我們可以看到,雖然我們有多個指令,但是最終的映象也只有5層,這就是層的共享機制。

使用多階段構建可以充分利用Docker映象的快取,大大減少最終部署到生產環境的時間。

結論

在實際生產環境中,沒有任何理由使用gb大小的映象,如果你確實需要提高部署速度,並且被緩慢的CI/CD所困擾,那麼多階段構建將會是一個非常有幫助的方法

希望這篇簡短的文章對考慮使用Docker進行基於Node.js的應用程式開發或部署的人有些許幫助。

相關文章