Lua OpenResty容器化（考古歷程）

WilburXu發表於2021-04-21

原文網址 : https://www.cnblogs.com/wilburxu/p/14685260.html

背景

公司有幾個“遠古時期”的專案，一直都相對較為穩定，但是專案每天總會在一些時段，請求每分鐘QPS到達峰值800K左右，導致機器的效能出現了一些瓶頸，每到峰值時期，總會出現一個告警，實在是令人頭疼。更糟糕的是這只是遠古時期專案中的其中一個而且都是部署在物理機器上，所有機器加起來接近100臺。

出於穩定性（削峰）和成本的角度考慮，我們最終決定將所有的Lua OpenResty專案上到k8s叢集。

選擇合適的openresty基礎映象

通過檢視線上在使用的openresty版本資訊：

/usr/local/openresty/nginx/sbin/nginx -V
nginx version: openresty/1.13.6.2
built by gcc 4.8.5 20150623 (Red Hat 4.8.5-16) (GCC)
built with OpenSSL 1.1.0h 27 Mar 2018 (running with OpenSSL 1.1.0k 28 May 2019)
TLS SNI support enabled
configure arguments: --prefix=/usr/local/openresty/nginx ...

lua -v
Lua 5.1.4 Copyright (C) 1994-2008 Lua.org, PUC-Rio

得知在使用的是openresty/1.13.6.2和Lua 5.1.4 :

docker pull openresty/openresty:1.13.6.2-2-centos

Q：能不能選擇使用更小的alpine系列的呢？

A：因為專案依賴許多的so庫，都是glibc編譯的，alpine的話是musl-lib，不相容。

Q：為啥不重新編譯？

A：一方面是風險問題，另外一方面是有一些so庫不一定能找到。

查詢專案的動態庫依賴關係

Nginx配置檔案

$ tree -L 3 nginx/conf
nginx/conf
├── vhosts/
│ ├── inner.prometheus.nginx.conf
│ └── project.nginx.conf
└── nginx.conf

自編譯的C動態庫檔案，如`binary_protocol.so`

編寫好dockerfile，然後將專案打包進容器，執行：

/usr/local/openresty/nginx/sbin/nginx nginx -t

果不其然，報錯：

/usr/local/openresty/nginx/lua/init.lua:1: module 'binary_protocol' not found:
no field package.preload['binary_protocol']
no file '/usr/local/openresty/nginx/lua/binary_protocol.lua'
no file '/usr/local/openresty/nginx/lua_lib/binary_protocol.lua'
no file '/usr/local/openresty/nginx/luarocks/share/lua/5.1/binary_protocol.lua'
no file '/usr/local/openresty/site/lualib/binary_protocol.ljbc'
…… ……
no file '/usr/local/openresty/nginx/luarocks/lib64/lua/5.1/binary_protocol.so'
no file '/usr/local/openresty/site/lualib/binary_protocol.so'
no file '/usr/local/openresty/lualib/binary_protocol.so'
no file '/usr/local/openresty/site/lualib/binary_protocol.so'
no file '/usr/local/openresty/lualib/binary_protocol.so'
no file './binary_protocol.so'
no file '/usr/local/lib/lua/5.1/binary_protocol.so'
no file '/usr/local/openresty/luajit/lib/lua/5.1/binary_protocol.so'
no file '/usr/local/lib/lua/5.1/loadall.so'
no file '/usr/local/openresty/luajit/lib/lua/5.1/binary_protocol.so'

Q：仔細觀察，發現so動態庫是內部編譯出來提供給lua呼叫的，如何找到它們呢？

A：是ldd、pldd又或者使用lsof檢視動態庫檔案。

通過ldd、pldd命令，可以檢視so所相關的依賴

ldd binary_protocol.so
linux-vdso.so.1 => (0x00007fff40bd4000)
libtolua++.so => not found ## 會告訴我們ldd缺少這個依賴
libcrypto.so.6 => not found
liblog4cplus.so.2 => not found
libstdc++.so.6 => /lib64/libstdc++.so.6 (0x00007f458d9ef000)
libm.so.6 => /lib64/libm.so.6 (0x00007f458d6ed000)
libgcc_s.so.1 => /lib64/libgcc_s.so.1 (0x00007f458d4d7000)
libc.so.6 => /lib64/libc.so.6 (0x00007f458d10a000)
/lib64/ld-linux-x86-64.so.2 (0x00007f458df1e000)

通過這些方法，一點點跟蹤，知道找齊所有依賴庫即可。

Luarocks外部包檔案

從線上的nginx.conf找到lua_package_path和lua_package_cpath中包括的luarocks路徑，再從這個路徑中，找到manifest檔案，此檔案有描述安裝了哪些luarocks庫。

luarocks 外部依賴安裝

RUN luarocks --tree=${WORK_DIR}/luarocks install lua-cjson \
&& luarocks --tree=${WORK_DIR}/luarocks install penlight \
&& luarocks --tree=${WORK_DIR}/luarocks install version \
&& luarocks --tree=${WORK_DIR}/luarocks install lua-resty-http \
&& luarocks --tree=${WORK_DIR}/luarocks install luaunit \
&& luarocks --tree=${WORK_DIR}/luarocks install ldoc \
&& luarocks --tree=${WORK_DIR}/luarocks install lua-discount \
&& luarocks --tree=${WORK_DIR}/luarocks install serpent \
&& luarocks --tree=${WORK_DIR}/luarocks install luacov \
&& luarocks --tree=${WORK_DIR}/luarocks install cluacov \
&& luarocks --tree=${WORK_DIR}/luarocks install mmdblua \
&& luarocks --tree=${WORK_DIR}/luarocks install lua-resty-jit-uuid \
&& luarocks --tree=${WORK_DIR}/luarocks install luasocket

RUN luarocks --tree=/usr/local/openresty/nginx/luarocks install nginx-lua-prometheus

遇到的問題及其解決方法

問題1：容器老被OOM Killed

經過分析，的確佔用了非常大的記憶體：

通過ps命令定位到 worker 數量非常多

解決方法：

限定worker數量：worker_processes 4;

Q：為啥會產生這麼多worker？

A：在k8s上，nginx 啟動的 worker process，並沒有遵循我們給 Pod 設定的 limit，而是與 Pod 所在 node 有關。

問題2：nginx worker process exited on signal 9

是由於Deployment設定的記憶體限額太小所致

解決方法：調大requests資源限額

resources:
limits:
cpu: "2000m"
memory: "1Gi"
requests:
cpu: "1000m"
memory: "512Mi"

ps：啟動4個Worker大約消耗200Mi。

問題3：attempt to index upvalue ‘result_dict’ (a nil value)

原因是線上的nginx.conf有相關的定義
而程式碼層面上沒有，加上即可：

lua_shared_dict monitor_status 150m;

縮減映象大小的一個小技巧

借雞生蛋

如何接入Prometheus監控

在OpenResty中接入 Prometheus，https://github.com/knyar/nginx-lua-prometheus

安裝依賴

luarocks --tree=/usr/local/openresty/nginx/luarocks install nginx-lua-prometheus

新增配置

為nginx/conf/vhosts/project.nginx.conf增加：

lua_shared_dict prometheus_metrics 10M;
log_by_lua_block {
metric_requests:inc(1, {ngx.var.server_name, ngx.var.status})
metric_latency:observe(tonumber(ngx.var.request_time), {ngx.var.server_name})
}

新增配置檔案

新增nginx/conf/vhosts/inner.prometheus.nginx.conf

server {
listen 8099;
location /metrics {
content_by_lua_block {
metric_connections:set(ngx.var.connections_reading, {"reading"})
metric_connections:set(ngx.var.connections_waiting, {"waiting"})
metric_connections:set(ngx.var.connections_writing, {"writing"})
prometheus:collect()
}
}
}

更新deployment配置

apiVersion: extensions/v1beta1
kind: Deployment
metadata:
name: ${name}
namespace: ${namespace}
labels:
test-app: test-server
spec:
replicas: ${replicas}
template:
metadata:
labels:
test-app: test-server
annotations: # <----------------------- 新增
prometheus.io/scrape: "true"
prometheus.io/path: "/metrics"
prometheus.io/port: "8099"

總結

至此，lua的一個專案容器化完成，中途遇到的問題還是蠻多的，上面也只記錄了幾個主要的步驟和問題。

openresty及lua的隨機函式
2019-03-18
REST隨機函式
openresty通過lua增加隨機traceid
2018-07-16
REST隨機
OpenResty + Lua 動態增加 Zuul 節點
2019-12-12
RESTZuul
nginx+lua(OpenResty)，實現訪問限制
2024-06-11
NginxREST
OpenResty+lua+redis+mysql多級快取
2021-05-14
RESTRedisMySql快取
openresty+redis配合 lua指令碼封停 IP
2024-09-04
RESTRedis指令碼
[lua][openresty]程式碼覆蓋率檢測的解決方式
2018-12-20
REST
cetnos7下openresty使用luarocks 進行lua的包管理
2018-03-16
REST
AppDelegate模組化歷程
2019-03-06
APP
iOS專案元件化歷程
2019-03-12
iOS元件化
容器歷史
2019-09-25
javascript模組化發展歷程
2019-02-22
JavaScript
前端模組化發展歷程（-）
2021-07-14
前端
lua課程學習筆記
2024-07-09
筆記
編譯安裝基於nginx與lua的高效能web平臺-openresty
2018-04-10
編譯NginxWebREST
【論文考古】分散式優化 Communication Complexity of Convex Optimization
2022-02-27
分散式優化
各種ID轉化之心路歷程
2018-08-13
Javascript模組化的演進歷程
2018-07-19
JavaScript
關於OpenResty中使用lua-resty-jwt出現的一個異常symbol not found
2021-02-26
RESTJWTSymbol
OpenResty
2024-07-11
REST
淺談儲存器的進化歷程
2018-06-27
Ubuntu_amd64容器化部署chromedriver的過程
2024-04-05
UbuntuChrome
部署openresty
2024-06-23
REST
虛擬化的發展歷程和實現方式
2018-07-11
孤獨的遊戲「考古」者：快速消失的遊戲歷史與搶救它們的人
2019-10-23
遊戲
OpenResty入門
2022-03-04
REST
OpenResty體驗
2021-05-15
REST
資料視覺化，BizCharts圖表庫入坑歷程
2018-12-11
視覺化
PHP 開發入門自動化測試歷程（一）
2021-01-26
PHP
PHP 開發入門自動化測試歷程（二）
2021-01-26
PHP
PHP 開發入門自動化測試歷程（三）
2021-01-28
PHP
HTTP - 發展歷程
2019-01-09
HTTP
node學習歷程
2018-06-04
Kotlin之心路歷程
2019-09-18
Kotlin
SpringBoot啟動流程分析（四）：IoC容器的初始化過程
2019-06-24
Spring Boot
《Lua-in-ConTeXt》11：原始碼彩化
2023-02-12
Context原始碼
實戰Docker容器排程
2020-09-23
Docker
[NG] 考古 - HttpInterceptor 迴圈引用錯誤
2018-08-26
HTTP