Python踩坑之旅其一殺不死的Shell子程式

mythmgn發表於2019-05-29

原文網址 : https://www.cnblogs.com/mythmgn/p/10945865.html

Python

1.1 踩坑案例

踩坑的程式是個常駐的Agent類管理程式, 包括但不限於如下型別的任務在執行:

a. 多執行緒的網路通訊包處理
- 和控制Master節點互動
- 有固定Listen埠
b. 定期作業任務, 通過subprocess.Pipe執行shell命令
c. etc

發現坑的過程很有意思:

a.重啟Agent發現Port被佔用了
- => 立刻想到可能程式沒被殺死, 是不是停止指令碼出問題
  - => 排除發現不是, Agent程式確實死亡了
  - => 通過 netstat -tanop|grep port_number 發現埠確實有人佔用
- => 除錯環境, 直接殺掉佔用程式了之, 錯失首次發現問題的機會
b.問題在一段時間後重現，重啟後Port還是被佔用
- 定位問題出現在一個叫做xxxxxx.sh的指令碼, 該指令碼佔用了Agent使用的埠
  - => 奇了怪了, 一個xxx.sh指令碼使用這個奇葩Port幹啥(大於60000的Port, 有興趣的磚友可以想下為什麼Agent預設使用6W+的埠)
  - => review該指令碼並沒有進行埠監聽的程式碼
一拍腦袋, c.程式共享了父程式資源了
- => 溯源該指令碼,發現確實是Agent啟動的任務中的指令碼之一
- => 問題基本定位, 該指令碼屬於Agent呼叫的指令碼
- => 該Agent繼承了Agent原來的資源FD, 也就是這個port
- => 雖然該指令碼由於超時被動觸發了terminate機制, 但terminate並沒有幹掉這個子程式
- => 該指令碼程式的父程式(ppid) 被重置為了1
d.問題出在指令碼程式超時kill邏輯

1.2 填坑解法

通過程式碼review, 找到shell具體執行的庫程式碼如下:

self._subpro = subprocess.Popen(
    cmd, shell=True, stdout=subprocess.PIPE,
    stderr=subprocess.PIPE,
    preexec_fn=_signal_handle
)
# 重點是shell=True !

把上述程式碼改為:

self._subpro = subprocess.Popen(
    cmd.split(), stdout=subprocess.PIPE,
    stderr=subprocess.PIPE, preexec_fn=_signal_handle
)
# 重點是去掉了shell=True

1.3 坑位分析

Agent會在一個新建立的threading執行緒中執行這段程式碼, 如果執行緒執行時間超時(xx seconds), 會呼叫 self._subpro.terminate()終止該指令碼.

表面正常:

啟用新執行緒執行該指令碼
如果出現問題,執行超時防止hang住其他任務執行呼叫terminate殺死程式

深層問題:

Python 2.7.x中subprocess.Pipe 如果shell=True, 會預設把相關的pid設定為shell(sh/bash/etc)本身(執行命令的shell父程式), 並非執行cmd任務的那個程式
子程式由於會複製父程式的opened FD表, 導致即使被殺死, 依然保留了擁有這個Listened Port FD

這樣雖然殺死了shell程式(未必死亡, 可能進入defunct狀態), 但實際的執行程式確活著. 於是1.1中的坑就被結實的踩上了.

1.4 坑後擴充套件

1.4.1 擴充套件知識

本節擴充套件知識包括二個部分:

Linux系統中, 子程式一般會繼承父程式的哪些資訊
Agent這種常駐程式選擇>60000埠的意義

擴充套件知識留到下篇末尾講述, 感興趣的可以自行搜尋

1.4.1 技術關鍵字

Linux系統程式
Linux隨機埠選擇
程式多執行緒執行
Shell執行

1.5 填坑總結

子程式會繼承父程式的資源資訊
如果只kill某程式的父程式, 整合了父程式資源的子程式會繼續佔用父程式的資源不釋放, 包括但不限於
- listened port
- opened fd
- etc
Python Popen使用上, shell的bool狀態決定了程式kill的邏輯, 需要根據場景選擇使用方式

mpvue小程式踩坑之旅
2019-03-05
Vue
Jenkins踩坑之旅：nohup後臺執行shell命令
2019-07-10
Jenkins
laradock-的踩坑之旅
2020-06-03
Vue踩坑之旅——methods
2018-03-15
Vue
Vue踩坑之旅——Vuex
2018-03-26
Vue
小程式踩坑之旅--動態設定tabBar
2018-06-06
tabBar
小程式踩坑之旅–動態設定tabBar
2019-03-04
tabBar
vue系列之踩坑之旅
2018-07-11
Vue
FLUTTER混合工程踩坑之旅
2019-10-08
Flutter
[程式碼修訂版] Python 踩坑之旅 [程式篇其四] 踩透 uid euid suid gid egid sgid的坑坑窪窪
2019-06-06
PythonUI
Python 踩坑之旅程式篇其四一次性踩透 uid euid suid gid egid sgid的坑坑窪窪
2019-06-04
PythonUI
Flutter接入現有Android工程踩坑之旅
2019-03-04
FlutterAndroid
小程式踩坑填坑
2018-07-25
小程式踩坑
2019-04-11
Nebula Exchange 工具 Hive 資料匯入的踩坑之旅
2021-01-11
Hive
Jenkins踩坑之旅：使用Date物件產生RejectedAccessException
2019-07-05
Jenkins物件Exception
H5音訊處理——踩坑之旅
2019-03-14
H5音訊
[小程式] mpVue 踩坑
2018-07-14
Vue
小程式踩坑（2）
2018-12-29
vue專案中富文字編輯器踩坑之旅
2019-03-04
Vue
Python bool邏輯踩坑
2019-03-21
Python
wepy小程式踩過的坑(1)
2018-08-07
小程式開發入坑之旅
2018-07-16
Python 初學者容易踩的 5 個坑
2024-03-11
Python
小程式踩坑日記（一）
2018-04-05
Taro 小程式踩坑記錄
2020-11-26
golang的踩坑
2018-08-14
Golang
小程式的這些坑你踩過嗎？
2019-03-04
微信小程式的踩坑與優化。
2019-01-16
微信小程式優化
細數百度小程式踩的坑
2019-06-06
Shell程式設計-11-子Shell和Shell巢狀
2018-11-27
程式設計巢狀
Python使用ClickHouse的實踐與踩坑記錄
2022-05-17
Python
小白程式設計師最容易踩的“坑”，你踩過幾個？
2020-02-12
程式設計師
微信小程式踩坑記錄
2018-05-28
微信小程式
微信小程式踩坑指南【一】
2018-12-28
微信小程式
Windows+Apache+Python+Django 踩坑記錄
2019-07-26
WindowsApachePythonDjango
Ubuntu中安裝python3.6踩坑
2020-11-16
UbuntuPython
python獲取程式執行檔案路徑的方法其一
2020-03-17
Python