解決texlive化學式轉換映象經常偶發性程式堆積導致卡頓問題

蒲公英的狂想發表於2021-12-01

原文網址 : https://www.cnblogs.com/surging-dandelion/p/15631216.html

前言

之前在使用Python定時清理執行超時的pdflatex殭屍程式博文中我採用python指令碼開啟定時任務清理pdflatex殭屍程式，線上4u2G的k8s pod部署了3個，pdflatex執行過程是是比較耗cpu的，記憶體佔用微乎其微，但是pod在實際在執行中偶爾還是會出現一些問題

問題

問題一：K8s POD儲存超過100M，POD down了，但是資源沒有被回收，導致k8s名稱空間資源被空耗
問題二：每隔一段時間偶發性單個pod程式積壓，定時清理指令碼會down掉，清理任務無法正常執行
問題三：主要是你還不知道那個pod有問題，所有的請求都是通過k8s負載均衡到各個pod中去，一旦路由到有問題的pod，請求就掛起了，你得本地配置kubectl進入到生產的pod中去檢視程式，找到問題pod，手動清理程式然後重啟清理任務，但是清理完你會發現過幾天又會出現同樣的問題，人肉運維負擔很重

解決

問題一
第一個問題的產生是由於我們在執行pdflatex時候會生成tex和pdf檔案，當我們正常執行完成之後，會清理這些檔案，但是如果是殭屍程式的話，我們在清理程式的時候也需要把程式對應的檔案清理掉，清理指令碼如下：

def clean_files():
    nowtime = datetime.datetime.now()
    # 獲取時間差5分鐘（因為檔案建立超過5分鐘的要刪除掉）
    deltime = datetime.timedelta(seconds=120)
    # 獲取當前時間減去5分鐘時間差
    nd = nowtime - deltime
    path = "/home/"
    files = os.listdir(path)
    for file in files:
        filectime = get_filectime(path + file)
        if filectime < nd and len(file) > 32:
            os.remove(path + file)
            logging.info("清理檔案："+file)

問題二
第二個問題比較嚴重，產生的原因有如下幾個：

1、clean_files 偶發性異常，導致定時任務掛掉，這裡已經判斷了檔案建立時間5分鐘在執行刪除偶發性出現檔案找不到的異常，導致清理定時任務掛掉，判斷是由於pdflatex程式積壓導致clean_files一直沒有拿到cpu的執行權，當執行os.remove的時候那些“不正常”的檔案被“正常”的程式清理掉了，導致報錯
2、p.terminate()方法沒有生效，這一塊應當是texlive的bug導致，之前的清理程式我在部署生產的時候放到10分鐘執行一次，但是由於pdflatex的cpu消耗較多，如果有較多的錯誤語法的轉換或者稍高一點的併發，都是導致短暫是cpu壓力陡增，這時部分pdflatex程式已經假死，直接給程式傳送terminate指令，程式也無法響應

解決：第一個問題比較簡單，try catch包裹一下，一次執行失敗下次執行即可，無傷大雅；第二問題，問題沒有定位出來，偶發性的，有的節點執行了幾個月也都沒有問題，但是就是偶爾有個新節點老是喜歡出問題，沒轍了只能暴力點，上程式碼

def process_checker():
    try:
        logging.info("pdflatex程式清理")
        os.system("kill -9 `ps -ef | grep pdflatex | grep pdftex | awk '{print $1}'`")
    except Exception as e:
        logging.error("清理程式出錯")

    try:
        clean_files()
        logging.info("檔案清理成功")
    except Exception as e:
        logging.error("清理檔案出錯")

其實一開始我用的是kill想平滑一點，但是執行一段時間發現根本kill不掉，所以加了個 -9 來終結那些令人糟心的程式

定時任務也去掉了，一切從簡，while迴圈，每次睡60秒，迴圈裡的程式碼try catch，確保如果高峰期某個節點發生卡頓可以在一分鐘內自動恢復，這樣就免去了人肉運維，並且又在生產環境增加了兩個例項，好長一段時間都沒有反饋卡頓的問題了

UINavigationController 全域性右劃導致介面假死問題解決
2019-02-21
UINavigationController
移動APP卡頓問題解決實踐
2021-11-17
APP
記解決 Postman 卡頓，佔 CUP，卡死問題
2021-06-28
Postman
《RabbitMQ》| 解決訊息延遲和堆積問題
2021-11-08
MQ
換IP經常出現的問題及其解決方案
2021-09-11
（轉）解決XMind執行卡頓
2018-07-27
LGWR寫操作會導致效能全域性卡頓案例分析
2024-02-20
div拖動遇到iframe卡頓的問題解決
2020-10-15
CAS導致的ABA問題及解決
2019-04-24
因事件堵塞導致頁面卡頓
2021-12-14
事件
基於vue解決大資料表格卡頓問題
2019-03-19
Vue大資料
電腦出現常見問題卡頓，教你優化提速技巧
2021-10-27
優化
android檢測卡頓問題,recycleview卡頓
2018-08-30
AndroidView
MySQL：一次timestamp時區轉換導致的問題
2019-11-04
MySql
解決頁面豎向捲軸導致元素尺寸發生變化的問題
2024-10-06
解決Tengine健康檢查引起的TIME_WAIT堆積問題
2021-01-18
AI
【slam】解決VirtualBox執行ubuntu18.04.6卡頓的問題
2024-09-27
SLAMUbuntu
解決new Thread().Start導致高併發CPU 100%的問題
2022-01-20
thread
AI｜經常崩潰的問題解決
2024-11-16
AI
不同Node版本導致的Date建構函式問題及解決方法
2018-07-06
函式
關於從其他程式切回word文件時卡頓問題的解決辦法
2024-11-15
記一次 hosts 檔案配置錯誤導致應用卡頓的奇葩問題
2021-06-18
解決 wsl2/WSLg 聲音卡頓不連續問題
2024-09-12
瞭解GaussDB效能調優之隱式轉換，解決慢SQL問題
2024-12-10
SQL
解決Qt中ui->tableView->setModel(model);導致程式崩潰問題
2024-07-06
QTUIView
全域性替換 ‘/home’ 為 ‘/’ 的問題解決！
2020-02-15
檔案上傳經由ZUUL轉發，導致的檔名（OriginalFilename）亂碼問題
2018-10-16
Zuul
mysql隱式轉換問題
2021-03-11
MySql
解決webpack-dev-server代理常切換問題
2019-01-08
WebdevServer
資料型別隱式轉換導致的阻塞
2022-12-22
資料型別
Oracle表空間切換路徑，解決硬碟滿導致的ORA-01653問題
2019-01-09
Oracle硬碟
K8S下應用異常卡頓問題的分析與學習
2024-05-18
K8S
【問題解決】使用YYYY-MM-dd時間轉換問題
2020-12-31
LF和CRLF換行符不一致導致的Git顯示修改問題分析及解決
2024-11-29
Git
解決伺服器 CPU 佔用 100% 導致 PHP-fpm 程式假死問題
2018-10-17
伺服器PHP
git合併丟失程式碼問題分析與解決(錯誤操作導致)
2020-11-27
Git
win10滑鼠間歇性失靈卡頓怎麼辦滑鼠偶爾失靈幾秒的解決方法
2021-01-05
Win10
win10系統玩古墓麗影暗影偶爾卡頓卡住怎麼解決
2020-01-18
Win10

解決texlive化學式轉換映象經常偶發性程式堆積導致卡頓問題

前言

問題

解決

相關文章