【原創】PREEMPT-RT系統某些應用場景sys cpu使用率週期飆高問題

沐多發表於2024-11-17

原文網址 : https://www.cnblogs.com/wsg1100/p/18550854

背景
現象
復現條件
原因
解決措施

背景

在22年進行PREEMPT-RT系統問題的除錯時，之前文章在CPU效能最佳化小記-使用火焰圖定位效能問題只是定位解決了其中一個問題，還有一個潛在的問題當時沒有續寫。然而，最近幾乎所有PREEMPT-RT產品上都出現了該問題，影響了非實時任務的CPU吞吐量，引起了大家的廣泛關注。因此，有必要對這個問題進行簡單記錄，希望對大家有所幫助。

本文只說明原因和結論，省略了問題定位流程。

現象

在PREEMPT-RT系統的某些應用場景下，即使沒有執行特定的應用程式，整個系統的CPU負載在間隔一段時間後會突然飆升幾百毫秒甚至幾秒鐘。同一型號的不同單板上的持續時間和間隔時間會有所不同。。

無論使用top還是pidstat進行觀察，只能確定system CPU使用率飆升，且相關執行緒不定，與具體執行緒無關。

復現條件

找到一臺具有良好實時性的機器，可以是PREEMPT-RT系統或是xenomai+rtnet系統，建立一個高實時任務。該任務使用raw socket週期性地向目標機器傳送廣播幀，週期可以是500us、1ms或2ms，但發幀週期必須非常準確，在目標機器上檢視CPU使用率會看到週期性飆高。

原因

該問題為PREEMPT-RT通病（至少我當前接觸到的核心從3.2到5.10均有該問題），整個系統中存在一個以上外部週期事件時就會出現，比如接收PLC傳送的週期乙太網幀、外部FPGA觸發的週期IO中斷事件、EtherCAT主站同步到從站參考時鐘後中斷收發乙太網幀等等。

由於外部週期事件（中斷）基於的時鐘源與PREEMPT-RT系統排程時鐘源不同，這兩個時鐘存在時鐘漂移，週期事件會和PREEMPT RT本身的系統排程事件發生週期交越，當兩個事件逐漸接近的時候，兩個事件都要處理，頻繁的上下文導致cpu飆高，系統實時任務的抖動會微微增大。這是PREEMPT-RT系統為了保證外部事件實時性而犧牲CPU吞吐量的機制所導致的。

解決措施

儘管沒有徹底解決的方法，但可以嘗試以下緩解措施：

對於單CPU核系統，系統tick無法關閉，該問題無解；
對於SMP多核系統，使能CONFIG_NO_HZ_FULL，降低系統週期Tick，同時設定週期事件中斷的親和性到使能CONFIG_NO_HZ_FULL且沒有周期任務執行的CPU上來緩解。

關於Linux時鐘子系統，詳見本部落格之前的文章 linux時間子系統簡介。

下一篇文章，我們將探討由PREEMPT-RT實時機制導致的網路風暴下系統當機問題。

cpu使用率過高問題（Java）
2019-01-30
Java
案例：系統的 CPU 使用率很高，但為啥卻找不到高 CPU 的應用？
2020-01-16
Oracle CPU使用率過高問題處理
2020-04-05
Oracle
效能分析（2）- 應用程式 CPU 使用率過高案例
2020-07-30
Redis應用場景及快取問題
2021-08-24
Redis快取
通過關閉Windows Update更新解決服務主機本地系統CPU使用率高問題
2018-05-02
Windows
系統空閒程式佔用大量CPU是什麼原因_系統空閒程式CPU使用率高怎麼解決
2020-03-03
win10系統中WMI程式佔用cpu使用率高怎麼解決
2019-02-26
Win10
windows10系統下Windows event log佔用CPU使用率高怎麼辦
2018-07-09
Windows
【面試普通人VS高手系列】CPU飆高系統反應慢怎麼排查？
2022-04-12
面試
解決MacBook Pro升級風扇狂轉和CPU飆高問題
2021-12-27
Mac
Google Chrome發現新Bug CPU使用率飆升至100%
2018-12-24
GoChrome
利用 Arthas 精準定位 Java 應用 CPU 負載過高問題
2020-06-11
Java負載
Java程式CPU使用率高排查
2018-07-20
Java
CPU使用率低負載高
2020-04-17
負載
恆訊科技分析：如何解決SQL Server CPU使用率過高的問題？
2022-10-11
SQLServer
python應用系統訪問瀚高庫
2022-03-23
Python
Win10系統中LSAISO程式CPU使用率過高如何解決
2020-02-01
Win10AI
微軟承認Win10系統18362.329存在高CPU使用率Bug
2019-09-04
微軟Win10
Linux系統各個版本具體應用場景!
2020-05-18
Linux
【原創】Ubuntu Pro 中的RealTime linux(Real-time Ubuntu/PREEMPT-RT/ubuntu官方PREEMPT-RT)
2023-04-01
UbuntuLinux
.netcore利用perf分析高cpu使用率
2021-01-13
NetCore
Win10系統下IAStorDataSvc程式佔CPU使用率高怎麼解決
2020-01-09
Win10ASTC程式
壞程式碼導致的效能問題大賞：CPU佔用飆到了900%！
2021-11-01
Linux系統各個版本具體應用場景合集！
2021-12-01
Linux
CPU飆升？教你1分鐘抓取佔用系統資源的程式
2020-03-05
React 中的高階元件及其應用場景
2019-02-25
React元件
Cloud XR面臨的問題以及Cloud XR主要應用場景
2022-07-25
Cloud
Dubbo Hession反序列化導致CPU佔用飆高用例分析
2019-10-11
Linux系統中CPU佔用率較高問題排查思路與解決方法
2022-07-06
Linux
win10 2004系統cpu佔用高怎麼辦_win10 2004系統佔用cpu過高解決教程
2020-06-28
Win10
3.4　應用場景
2018-08-25
DDD應用場景
2024-04-27
ES 應用場景
2020-06-30
snapshot應用場景
2024-11-17
Zookeeper應用場景
2021-08-31
每週精選+原創題
2024-06-03
Tomcat高階配置(應用場景總結及示例)
2022-03-22
Tomcat

【原創】PREEMPT-RT系統某些應用場景sys cpu使用率週期飆高問題

背景

現象

復現條件

原因

解決措施

相關文章