大家好,我是痞子衡,是正經搞技術的痞子。今天痞子衡給大家介紹的是i.MXRT定時器PIT的多通道連結模式及其在coremark測試裡的應用。
早在 2018 年 i.MXRT 系列跨界處理器剛推出的時候,痞子衡就寫了一篇 《i.MXRT1052效能實測(CoreMark)》,文章詳細介紹了在 i.MXRT 上如何一步一步地移植標準 coremark 程式,這篇文章閱讀量還不錯,據說很多人移植 coremark 都是看得這篇文章。
當時痞子衡把移植好的 coremark 工程也一起開源了出來,並且這個倉庫痞子衡也是在不斷維護的(增加新 MCU 型號支援,以及除了 coremark 之外的一些其他經典程式)。最近有同事向痞子衡反映,這個 coremark 測試工程裡關於計時部分有一些可以改進的地方,痞子衡看了一下,確實可以改進,這便是今天本文要聊的主題:
一、i.MXRT上的定時器簡介
工欲善其事,必先利其器。在改進 coremark 測試工程裡計時功能之前,我們先來了解一下 i.MXRT 上都有哪些跟計時/計數相關的模組,分別是什麼特點,下面是詳細列表。單從計時功能角度考慮,SysTick、GPT、PIT、TMR 都是不錯的選擇。
定時器 | 基本特性 | 應用特色 |
---|---|---|
SysTick | 24bit 計數器 | 系統(核心)時鐘節拍 |
GPT | 32bit 計數器 | 計時,外部訊號捕獲,比較 |
PIT | 32bit 計數器 x 4 ch(可級聯) | 系統生命週期計時,觸發DMA |
TMR | 16bit 計數器 x 4 ch(可級聯) | 混合功能:計時,訊號捕獲,正交解碼 |
eFlexPWM | 16bit 計數器 x 6 ch | PWM訊號生成 |
QDC | 16bit,32bit - 5 ch | 連線位置/速度感測器,正交解碼 |
WDOG | 給定時間選項/16bit | 系統復位 |
二、計時設計對coremark測試程式影響
我們知道 coremark 標準的測試邏輯是在某配置引數組合下單位時間內跑了多少次 coremark 程式,一般情況下要求至少跑 10s 以上,因此計時部分的設計是很重要的。
在早期 i.MXRT1050 coremark 工程裡,痞子衡選用了 PIT(channel 0 - 32bit)負責計時,為 PIT 配置的時鐘源是 24MHz 外部 OSC,定時器一次超時耗時約 178s,這種情況下,痞子衡也沒有使能 PIT 中斷,假定了一次 coremark 程式跑完不會碰到超時的情況,但顯然這種設計是不完善的。
此外我們知道定時器時鐘源頻率越高,計時粒度越細,計時時間也就越精確。大部分定時器時鐘源都可以配到系統 IPG bus 匯流排頻率(在 i.MXRT10xx 上可到 125MHz/150MHz,在 i.MXRT1170 上可到 240MHz),我們可以嘗試將定時器設到最高頻率的時鐘源,這時候就不得不考慮定時器超時中斷處理問題了。
使能定時器超時中斷,可以保證計時的嚴謹性,解決了 coremark 程式執行時間和次數的限制。但是頻繁的定時器中斷響應也會不斷打斷 coremark 程式的執行,對最終跑分結果產生不利影響,這個問題同樣需要解決。
三、PIT定時器多通道連結模式
前面說了 SysTick、GPT、PIT、TMR 都可以用作 coremark 測試工程定時器,但最終痞子衡還是選定了 PIT,因為 PIT 是最適合作為系統執行生命週期總計時器的,這主要得益於 PIT 內部有 4 個 32bit 計時器,並且可以連結使用(串連)。
要是將 4 個 32bit 計數器串成一個 128bit 超強計數器(channel 0 計數溢位,channel 1 計數加 1...),即使系統執行到地老天荒都不會出現一次超時(這裡指最後一鏈 channel 3 中斷觸發),所以也就根本不用管定時器中斷處理的事。
PIT 通道連結模式使能也很簡單,主要在 PIT->CHANNEL[x].TCTRL[CHN] 位上,這個位開啟後,channel x 就和 channel x-1 連了起來。下面是 channel 0 和 channel 1 串連組成 64bit 計數器的初始化程式碼:
void timer_pit_init(void)
{
// Turn on PIT: MDIS = 0, FRZ = 0
PIT->MCR = 0x00;
// Set up timer 1 to max value
PIT->CHANNEL[1].LDVAL = 0xFFFFFFFF; // setup timer 1 for maximum counting period
PIT->CHANNEL[1].TCTRL = 0; // Disable timer 1 interrupts
PIT->CHANNEL[1].TFLG = 1; // clear the timer 1 flag
PIT->CHANNEL[1].TCTRL |= PIT_TCTRL_CHN_MASK; // chain timer 1 to timer 0
PIT->CHANNEL[1].TCTRL |= PIT_TCTRL_TEN_MASK; // start timer 1
// Set up timer 0 to max value
PIT->CHANNEL[0].LDVAL = 0xFFFFFFFF; // setup timer 0 for maximum counting period
PIT->CHANNEL[0].TFLG = 1; // clear the timer 0 flag
PIT->CHANNEL[0].TCTRL = PIT_TCTRL_TEN_MASK; // start timer 0
}
實際上我們也根本不需要 128bit 計數器,64bit 計數器就完全夠用了,就以 150MHz 時鐘源來說,超時一次需要約 3899 年,誰需要操心 3899 年後的事情呢?此外,在 channel 0 和 channel 1 串聯的情況下,PIT 還提供了一個 64bit lifetime 計數器,直接讀這個計數器就能獲取當前 channel 0,1 串連的計數值,不用考慮手動讀 channel 0,1 計數值可能會發生的潛在翻轉問題(rollover)。
你看,使能了 PIT 通道連結用法後就完美地解決了 coremark 測試程式計時設計問題。
uint64_t timer_pit_get_ticks() {
uint64_t valueH;
volatile uint32_t valueL;
#if defined(FSL_FEATURE_PIT_HAS_LIFETIME_TIMER) && (FSL_FEATURE_PIT_HAS_LIFETIME_TIMER == 1)
valueH = PIT->LTMR64H;
valueL = PIT->LTMR64L;
#else
do
{
valueL = PIT->CHANNEL[0].CVAL;
valueH = PIT->CHANNEL[1].CVAL;
} while (valueL < PIT->CHANNEL[0].CVAL);
#endif // FSL_FEATURE_PIT_HAS_LIFETIME_TIMER
return ~((valueH << 32) | valueL);
}
四、關於coremark上計時的其他改進點
最後再提兩個 coremark 測試程式設計小改進點,一是在一些雙核型號上(比如 i.MXRT1170, CM7 和 CM4),如果兩個核同時跑 coremark 程式要用到不同 PIT 的話,需要檢查它們是不是共用一個時鐘開關,防止出現 CM7 上跑完了 coremark 之後關掉 PIT,影響 CM4 那邊 coremark 程式對 PIT 暫存器的訪問。
第二個改進點是 core_main.c 裡的 main() 函式在列印 Total ticks 時會將 u64 型的 total_time 變數強制轉為 u32 型,以便於 %lu 格式化輸出(32位無符號整數),這裡最好還是保留原來 u64 精度,痞子衡嘗試了 %llu 格式化輸出(64位無符號整數),結果在 ee_printf() 下不生效,所以做了個如下手動轉換版:
MAIN_RETURN_TYPE main(void) {
// 程式碼省略...
uint64_t total_time;
total_time=get_time();
//ee_printf("Total ticks : %lu\n",(ee_u32)total_time);
if (total_time & (~(uint64_t)0xFFFFFFFF))
{
ee_printf("Total ticks : ");
ee_printf("%lu", (ee_u32)(total_time / 1000000000));
ee_printf("%lu\n",(ee_u32)(total_time % 1000000000));
}
else
{
ee_printf("Total ticks : %lu\n",(ee_u32)total_time);
}
// 程式碼省略...
}
至此,i.MXRT定時器PIT的多通道連結模式及其在coremark測試裡的應用痞子衡便介紹完畢了,掌聲在哪裡~~~
歡迎訂閱
文章會同時釋出到我的 部落格園主頁、CSDN主頁、知乎主頁、微信公眾號 平臺上。
微信搜尋"痞子衡嵌入式"或者掃描下面二維碼,就可以在手機上第一時間看了哦。