痞子衡嵌入式:介紹i.MXRT定時器PIT的多通道連結模式及其在coremark測試工程裡的應用

痞子衡發表於2022-02-20

  大家好,我是痞子衡,是正經搞技術的痞子。今天痞子衡給大家介紹的是i.MXRT定時器PIT的多通道連結模式及其在coremark測試裡的應用

  早在 2018 年 i.MXRT 系列跨界處理器剛推出的時候,痞子衡就寫了一篇 《i.MXRT1052效能實測(CoreMark)》,文章詳細介紹了在 i.MXRT 上如何一步一步地移植標準 coremark 程式,這篇文章閱讀量還不錯,據說很多人移植 coremark 都是看得這篇文章。

  當時痞子衡把移植好的 coremark 工程也一起開源了出來,並且這個倉庫痞子衡也是在不斷維護的(增加新 MCU 型號支援,以及除了 coremark 之外的一些其他經典程式)。最近有同事向痞子衡反映,這個 coremark 測試工程裡關於計時部分有一些可以改進的地方,痞子衡看了一下,確實可以改進,這便是今天本文要聊的主題:

一、i.MXRT上的定時器簡介

  工欲善其事,必先利其器。在改進 coremark 測試工程裡計時功能之前,我們先來了解一下 i.MXRT 上都有哪些跟計時/計數相關的模組,分別是什麼特點,下面是詳細列表。單從計時功能角度考慮,SysTick、GPT、PIT、TMR 都是不錯的選擇。

定時器 基本特性 應用特色
SysTick 24bit 計數器 系統(核心)時鐘節拍
GPT 32bit 計數器 計時,外部訊號捕獲,比較
PIT 32bit 計數器 x 4 ch(可級聯) 系統生命週期計時,觸發DMA
TMR 16bit 計數器 x 4 ch(可級聯) 混合功能:計時,訊號捕獲,正交解碼
eFlexPWM 16bit 計數器 x 6 ch PWM訊號生成
QDC 16bit,32bit - 5 ch 連線位置/速度感測器,正交解碼
WDOG 給定時間選項/16bit 系統復位

二、計時設計對coremark測試程式影響

  我們知道 coremark 標準的測試邏輯是在某配置引數組合下單位時間內跑了多少次 coremark 程式,一般情況下要求至少跑 10s 以上,因此計時部分的設計是很重要的。

  在早期 i.MXRT1050 coremark 工程裡,痞子衡選用了 PIT(channel 0 - 32bit)負責計時,為 PIT 配置的時鐘源是 24MHz 外部 OSC,定時器一次超時耗時約 178s,這種情況下,痞子衡也沒有使能 PIT 中斷,假定了一次 coremark 程式跑完不會碰到超時的情況,但顯然這種設計是不完善的。

  此外我們知道定時器時鐘源頻率越高,計時粒度越細,計時時間也就越精確。大部分定時器時鐘源都可以配到系統 IPG bus 匯流排頻率(在 i.MXRT10xx 上可到 125MHz/150MHz,在 i.MXRT1170 上可到 240MHz),我們可以嘗試將定時器設到最高頻率的時鐘源,這時候就不得不考慮定時器超時中斷處理問題了。

  使能定時器超時中斷,可以保證計時的嚴謹性,解決了 coremark 程式執行時間和次數的限制。但是頻繁的定時器中斷響應也會不斷打斷 coremark 程式的執行,對最終跑分結果產生不利影響,這個問題同樣需要解決。

三、PIT定時器多通道連結模式

  前面說了 SysTick、GPT、PIT、TMR 都可以用作 coremark 測試工程定時器,但最終痞子衡還是選定了 PIT,因為 PIT 是最適合作為系統執行生命週期總計時器的,這主要得益於 PIT 內部有 4 個 32bit 計時器,並且可以連結使用(串連)。

  要是將 4 個 32bit 計數器串成一個 128bit 超強計數器(channel 0 計數溢位,channel 1 計數加 1...),即使系統執行到地老天荒都不會出現一次超時(這裡指最後一鏈 channel 3 中斷觸發),所以也就根本不用管定時器中斷處理的事。

  PIT 通道連結模式使能也很簡單,主要在 PIT->CHANNEL[x].TCTRL[CHN] 位上,這個位開啟後,channel x 就和 channel x-1 連了起來。下面是 channel 0 和 channel 1 串連組成 64bit 計數器的初始化程式碼:

void timer_pit_init(void)
{
    // Turn on PIT: MDIS = 0, FRZ = 0
    PIT->MCR = 0x00;

    // Set up timer 1 to max value
    PIT->CHANNEL[1].LDVAL = 0xFFFFFFFF;          // setup timer 1 for maximum counting period
    PIT->CHANNEL[1].TCTRL = 0;                   // Disable timer 1 interrupts
    PIT->CHANNEL[1].TFLG = 1;                    // clear the timer 1 flag
    PIT->CHANNEL[1].TCTRL |= PIT_TCTRL_CHN_MASK; // chain timer 1 to timer 0
    PIT->CHANNEL[1].TCTRL |= PIT_TCTRL_TEN_MASK; // start timer 1

    // Set up timer 0 to max value
    PIT->CHANNEL[0].LDVAL = 0xFFFFFFFF;         // setup timer 0 for maximum counting period
    PIT->CHANNEL[0].TFLG = 1;                   // clear the timer 0 flag
    PIT->CHANNEL[0].TCTRL = PIT_TCTRL_TEN_MASK; // start timer 0
}

  實際上我們也根本不需要 128bit 計數器,64bit 計數器就完全夠用了,就以 150MHz 時鐘源來說,超時一次需要約 3899 年,誰需要操心 3899 年後的事情呢?此外,在 channel 0 和 channel 1 串聯的情況下,PIT 還提供了一個 64bit lifetime 計數器,直接讀這個計數器就能獲取當前 channel 0,1 串連的計數值,不用考慮手動讀 channel 0,1 計數值可能會發生的潛在翻轉問題(rollover)。

  你看,使能了 PIT 通道連結用法後就完美地解決了 coremark 測試程式計時設計問題。

uint64_t timer_pit_get_ticks() {
    uint64_t valueH;
    volatile uint32_t valueL;

#if defined(FSL_FEATURE_PIT_HAS_LIFETIME_TIMER) && (FSL_FEATURE_PIT_HAS_LIFETIME_TIMER == 1)
    valueH = PIT->LTMR64H;
    valueL = PIT->LTMR64L;
#else
    do
    {
        valueL = PIT->CHANNEL[0].CVAL;
        valueH = PIT->CHANNEL[1].CVAL;
    } while (valueL < PIT->CHANNEL[0].CVAL);
#endif // FSL_FEATURE_PIT_HAS_LIFETIME_TIMER

    return ~((valueH << 32) | valueL);
}

四、關於coremark上計時的其他改進點

  最後再提兩個 coremark 測試程式設計小改進點,一是在一些雙核型號上(比如 i.MXRT1170, CM7 和 CM4),如果兩個核同時跑 coremark 程式要用到不同 PIT 的話,需要檢查它們是不是共用一個時鐘開關,防止出現 CM7 上跑完了 coremark 之後關掉 PIT,影響 CM4 那邊 coremark 程式對 PIT 暫存器的訪問。

  第二個改進點是 core_main.c 裡的 main() 函式在列印 Total ticks 時會將 u64 型的 total_time 變數強制轉為 u32 型,以便於 %lu 格式化輸出(32位無符號整數),這裡最好還是保留原來 u64 精度,痞子衡嘗試了 %llu 格式化輸出(64位無符號整數),結果在 ee_printf() 下不生效,所以做了個如下手動轉換版:

MAIN_RETURN_TYPE main(void) {
    // 程式碼省略...
    uint64_t total_time;

    total_time=get_time();

    //ee_printf("Total ticks      : %lu\n",(ee_u32)total_time);
    if (total_time & (~(uint64_t)0xFFFFFFFF))
    {
        ee_printf("Total ticks      : ");
        ee_printf("%lu",  (ee_u32)(total_time / 1000000000));
        ee_printf("%lu\n",(ee_u32)(total_time % 1000000000));
    }
    else
    {
        ee_printf("Total ticks      : %lu\n",(ee_u32)total_time);
    }

    // 程式碼省略...
}

  至此,i.MXRT定時器PIT的多通道連結模式及其在coremark測試裡的應用痞子衡便介紹完畢了,掌聲在哪裡~~~

歡迎訂閱

文章會同時釋出到我的 部落格園主頁CSDN主頁知乎主頁微信公眾號 平臺上。

微信搜尋"痞子衡嵌入式"或者掃描下面二維碼,就可以在手機上第一時間看了哦。

相關文章