一種Cortex-M內核中的精確延時方法

  • 2019 年 10 月 16 日
  • 筆記

本文介紹一種Cortex-M內核中的精確延時方法

前言

為什麼要學習這種延時的方法?

  1. 很多時候我們跑作業系統,就一般會佔用一個硬體定時器——SysTick,而我們一般作業系統的時鐘節拍一般是設置100-1000HZ,也就是1ms——10ms產生一次中斷。很多裸機教程使用延時函數又是基於SysTick的,這樣一來又難免產生衝突。
  2. 很多人會說,不是還有定時器嗎,定時器的計時是超級精確的。這點我不否認,但是假設,如果一個系統,總是進入定時器中斷(10us一次/1us一次/0.5us一次),那整個系統就會經常被打斷,執行緒的進行就沒辦法很好運行啊。此外還消耗一個硬體定時器資源,一個硬體定時器可能做其他事情呢!
  3. 對應ST HAL庫的修改,其實傑傑個人覺得吧,ST的東西什麼都好,就是出的HAL庫太噁心了,沒辦法,而HAL庫中有一個HAL_Delay(),他也是採用SysTick延時的,在移植作業系統的時候,會有諸多不便,不過好在,HAL_Delay()是一個弱定義的,我們可以重寫這個函數的實現,那麼,採用內核延時當然是最好的辦法啦(個人是這麼覺得的)當然你有能力完全用for循環寫個簡單的延時還是可以的。
  4. 可能我說的話沒啥權威,那我就引用Cortex-M3權威指南中的一句話——「DWT 中有剩餘的計數器,它們典型地用於程式程式碼的「性能速寫」(profiling)。通過編程它們,就可以讓它們在計數器溢出時發出事件(以跟蹤數據包的形式)。最典型地,就是使用 CYCCNT暫存器來測量執行某個任務所花的周期數,這也可以用作時間基準相關的目的(作業系統中統計 CPU使用率可以用到它)。」

    Cortex-M中的DWT

    在Cortex-M裡面有一個外設叫DWT(Data Watchpoint and Trace),是用於系統調試及跟蹤,
    它有一個32位的暫存器叫CYCCNT,它是一個向上的計數器,記錄的是內核時鐘運行的個數,內核時鐘跳動一次,該計數器就加1,精度非常高,決定內核的頻率是多少,如果是F103系列,內核時鐘是72M,那精度就是1/72M = 14ns,而程式的運行時間都是微秒級別的,所以14ns的精度是遠遠夠的。最長能記錄的時間為:60s=2的32次方/72000000(假設內核頻率為72M,內核跳一次的時間大概為1/72M=14ns),而如果是H7這種400M主頻的晶片,那它的計時精度高達2.5ns(1/400000000 = 2.5),而如果是 i.MX RT1052這種比較牛逼的處理器,最長能記錄的時間為: 8.13s=2的32次方/528000000 (假設內核頻率為528M,內核跳一次的時間大概為1/528M=1.9ns) 。當CYCCNT溢出之後,會清0重新開始向上計數。

m3、m4、m7傑傑實測可用(m0不可用)。
精度:1/內核頻率(s)。

要實現延時的功能,總共涉及到三個暫存器:DEMCR 、DWT_CTRL、DWT_CYCCNT,分別用於開啟DWT功能、開啟CYCCNT及獲得系統時鐘計數值。

DEMCR

想要使能DWT外設,需要由另外的內核調試暫存器DEMCR的位24控制,寫1使能(劃重點啦,要考試!!)。
DEMCR的地址是0xE000 EDFC

關於DWT_CYCCNT

使能DWT_CYCCNT暫存器之前,先清0。
讓我們看看DWT_CYCCNT的基地址,從ARM-Cortex-M手冊中可以看到其基地址是0xE000 1004,複位默認值是0,而且它的類型是可讀可寫的,我們往0xE000 1004這個地址寫0就將DWT_CYCCNT清0了。

關於CYCCNTENA

CYCCNTENA Enable the CYCCNT counter. If not enabled, the counter does not count and no event is
generated for PS sampling or CYCCNTENA. In normal use, the debugger must initialize
the CYCCNT counter to 0.
它是DWT控制暫存器的第一位,寫1使能,則啟用CYCCNT計數器,否則CYCCNT計數器將不會工作。

綜上所述

想要使用DWT的CYCCNT步驟:

  1. 先使能DWT外設,這個由另外內核調試暫存器DEMCR的位24控制,寫1使能
  2. 使能CYCCNT暫存器之前,先清0。
  3. 使能CYCCNT暫存器,這個由DWT的CYCCNTENA 控制,也就是DWT控制暫存器的位0控制,寫1使能

程式碼實現

/**    ******************************************************************    * @file    core_delay.c    * @author  fire    * @version V1.0    * @date    2018-xx-xx    * @brief   使用內核暫存器精確延時    ******************************************************************    * @attention    *    * 實驗平台:野火 STM32開發板    * 論壇    :http://www.firebbs.cn    * 淘寶    :https://fire-stm32.taobao.com    *    ******************************************************************    */    #include "./delay/core_delay.h"    /*  **********************************************************************  *         時間戳相關暫存器定義  **********************************************************************  */  /*   在Cortex-M裡面有一個外設叫DWT(Data Watchpoint and Trace),   該外設有一個32位的暫存器叫CYCCNT,它是一個向上的計數器,   記錄的是內核時鐘運行的個數,最長能記錄的時間為:   10.74s=2的32次方/400000000   (假設內核頻率為400M,內核跳一次的時間大概為1/400M=2.5ns)   當CYCCNT溢出之後,會清0重新開始向上計數。   使能CYCCNT計數的操作步驟:   1、先使能DWT外設,這個由另外內核調試暫存器DEMCR的位24控制,寫1使能   2、使能CYCCNT暫存器之前,先清0   3、使能CYCCNT暫存器,這個由DWT_CTRL(程式碼上宏定義為DWT_CR)的位0控制,寫1使能   */      #define  DWT_CR      *(__IO uint32_t *)0xE0001000  #define  DWT_CYCCNT  *(__IO uint32_t *)0xE0001004  #define  DEM_CR      *(__IO uint32_t *)0xE000EDFC      #define  DEM_CR_TRCENA                   (1 << 24)  #define  DWT_CR_CYCCNTENA                (1 <<  0)      /**    * @brief  初始化時間戳    * @param  無    * @retval 無    * @note   使用延時函數前,必須調用本函數    */  HAL_StatusTypeDef HAL_InitTick(uint32_t TickPriority)  {      /* 使能DWT外設 */      DEM_CR |= (uint32_t)DEM_CR_TRCENA;        /* DWT CYCCNT暫存器計數清0 */      DWT_CYCCNT = (uint32_t)0u;        /* 使能Cortex-M DWT CYCCNT暫存器 */      DWT_CR |= (uint32_t)DWT_CR_CYCCNTENA;        return HAL_OK;  }    /**    * @brief  讀取當前時間戳    * @param  無    * @retval 當前時間戳,即DWT_CYCCNT暫存器的值    */  uint32_t CPU_TS_TmrRd(void)  {    return ((uint32_t)DWT_CYCCNT);  }    /**    * @brief  讀取當前時間戳    * @param  無    * @retval 當前時間戳,即DWT_CYCCNT暫存器的值    */  uint32_t HAL_GetTick(void)  {    return ((uint32_t)DWT_CYCCNT/SysClockFreq*1000);  }      /**    * @brief  採用CPU的內部計數實現精確延時,32位計數器    * @param  us : 延遲長度,單位1 us    * @retval 無    * @note   使用本函數前必須先調用CPU_TS_TmrInit函數使能計數器,              或使能宏CPU_TS_INIT_IN_DELAY_FUNCTION              最大延時值為8秒,即8*1000*1000    */  void CPU_TS_Tmr_Delay_US(uint32_t us)  {    uint32_t ticks;    uint32_t told,tnow,tcnt=0;      /* 在函數內部初始化時間戳暫存器, */  #if (CPU_TS_INIT_IN_DELAY_FUNCTION)    /* 初始化時間戳並清零 */    HAL_InitTick(5);  #endif      ticks = us * (GET_CPU_ClkFreq() / 1000000);  /* 需要的節拍數 */    tcnt = 0;    told = (uint32_t)CPU_TS_TmrRd();         /* 剛進入時的計數器值 */      while(1)    {      tnow = (uint32_t)CPU_TS_TmrRd();      if(tnow != told)      {          /* 32位計數器是遞增計數器 */        if(tnow > told)        {          tcnt += tnow - told;        }        /* 重新裝載 */        else        {          tcnt += UINT32_MAX - told + tnow;        }          told = tnow;          /*時間超過/等於要延遲的時間,則退出 */        if(tcnt >= ticks)break;      }    }  }    /*********************************************END OF FILE**********************/  
#ifndef __CORE_DELAY_H  #define __CORE_DELAY_H    #include "stm32h7xx.h"    /* 獲取內核時鐘頻率 */  #define GET_CPU_ClkFreq()       HAL_RCC_GetSysClockFreq()  #define SysClockFreq            (218000000)  /* 為方便使用,在延時函數內部調用CPU_TS_TmrInit函數初始化時間戳暫存器,     這樣每次調用函數都會初始化一遍。     把本宏值設置為0,然後在main函數剛運行時調用CPU_TS_TmrInit可避免每次都初始化 */    #define CPU_TS_INIT_IN_DELAY_FUNCTION   0      /*******************************************************************************   * 函數聲明   ******************************************************************************/  uint32_t CPU_TS_TmrRd(void);  HAL_StatusTypeDef HAL_InitTick(uint32_t TickPriority);    //使用以下函數前必須先調用CPU_TS_TmrInit函數使能計數器,或使能宏CPU_TS_INIT_IN_DELAY_FUNCTION  //最大延時值為8秒  void CPU_TS_Tmr_Delay_US(uint32_t us);  #define HAL_Delay(ms)     CPU_TS_Tmr_Delay_US(ms*1000)  #define CPU_TS_Tmr_Delay_S(s)       CPU_TS_Tmr_Delay_MS(s*1000)      #endif /* __CORE_DELAY_H */  

注意事項:

使用者如果不是在HAL庫中使用,注釋掉:

uint32_t HAL_GetTick(void)  {    return ((uint32_t)DWT_CYCCNT/SysClockFreq*1000);  }

同時建議重新命名HAL_InitTick()函數。

按照自己的平台重寫以下宏定義:

/* 獲取內核時鐘頻率 */  #define GET_CPU_ClkFreq()       HAL_RCC_GetSysClockFreq()  #define SysClockFreq            (218000000)

後記

其實在ucos-iii 源碼中,有一個功能是測量關中斷時間的功能,就是使用STM32的時間戳,即記錄程式運行的某個時刻,如果記錄下程式前後的兩個時刻點,即可以算出這段程式的運行時間。
但是有關內核暫存器的描述的資料非常少,還好找到一個(arm手冊),裡面有這些內核暫存器的詳細描述,其中時間戳相關的暫存器在第10章和11章有詳細的描述。關於資料想看的可以後台找我拿。

喜歡就關注我吧!

歡迎關注我公眾號

相關程式碼可以在公眾號後台回復 「 DWT 」獲取。

更多資料歡迎關注「物聯網IoT開發」公眾號!