痞子衡嵌入式:嵌入式Cortex-M中断向量表对齐原则的深入研究


  大家好,我是痞子衡,是正经搞技术的痞子。今天痞子衡给大家分享的是Cortex-M中断向量表对齐原则

  今天这篇文章的内容主要来自于五年前做 Kinetis K32W 系列双核启动时的发现,最近正好有同事碰到了 ARM Cortex-M 中断向量表对齐问题,于是痞子衡想起了这事(感慨自己记性还挺好),翻出了五年前的邮件,将当时测试结果重新整理成文。

  前段时间痞子衡刚写了篇 《Cortex-M中断向量表原理及其重定向方法》,简单介绍了中断向量表工作机制,今天咱们接着来聊聊这个中断向量表对齐的事:

一、Cortex-M中断向量表对齐原则

  中断向量表就是一个集中保存系统全部中断处理函数(xxxIRQHandler)地址的常量数组(函数地址要占 4 个字节,因此数组中每个元素大小为 4 字节),表中元素编号如下:

1. 中断向量表第 0 - 1 个向量比较特殊,是程序初始 SP 和 PC 值
2. 中断向量表第 2 - 15 个向量是系统中断,IRQ 编号为 -14 到 -1
3. 中断向量表第 16 个向量开始是厂商自定义外设中断,IRQ 编号为 0 到 n
   - 对于 Cortex-M0/0+/1,    ARM 建议的 n 值最大为 15(实际一般厂商都会扩展)
   - 对于 Cortex-M3/4/7/23,  ARM 建议的 n 值最大为 239
   - 对于 Cortex-M33/35P/55, ARM 建议的 n 值最大为 479

  Cortex-M 内核(除了CM0)模块 SCB 里有个专门的 VTOR 寄存器用来控制中断向量表首地址,程序运行起来后用户可以配置 SCB->VTOR 寄存器来重设中断向量表地址。

  SCB->VTOR 寄存器低 7bit 是保留的(永远0),所以中断向量表首地址一定要是 128 字节(0x80)对齐的,这个毫无疑问!但是仅仅 128 字节对齐就行了吗?这个是要看情况的,如下 Cortex-M Generic User Guide 手册里关于 VTOR 寄存器描述里有这样一段话(红框内),这段话的意思是向量表首地址需要按 0x80 向上对齐(还得是 2 的整数幂)以覆盖项目中实际用到的数值最大中断号(xxx_IRQn)。

  • Note: 比如项目中实际用到最大外设中断为 IRQ20,则最小向量表大小为(16 + 21)* 4 字节,那么向量表首地址需要至少以 0x100 对齐。

二、Cortex-M中断向量表不对齐的后果

  如果中断向量表首地址没有按规定对齐,会发生什么后果呢?我们找一块板卡来实测下,选择的芯片是恩智浦 i.MXRT1011,这是颗 Cortex-M7 内核的 MCU,除了 16 个系统中断外,还包含 80 个外设中断,中断向量表里一共 96 个有效中断,见如下 startup_MIMXRT1011.s 文件中具体中断响应函数定义:

  因为 i.MXRT1011 里一共 96 个中断,按规定,中断向量表首地址至少要按 0x200 对齐。我们现在故意不按规定来设对齐,先选择一个测试工程 \SDK_2.10.0_EVK-MIMXRT1010\boards\evkmimxrt1010\demo_apps\hello_world\iar(flexspi_nor_build),修改 hello_world.c 文件,加一个 relocate_vector_table() 函数,将中断向量表重定向到 NEW_VECTOR_ADDRESS:

#define NEW_VECTOR_ADDRESS (0x00000080)

extern uint32_t __VECTOR_TABLE[];
void relocate_vector_table(void)
{
    __disable_irq();
    // 将 0x60002000 处的初始中断向量表拷贝到新地址 NEW_VECTOR_ADDRESS
    memcpy((void *)NEW_VECTOR_ADDRESS, (void *)__VECTOR_TABLE, 0x180);
    // 将 VTOR 指向 NEW_VECTOR_ADDRESS
    SCB->VTOR = NEW_VECTOR_ADDRESS;
    __enable_irq();
}

int main(void)
{
    relocate_vector_table();

    // 其余代码
}

  万事俱备,我们现在需要使能一些中断来验证,痞子衡分别选取了 SysTick、LPUART1、GPT2、WDOG2、TEMP_LOW_HIGH、WDOG1 六个中断,它们的使能代码都可以从 SDK\boards\evkmimxrt1010\driver_examples\ 里找到,这里不予赘述。

2.1 测试以 0x80 对齐的中断向量表

  将 NEW_VECTOR_ADDRESS 设为 ITCM 偏移 0x80 处,则中断向量表被重定向到了按 0x80 对齐的地方,分别测试选定的 6 个中断,最终结果如下:SysTick、TEMP_LOW_HIGH、WDOG1 中断响应是正常的,而 LPUART1、GPT2、WDOG2 实际响应的中断函数却是 MemManage、SysTick、DMA13 位置,这里出现了异常。

#define NEW_VECTOR_ADDRESS (0x00000080)

2.2 测试以 0x100 对齐的中断向量表

  将 NEW_VECTOR_ADDRESS 设为 ITCM 偏移 0x100 处,则中断向量表被重定向到了按 0x100 对齐的地方,分别测试选定的 6 个中断,最终结果如下:SysTick、LPUART1、GPT2、WDOG2 中断响应是正常的,而 TEMP_LOW_HIGH、WDOG1 实际响应的中断函数却是 SysTick、DMA10 位置,还是出现了异常。

#define NEW_VECTOR_ADDRESS (0x00000100)

2.3 测试以 0x180 对齐的中断向量表

  将 NEW_VECTOR_ADDRESS 设为 ITCM 偏移 0x180 处,则中断向量表被重定向到了按 0x180 对齐的地方,实测效果跟 2.1 节一致。

#define NEW_VECTOR_ADDRESS (0x00000180)

2.4 测试以 0x200 对齐的中断向量表

  将 NEW_VECTOR_ADDRESS 设为 ITCM 偏移 0x200 处,则中断向量表被重定向到了按 0x200 对齐的地方,6 个中断都能正常响应,毕竟是符合 ARM 手册里对齐规定。

#define NEW_VECTOR_ADDRESS (0x00000200)

2.5 测试结果总结

  因为 i.MXRT1011 最多仅 96 个有效中断,有些对齐测试不能完全覆盖,痞子衡后来又在 i.MXRT1176 上(最多 234 个有效中断)以同样方式测了一遍,最终总结到现象如下:

1. 当中断向量表以 0x80 对齐时:
  - 表中 (2n*0x80)/4 处开始的连续 32 个中断均能够正常响应,n 可取值 0 - 7
  - 表中 ((2n+1)*0x80)/4 处开始的连续 32 个中断发生时,实际响应的却是表中((2n*0x80)/4 处对应的连续 32 个中断函数
2. 当中断向量表以 0x100 对齐时:
  - 表中 (2n*0x100)/4 处开始的连续 64 个中断均能够正常响应,n 可取值 0 - 4
  - 表中 ((2n+1)*0x100)/4 处开始的连续 64 个中断发生时,实际响应的却是表中((2n*0x100)/4 处对应的连续 64 个中断函数
3. 当中断向量表以 0x200 对齐时:
  - 表中 (2n*0x200)/4 处开始的连续 128 个中断均能够正常响应,n 可取值 0 - 1
  - 表中 ((2n+1)*0x200)/4 处开始的连续 128 个中断发生时,实际响应的却是表中((2n*0x200)/4 处对应的连续 128 个中断函数
4. 当中断向量表以 0x400 对齐时:
  - 表中前 256 个中断均能够正常响应
  - 推测表中第 256 - 511 个中断发生时,实际响应的是表中 0 - 255 个中断函数
5. 当中断向量表以 0x800 对齐时:
  - 表中前 512 个中断均能够正常响应

6. 当中断向量表以 0x180 对齐时:未详尽测试,效果似乎与以 0x80 对齐一致
7. 当中断向量表以 0x280 对齐时:未详尽测试,第 100 个中断误触发第 68 个中断函数,第 136 个中断触发 HardFault
8. 当中断向量表以 0x300 对齐时:未详尽测试,第 100/136 个中断均触发 HardFault
...

三、Cortex-M中断向量表不对齐的妙用

  关于第 2 节里中断向量表不对齐的测试结果发现有什么意义呢?其实是有的,我们可以利用这个结果来精简中断向量表的大小,这对于一些 Flash 容量较小的 MCU 上开发应用程序时优化代码尺寸会有帮助,底下痞子衡会专门写文章具体介绍。

  至此,Cortex-M中断向量表对齐原则痞子衡便介绍完毕了,掌声在哪里~~~

欢迎订阅

文章会同时发布到我的 博客园主页CSDN主页知乎主页微信公众号 平台上。

微信搜索”痞子衡嵌入式“或者扫描下面二维码,就可以在手机上第一时间看了哦。