2024年3月23日发(作者:运水之)
ARM7与Cortex-M3比较
要使用低成本的32位处理器,开发人员面临两种选择,基于Cortex-M3内核或者ARM7TDMI
内核的处理器。如何做出选择?选择标准又是什么?本文主要介绍了ARM Cortex-M3内核微
控制器区别于ARM7的一些特点,帮助您快速选择。
1.ARM实现方法
ARM Cortex-M3是一种基于ARM7v架构的最新ARM嵌入式内核,它采用哈佛结构,使用分离
的指令和数据总线(冯诺伊曼结构下,数据和指令共用一条总线)。从本质上来说,哈佛结构
在物理上更为复杂,但是处理速度明显加快。根据摩尔定理,复杂性并不是一件非常重要的
事,而吞吐量的增加却极具价值。
ARM公司对Cortex-M3的定位是:向专业嵌入式市场提供低成本、低功耗的芯片。在成本和
功耗方面,Cortex-M3具有相当好的性能,ARM公司认为它特别适用于汽车和无线通信领域。
和所有的ARM内核一样,ARM公司将内该设计授权给各个制造商来开发具体的芯片。迄今为
止,已经有多家芯片制造商开始生产基于Cortex-M3内核的微控制器。
ARM7TDMI(包括ARM7TDMIS)系列的ARM内核也是面向同一类市场的。这类内核已经存在了十
多年之久,并推动了ARM成为处理器内核领域的主导者。众多的制造商出售基于ARM7系列
的处理器以及其他配套的系统软件、开发和调试工具。在许多方面,ARM7TDMI都可以称得
上是嵌入式领域的实干家。
2.两者差异
除了使用哈佛结构,Cortex-M3还具有其它显著的优点:具有更小的基础内核,价格更低,
速度更快。与内核集成在一起的是一些系统外设,如中断控制器、总线矩阵、调试功能模块,
而这些外设通常都是由芯片制造商增加的。Cortex-M3还集成了睡眠模式和可选的完整的八
区域存储器保护单元。它采用THUMB-2指令集,最大限度降低了汇编器使用率。
3.指令集
ARM7可以使用ARM和Thumb两种指令集,而Cortex-M3只支持最新的Thumb-2指令集。这
样设计的优势在于:
●免去Thumb和ARM代码的互相切换,对于早期的处理器来说,这种状态切换会降低性能。
●Thumb-2指令集的设计是专门面向C语言的,且包括If/Then结构(预测接下来的四条语
句的条件执行)、硬件除法以及本地位域操作。
●Thumb-2指令集允许用户在C代码层面维护和修改应用程序,C代码部分非常易于重用。
●Thumb-2指令集也包含了调用汇编代码的功能:Luminary公司认为没有必要使用任何汇编
语言。
●综合以上这些优势,新产品的开发将更易于实现,上市时间也大为缩短。
4.中断
Cortex-M3的另一个创新在于嵌套向量中断控制器NVIC(Nested Vector Interrupt
Controller)。相对于ARM7使用的外部中断控制器,Cortex-M3内核中集成了中断控制器,
芯片制造厂商可以对其进行配置,提供基本的32个物理中断,具有8层优先级,最高可达
到240个物理中断和256个中断优先级。此类设计是确定的且具有低延迟性,特别适用于汽
车应用。
NVIC使用的是基于堆栈的异常模型。在处理中断时,将程序计数器,程序状态寄存器,链
接寄存器和通用寄存器压入堆栈,中断处理完成后,在恢复这些寄存器。堆栈处理是由硬件
完成的,无需用汇编语言创建中断服务程序的堆栈操作。
中断嵌套是可以是实现的。中断可以改为使用比之前服务程序更高的优先级,而且可以在运
行时改变优先级状态。使用末尾连锁(tail-chaining)连续中断技术只需消耗三个时钟周期,
相比于32个时钟周期的连续压、出堆栈,大大降低了延迟,提高了性能。
如果在更高优先级的中断到来之前,NVIC已经压堆栈了,那就只需要获取一个新的向量地
址,就可以为更高优先级的中断服务了。同样的,NVIC不会用出堆栈的操作来服务新的中
断。这种做法是完全确定的且具有低延迟性。
5.睡眠
Cortex-M3的电源管理方案通过NVIC支持Sleep Now,Sleep on Exit,(退出最低优先级的
ISR)和SLEEPDEEP modes这三种睡眠模式。
为了产生定期的中断时间间隔,NVIC还集成了系统节拍计时器,这个计时器也可以作为RTOS
和调度任务的心跳。这种做法与先前的ARM架构的不同之处就在于不需要外部时钟。
6.存储器保护单元
存储器保护单元是一个可选组建。选用了这个选项,内存区域就可以与应用程序特定进程按
照其他进程所定义的规则联系在一起。例如,一些内存可以完全被其他进程阻止,而另外一
部分内存能对某些进程表现为只读。还可以禁止进程进入存储器区域。可靠性,特别是实时
性因此得到重大改进。
7.调试
对Cortex-M3处理器系统进行调试和追踪是通过调试访问端口(Debug Access Port)来实现
的。调试访问端口可以是一个2针的串行调试端口(Serial Wire Debug Port)或者串行JTAG
调试端口(Serial Wire JTAG Debug Port)。通过Flash片、断点单元、数据观察点、跟踪
单元,以及可选的嵌入式跟踪宏单元(Embedded Trace Macrocell)和指令跟踪宏单元
(Instrumentation Trace Macrocell)等一系列功能相结合,在内核部分就可以采用多种类
型的调试方法及监控函数。例如,可以设置断点、观察点、定义缺省条件或执行调试请求、
监控停止操作或继续操作。所有的这些功能在ARM架构的产品中已经实现,只是Cortex-M3
将这些功能整合起来,方便开发人员使用。
8.应用范围
虽然ARM7内核并没有像Cortex系列那样集成很多外设,但是大量的基于ARM7的器件,从
通用MCU,到面向应用的MCU、SOC甚至是Actel公司基于ARM7内核的FPGA,都拥有更为众
多的外围设备。大约有150种MCU是基于ARM7内核的(根据不同的统计方法,这个数字可能
会更高)。
你会发现ARM7都可以实现几乎所有的嵌入式应用,或采用定制的方式来满足需求。基于标
准内核,芯片厂商可以加入不同类型、大小的存储器和其他外围设备,比如串行接口、总线
控制器、存储器控制器和图形单元,并针对工业、汽车或者其他要求苛刻的领域,使用不同
的芯片封装,提供不同温度范围的芯片版本。芯片厂商也可能绑定特定的软件,比如TCP/IP
协议栈或面向特定应用的软件。
例如,STMicroelectronics公司的STR7产品线有三个主要系列共45个成员,具有不同的
封装和存储器。每一个系列都针对特定的应用领域,具有不同外设集合。比如STR730家族
是专为工业和汽车应用设计的,因此具有可扩展的温度范围,包括多个I/O口和3个CAN
总线接口。STR710则是面向于消费市场以及高端的工业应用,它具有多个通信接口,比如
USB、CAN、ISO7816以及4个UART,还有大容量的存储器和一个外部存储器接口。
芯片厂商也可以选择利于开发人员开发产品的措施,比如采用ARM的嵌入式跟踪宏单元
ETM(Embedded Trace Macrocell),并提供开发和调试工具。
Luminary、STMicroelectronics这两家公司已经有基于Cortex-M3的芯片,其他公司如NXP、
Atmel也宣布生产该类产品。
9.配套工具
ARM7应用已经非常普及,它已经有非常多第三方的开发和调试工具支持。在ARM的网站上
有超过130家工具公司名称列表。
大多数厂商提供了基本的开发板,并提供下载程序的接口、调试工具以及外部设备的驱动,
包括LED灯的显示状态或者屏幕上的单行显示。通常,开发套件包括编译器、一些调试软件
以及开发板。更为高级的套件包括第三方的集成开发环境(IDE),IDE中包含编译器、链接
器、调试器、编辑器和其他工具,也可能包括仿真硬件,比如说JTAG仿真器。内电路仿真
器(ICE)是最早的也是最有用的调试工具形式之一,很多厂商都在ARM7上提供了这一接口。
软件开发工具范围很广:从建模到可视化设计,到编译器。现在很多的产品也用到实时操作
系统(RTOS)和中间件,以加速开发进程、降低开发难度。另外,还有一个非常重要的因素,
很多的开发人员对ARM7的开发经验非常丰富。
虽然现在已经有新兴的Cortex-M3工具,但显然还是有一定的差距。不过,Cortex-M3的集
成调试性能使调试变得简单且有效,且无需用到内电路仿真器ICE。
10.决策
那么,你应该如何做出何种选择呢?如果成本是最主要考虑因素,您应该选择Cortex-M3;
如果在低成本的情况下寻求更好的性能和改进功耗,您最好考虑选用Cortex-M3;特别是如
果你的应用是汽车和无线领域,最好也采用Cortex-M3,这正是Coretex-M3的主要定位市
场。
由于Cortex-M3内核中的多种集成元素以及采用Thumb-2指令集,其开发和调试比ARM7TDMI
要简单快捷。然而,由于重定义ARM7TDMI的应用不是一件困难的事,特别是在使用了RTOS
的情况下。保守者可能会沿用ARM7TDMI内核的芯片,并避免使用那些会使重定义变得复杂
的功能。
IAR Systems公司是最早做C编译器的厂商,提供一系列ARM开发工具,包括IAR visualSTATE
建模工具、IAR Embedded Workbench for ARM集成开发环境、IAR PowerPac实时操作系统
和中间件、J-Link硬件仿真工具以及开发套件。不管用户的选择是ARM7还是Cortex-M3,
IAR都会让开发变得简单而有趣。
Cortex-M3和ARM7的比较
比较项
ARM7 Cortex-M3
目
ARMv4T(冯诺依曼) ARMv7-M(哈佛)
架构
指令和数据总线共用,会出现瓶颈 指令和数据总线分开,无瓶颈
32位ARM指令+16位Thumb指令 Thumb/Thumb-2指令集 16位和32位
指令集
两套指令之间需要进行状态切换 指令可直接混写,无需状态切换
3级流水线 若出现转移则需要刷新3级流水线+分支预测 出现转移时流
流水线
流水线,损失惨重 水线无需刷新,几乎无损失
性能 0.95DMIPS/MHz(ARM模式)
功耗 0.28mW/MHz
低功耗
无
模式
面积 0.62mm2(仅内核)
1.25DMIPS/MHz
0.19mW/MHz
内置睡眠模式
0.86mm2(内核+外设)
中断 普通中断IRQ和快速中断FIQ太少,不可屏蔽中断NMI+1-240个物理中断
大量外设不得不复用中断
中断延
24-42个时钟周期,缓慢
迟
中断压
软件手工压栈,代码长且效率低
栈
每个外设都可以独占一个中断,效率
高
12个时钟周期,最快只需6个
硬件自动压栈,无需代码且效率高
存储器
无 8段存储器保护单元(MPU)
保护
内核寄寄存器分为多组、结构复杂、占核
寄存器不分组(SP除外),结构简单
存器 面积多
工作模
7种工作模式,比较复杂
式
乘除法
多周期乘法指令,无除法指令
指令
无 访问外设寄存器需分“读-改-
位操作
写”3步走
系统节
无
拍定时
只有线程模式和处理模式两种,简单
单周期乘法指令,2-12周期除法指令
先进的Bit-band位操作技术,可直
接访问外设寄存器的某个值
内置系统节拍定时器,有利于操作系
统移植
2024年3月23日发(作者:运水之)
ARM7与Cortex-M3比较
要使用低成本的32位处理器,开发人员面临两种选择,基于Cortex-M3内核或者ARM7TDMI
内核的处理器。如何做出选择?选择标准又是什么?本文主要介绍了ARM Cortex-M3内核微
控制器区别于ARM7的一些特点,帮助您快速选择。
1.ARM实现方法
ARM Cortex-M3是一种基于ARM7v架构的最新ARM嵌入式内核,它采用哈佛结构,使用分离
的指令和数据总线(冯诺伊曼结构下,数据和指令共用一条总线)。从本质上来说,哈佛结构
在物理上更为复杂,但是处理速度明显加快。根据摩尔定理,复杂性并不是一件非常重要的
事,而吞吐量的增加却极具价值。
ARM公司对Cortex-M3的定位是:向专业嵌入式市场提供低成本、低功耗的芯片。在成本和
功耗方面,Cortex-M3具有相当好的性能,ARM公司认为它特别适用于汽车和无线通信领域。
和所有的ARM内核一样,ARM公司将内该设计授权给各个制造商来开发具体的芯片。迄今为
止,已经有多家芯片制造商开始生产基于Cortex-M3内核的微控制器。
ARM7TDMI(包括ARM7TDMIS)系列的ARM内核也是面向同一类市场的。这类内核已经存在了十
多年之久,并推动了ARM成为处理器内核领域的主导者。众多的制造商出售基于ARM7系列
的处理器以及其他配套的系统软件、开发和调试工具。在许多方面,ARM7TDMI都可以称得
上是嵌入式领域的实干家。
2.两者差异
除了使用哈佛结构,Cortex-M3还具有其它显著的优点:具有更小的基础内核,价格更低,
速度更快。与内核集成在一起的是一些系统外设,如中断控制器、总线矩阵、调试功能模块,
而这些外设通常都是由芯片制造商增加的。Cortex-M3还集成了睡眠模式和可选的完整的八
区域存储器保护单元。它采用THUMB-2指令集,最大限度降低了汇编器使用率。
3.指令集
ARM7可以使用ARM和Thumb两种指令集,而Cortex-M3只支持最新的Thumb-2指令集。这
样设计的优势在于:
●免去Thumb和ARM代码的互相切换,对于早期的处理器来说,这种状态切换会降低性能。
●Thumb-2指令集的设计是专门面向C语言的,且包括If/Then结构(预测接下来的四条语
句的条件执行)、硬件除法以及本地位域操作。
●Thumb-2指令集允许用户在C代码层面维护和修改应用程序,C代码部分非常易于重用。
●Thumb-2指令集也包含了调用汇编代码的功能:Luminary公司认为没有必要使用任何汇编
语言。
●综合以上这些优势,新产品的开发将更易于实现,上市时间也大为缩短。
4.中断
Cortex-M3的另一个创新在于嵌套向量中断控制器NVIC(Nested Vector Interrupt
Controller)。相对于ARM7使用的外部中断控制器,Cortex-M3内核中集成了中断控制器,
芯片制造厂商可以对其进行配置,提供基本的32个物理中断,具有8层优先级,最高可达
到240个物理中断和256个中断优先级。此类设计是确定的且具有低延迟性,特别适用于汽
车应用。
NVIC使用的是基于堆栈的异常模型。在处理中断时,将程序计数器,程序状态寄存器,链
接寄存器和通用寄存器压入堆栈,中断处理完成后,在恢复这些寄存器。堆栈处理是由硬件
完成的,无需用汇编语言创建中断服务程序的堆栈操作。
中断嵌套是可以是实现的。中断可以改为使用比之前服务程序更高的优先级,而且可以在运
行时改变优先级状态。使用末尾连锁(tail-chaining)连续中断技术只需消耗三个时钟周期,
相比于32个时钟周期的连续压、出堆栈,大大降低了延迟,提高了性能。
如果在更高优先级的中断到来之前,NVIC已经压堆栈了,那就只需要获取一个新的向量地
址,就可以为更高优先级的中断服务了。同样的,NVIC不会用出堆栈的操作来服务新的中
断。这种做法是完全确定的且具有低延迟性。
5.睡眠
Cortex-M3的电源管理方案通过NVIC支持Sleep Now,Sleep on Exit,(退出最低优先级的
ISR)和SLEEPDEEP modes这三种睡眠模式。
为了产生定期的中断时间间隔,NVIC还集成了系统节拍计时器,这个计时器也可以作为RTOS
和调度任务的心跳。这种做法与先前的ARM架构的不同之处就在于不需要外部时钟。
6.存储器保护单元
存储器保护单元是一个可选组建。选用了这个选项,内存区域就可以与应用程序特定进程按
照其他进程所定义的规则联系在一起。例如,一些内存可以完全被其他进程阻止,而另外一
部分内存能对某些进程表现为只读。还可以禁止进程进入存储器区域。可靠性,特别是实时
性因此得到重大改进。
7.调试
对Cortex-M3处理器系统进行调试和追踪是通过调试访问端口(Debug Access Port)来实现
的。调试访问端口可以是一个2针的串行调试端口(Serial Wire Debug Port)或者串行JTAG
调试端口(Serial Wire JTAG Debug Port)。通过Flash片、断点单元、数据观察点、跟踪
单元,以及可选的嵌入式跟踪宏单元(Embedded Trace Macrocell)和指令跟踪宏单元
(Instrumentation Trace Macrocell)等一系列功能相结合,在内核部分就可以采用多种类
型的调试方法及监控函数。例如,可以设置断点、观察点、定义缺省条件或执行调试请求、
监控停止操作或继续操作。所有的这些功能在ARM架构的产品中已经实现,只是Cortex-M3
将这些功能整合起来,方便开发人员使用。
8.应用范围
虽然ARM7内核并没有像Cortex系列那样集成很多外设,但是大量的基于ARM7的器件,从
通用MCU,到面向应用的MCU、SOC甚至是Actel公司基于ARM7内核的FPGA,都拥有更为众
多的外围设备。大约有150种MCU是基于ARM7内核的(根据不同的统计方法,这个数字可能
会更高)。
你会发现ARM7都可以实现几乎所有的嵌入式应用,或采用定制的方式来满足需求。基于标
准内核,芯片厂商可以加入不同类型、大小的存储器和其他外围设备,比如串行接口、总线
控制器、存储器控制器和图形单元,并针对工业、汽车或者其他要求苛刻的领域,使用不同
的芯片封装,提供不同温度范围的芯片版本。芯片厂商也可能绑定特定的软件,比如TCP/IP
协议栈或面向特定应用的软件。
例如,STMicroelectronics公司的STR7产品线有三个主要系列共45个成员,具有不同的
封装和存储器。每一个系列都针对特定的应用领域,具有不同外设集合。比如STR730家族
是专为工业和汽车应用设计的,因此具有可扩展的温度范围,包括多个I/O口和3个CAN
总线接口。STR710则是面向于消费市场以及高端的工业应用,它具有多个通信接口,比如
USB、CAN、ISO7816以及4个UART,还有大容量的存储器和一个外部存储器接口。
芯片厂商也可以选择利于开发人员开发产品的措施,比如采用ARM的嵌入式跟踪宏单元
ETM(Embedded Trace Macrocell),并提供开发和调试工具。
Luminary、STMicroelectronics这两家公司已经有基于Cortex-M3的芯片,其他公司如NXP、
Atmel也宣布生产该类产品。
9.配套工具
ARM7应用已经非常普及,它已经有非常多第三方的开发和调试工具支持。在ARM的网站上
有超过130家工具公司名称列表。
大多数厂商提供了基本的开发板,并提供下载程序的接口、调试工具以及外部设备的驱动,
包括LED灯的显示状态或者屏幕上的单行显示。通常,开发套件包括编译器、一些调试软件
以及开发板。更为高级的套件包括第三方的集成开发环境(IDE),IDE中包含编译器、链接
器、调试器、编辑器和其他工具,也可能包括仿真硬件,比如说JTAG仿真器。内电路仿真
器(ICE)是最早的也是最有用的调试工具形式之一,很多厂商都在ARM7上提供了这一接口。
软件开发工具范围很广:从建模到可视化设计,到编译器。现在很多的产品也用到实时操作
系统(RTOS)和中间件,以加速开发进程、降低开发难度。另外,还有一个非常重要的因素,
很多的开发人员对ARM7的开发经验非常丰富。
虽然现在已经有新兴的Cortex-M3工具,但显然还是有一定的差距。不过,Cortex-M3的集
成调试性能使调试变得简单且有效,且无需用到内电路仿真器ICE。
10.决策
那么,你应该如何做出何种选择呢?如果成本是最主要考虑因素,您应该选择Cortex-M3;
如果在低成本的情况下寻求更好的性能和改进功耗,您最好考虑选用Cortex-M3;特别是如
果你的应用是汽车和无线领域,最好也采用Cortex-M3,这正是Coretex-M3的主要定位市
场。
由于Cortex-M3内核中的多种集成元素以及采用Thumb-2指令集,其开发和调试比ARM7TDMI
要简单快捷。然而,由于重定义ARM7TDMI的应用不是一件困难的事,特别是在使用了RTOS
的情况下。保守者可能会沿用ARM7TDMI内核的芯片,并避免使用那些会使重定义变得复杂
的功能。
IAR Systems公司是最早做C编译器的厂商,提供一系列ARM开发工具,包括IAR visualSTATE
建模工具、IAR Embedded Workbench for ARM集成开发环境、IAR PowerPac实时操作系统
和中间件、J-Link硬件仿真工具以及开发套件。不管用户的选择是ARM7还是Cortex-M3,
IAR都会让开发变得简单而有趣。
Cortex-M3和ARM7的比较
比较项
ARM7 Cortex-M3
目
ARMv4T(冯诺依曼) ARMv7-M(哈佛)
架构
指令和数据总线共用,会出现瓶颈 指令和数据总线分开,无瓶颈
32位ARM指令+16位Thumb指令 Thumb/Thumb-2指令集 16位和32位
指令集
两套指令之间需要进行状态切换 指令可直接混写,无需状态切换
3级流水线 若出现转移则需要刷新3级流水线+分支预测 出现转移时流
流水线
流水线,损失惨重 水线无需刷新,几乎无损失
性能 0.95DMIPS/MHz(ARM模式)
功耗 0.28mW/MHz
低功耗
无
模式
面积 0.62mm2(仅内核)
1.25DMIPS/MHz
0.19mW/MHz
内置睡眠模式
0.86mm2(内核+外设)
中断 普通中断IRQ和快速中断FIQ太少,不可屏蔽中断NMI+1-240个物理中断
大量外设不得不复用中断
中断延
24-42个时钟周期,缓慢
迟
中断压
软件手工压栈,代码长且效率低
栈
每个外设都可以独占一个中断,效率
高
12个时钟周期,最快只需6个
硬件自动压栈,无需代码且效率高
存储器
无 8段存储器保护单元(MPU)
保护
内核寄寄存器分为多组、结构复杂、占核
寄存器不分组(SP除外),结构简单
存器 面积多
工作模
7种工作模式,比较复杂
式
乘除法
多周期乘法指令,无除法指令
指令
无 访问外设寄存器需分“读-改-
位操作
写”3步走
系统节
无
拍定时
只有线程模式和处理模式两种,简单
单周期乘法指令,2-12周期除法指令
先进的Bit-band位操作技术,可直
接访问外设寄存器的某个值
内置系统节拍定时器,有利于操作系
统移植