最新消息: USBMI致力于为网友们分享Windows、安卓、IOS等主流手机系统相关的资讯以及评测、同时提供相关教程、应用、软件下载等服务。

Cortex-M3 VS ARM7

IT圈 admin 27浏览 0评论

2024年3月23日发(作者:运水之)

ARM7与Cortex-M3比较

要使用低成本的32位处理器,开发人员面临两种选择,基于Cortex-M3内核或者ARM7TDMI

内核的处理器。如何做出选择?选择标准又是什么?本文主要介绍了ARM Cortex-M3内核微

控制器区别于ARM7的一些特点,帮助您快速选择。

1.ARM实现方法

ARM Cortex-M3是一种基于ARM7v架构的最新ARM嵌入式内核,它采用哈佛结构,使用分离

的指令和数据总线(冯诺伊曼结构下,数据和指令共用一条总线)。从本质上来说,哈佛结构

在物理上更为复杂,但是处理速度明显加快。根据摩尔定理,复杂性并不是一件非常重要的

事,而吞吐量的增加却极具价值。

ARM公司对Cortex-M3的定位是:向专业嵌入式市场提供低成本、低功耗的芯片。在成本和

功耗方面,Cortex-M3具有相当好的性能,ARM公司认为它特别适用于汽车和无线通信领域。

和所有的ARM内核一样,ARM公司将内该设计授权给各个制造商来开发具体的芯片。迄今为

止,已经有多家芯片制造商开始生产基于Cortex-M3内核的微控制器。

ARM7TDMI(包括ARM7TDMIS)系列的ARM内核也是面向同一类市场的。这类内核已经存在了十

多年之久,并推动了ARM成为处理器内核领域的主导者。众多的制造商出售基于ARM7系列

的处理器以及其他配套的系统软件、开发和调试工具。在许多方面,ARM7TDMI都可以称得

上是嵌入式领域的实干家。

2.两者差异

除了使用哈佛结构,Cortex-M3还具有其它显著的优点:具有更小的基础内核,价格更低,

速度更快。与内核集成在一起的是一些系统外设,如中断控制器、总线矩阵、调试功能模块,

而这些外设通常都是由芯片制造商增加的。Cortex-M3还集成了睡眠模式和可选的完整的八

区域存储器保护单元。它采用THUMB-2指令集,最大限度降低了汇编器使用率。

3.指令集

ARM7可以使用ARM和Thumb两种指令集,而Cortex-M3只支持最新的Thumb-2指令集。这

样设计的优势在于:

●免去Thumb和ARM代码的互相切换,对于早期的处理器来说,这种状态切换会降低性能。

●Thumb-2指令集的设计是专门面向C语言的,且包括If/Then结构(预测接下来的四条语

句的条件执行)、硬件除法以及本地位域操作。

●Thumb-2指令集允许用户在C代码层面维护和修改应用程序,C代码部分非常易于重用。

●Thumb-2指令集也包含了调用汇编代码的功能:Luminary公司认为没有必要使用任何汇编

语言。

●综合以上这些优势,新产品的开发将更易于实现,上市时间也大为缩短。

4.中断

Cortex-M3的另一个创新在于嵌套向量中断控制器NVIC(Nested Vector Interrupt

Controller)。相对于ARM7使用的外部中断控制器,Cortex-M3内核中集成了中断控制器,

芯片制造厂商可以对其进行配置,提供基本的32个物理中断,具有8层优先级,最高可达

到240个物理中断和256个中断优先级。此类设计是确定的且具有低延迟性,特别适用于汽

车应用。

NVIC使用的是基于堆栈的异常模型。在处理中断时,将程序计数器,程序状态寄存器,链

接寄存器和通用寄存器压入堆栈,中断处理完成后,在恢复这些寄存器。堆栈处理是由硬件

完成的,无需用汇编语言创建中断服务程序的堆栈操作。

中断嵌套是可以是实现的。中断可以改为使用比之前服务程序更高的优先级,而且可以在运

行时改变优先级状态。使用末尾连锁(tail-chaining)连续中断技术只需消耗三个时钟周期,

相比于32个时钟周期的连续压、出堆栈,大大降低了延迟,提高了性能。

如果在更高优先级的中断到来之前,NVIC已经压堆栈了,那就只需要获取一个新的向量地

址,就可以为更高优先级的中断服务了。同样的,NVIC不会用出堆栈的操作来服务新的中

断。这种做法是完全确定的且具有低延迟性。

5.睡眠

Cortex-M3的电源管理方案通过NVIC支持Sleep Now,Sleep on Exit,(退出最低优先级的

ISR)和SLEEPDEEP modes这三种睡眠模式。

为了产生定期的中断时间间隔,NVIC还集成了系统节拍计时器,这个计时器也可以作为RTOS

和调度任务的心跳。这种做法与先前的ARM架构的不同之处就在于不需要外部时钟。

6.存储器保护单元

存储器保护单元是一个可选组建。选用了这个选项,内存区域就可以与应用程序特定进程按

照其他进程所定义的规则联系在一起。例如,一些内存可以完全被其他进程阻止,而另外一

部分内存能对某些进程表现为只读。还可以禁止进程进入存储器区域。可靠性,特别是实时

性因此得到重大改进。

7.调试

对Cortex-M3处理器系统进行调试和追踪是通过调试访问端口(Debug Access Port)来实现

的。调试访问端口可以是一个2针的串行调试端口(Serial Wire Debug Port)或者串行JTAG

调试端口(Serial Wire JTAG Debug Port)。通过Flash片、断点单元、数据观察点、跟踪

单元,以及可选的嵌入式跟踪宏单元(Embedded Trace Macrocell)和指令跟踪宏单元

(Instrumentation Trace Macrocell)等一系列功能相结合,在内核部分就可以采用多种类

型的调试方法及监控函数。例如,可以设置断点、观察点、定义缺省条件或执行调试请求、

监控停止操作或继续操作。所有的这些功能在ARM架构的产品中已经实现,只是Cortex-M3

将这些功能整合起来,方便开发人员使用。

8.应用范围

虽然ARM7内核并没有像Cortex系列那样集成很多外设,但是大量的基于ARM7的器件,从

通用MCU,到面向应用的MCU、SOC甚至是Actel公司基于ARM7内核的FPGA,都拥有更为众

多的外围设备。大约有150种MCU是基于ARM7内核的(根据不同的统计方法,这个数字可能

会更高)。

你会发现ARM7都可以实现几乎所有的嵌入式应用,或采用定制的方式来满足需求。基于标

准内核,芯片厂商可以加入不同类型、大小的存储器和其他外围设备,比如串行接口、总线

控制器、存储器控制器和图形单元,并针对工业、汽车或者其他要求苛刻的领域,使用不同

的芯片封装,提供不同温度范围的芯片版本。芯片厂商也可能绑定特定的软件,比如TCP/IP

协议栈或面向特定应用的软件。

例如,STMicroelectronics公司的STR7产品线有三个主要系列共45个成员,具有不同的

封装和存储器。每一个系列都针对特定的应用领域,具有不同外设集合。比如STR730家族

是专为工业和汽车应用设计的,因此具有可扩展的温度范围,包括多个I/O口和3个CAN

总线接口。STR710则是面向于消费市场以及高端的工业应用,它具有多个通信接口,比如

USB、CAN、ISO7816以及4个UART,还有大容量的存储器和一个外部存储器接口。

芯片厂商也可以选择利于开发人员开发产品的措施,比如采用ARM的嵌入式跟踪宏单元

ETM(Embedded Trace Macrocell),并提供开发和调试工具。

Luminary、STMicroelectronics这两家公司已经有基于Cortex-M3的芯片,其他公司如NXP、

Atmel也宣布生产该类产品。

9.配套工具

ARM7应用已经非常普及,它已经有非常多第三方的开发和调试工具支持。在ARM的网站上

有超过130家工具公司名称列表。

大多数厂商提供了基本的开发板,并提供下载程序的接口、调试工具以及外部设备的驱动,

包括LED灯的显示状态或者屏幕上的单行显示。通常,开发套件包括编译器、一些调试软件

以及开发板。更为高级的套件包括第三方的集成开发环境(IDE),IDE中包含编译器、链接

器、调试器、编辑器和其他工具,也可能包括仿真硬件,比如说JTAG仿真器。内电路仿真

器(ICE)是最早的也是最有用的调试工具形式之一,很多厂商都在ARM7上提供了这一接口。

软件开发工具范围很广:从建模到可视化设计,到编译器。现在很多的产品也用到实时操作

系统(RTOS)和中间件,以加速开发进程、降低开发难度。另外,还有一个非常重要的因素,

很多的开发人员对ARM7的开发经验非常丰富。

虽然现在已经有新兴的Cortex-M3工具,但显然还是有一定的差距。不过,Cortex-M3的集

成调试性能使调试变得简单且有效,且无需用到内电路仿真器ICE。

10.决策

那么,你应该如何做出何种选择呢?如果成本是最主要考虑因素,您应该选择Cortex-M3;

如果在低成本的情况下寻求更好的性能和改进功耗,您最好考虑选用Cortex-M3;特别是如

果你的应用是汽车和无线领域,最好也采用Cortex-M3,这正是Coretex-M3的主要定位市

场。

由于Cortex-M3内核中的多种集成元素以及采用Thumb-2指令集,其开发和调试比ARM7TDMI

要简单快捷。然而,由于重定义ARM7TDMI的应用不是一件困难的事,特别是在使用了RTOS

的情况下。保守者可能会沿用ARM7TDMI内核的芯片,并避免使用那些会使重定义变得复杂

的功能。

IAR Systems公司是最早做C编译器的厂商,提供一系列ARM开发工具,包括IAR visualSTATE

建模工具、IAR Embedded Workbench for ARM集成开发环境、IAR PowerPac实时操作系统

和中间件、J-Link硬件仿真工具以及开发套件。不管用户的选择是ARM7还是Cortex-M3,

IAR都会让开发变得简单而有趣。

Cortex-M3和ARM7的比较

比较项

ARM7 Cortex-M3

ARMv4T(冯诺依曼) ARMv7-M(哈佛)

架构

指令和数据总线共用,会出现瓶颈 指令和数据总线分开,无瓶颈

32位ARM指令+16位Thumb指令 Thumb/Thumb-2指令集 16位和32位

指令集

两套指令之间需要进行状态切换 指令可直接混写,无需状态切换

3级流水线 若出现转移则需要刷新3级流水线+分支预测 出现转移时流

流水线

流水线,损失惨重 水线无需刷新,几乎无损失

性能 0.95DMIPS/MHz(ARM模式)

功耗 0.28mW/MHz

低功耗

模式

面积 0.62mm2(仅内核)

1.25DMIPS/MHz

0.19mW/MHz

内置睡眠模式

0.86mm2(内核+外设)

中断 普通中断IRQ和快速中断FIQ太少,不可屏蔽中断NMI+1-240个物理中断

大量外设不得不复用中断

中断延

24-42个时钟周期,缓慢

中断压

软件手工压栈,代码长且效率低

每个外设都可以独占一个中断,效率

12个时钟周期,最快只需6个

硬件自动压栈,无需代码且效率高

存储器

无 8段存储器保护单元(MPU)

保护

内核寄寄存器分为多组、结构复杂、占核

寄存器不分组(SP除外),结构简单

存器 面积多

工作模

7种工作模式,比较复杂

乘除法

多周期乘法指令,无除法指令

指令

无 访问外设寄存器需分“读-改-

位操作

写”3步走

系统节

拍定时

只有线程模式和处理模式两种,简单

单周期乘法指令,2-12周期除法指令

先进的Bit-band位操作技术,可直

接访问外设寄存器的某个值

内置系统节拍定时器,有利于操作系

统移植

2024年3月23日发(作者:运水之)

ARM7与Cortex-M3比较

要使用低成本的32位处理器,开发人员面临两种选择,基于Cortex-M3内核或者ARM7TDMI

内核的处理器。如何做出选择?选择标准又是什么?本文主要介绍了ARM Cortex-M3内核微

控制器区别于ARM7的一些特点,帮助您快速选择。

1.ARM实现方法

ARM Cortex-M3是一种基于ARM7v架构的最新ARM嵌入式内核,它采用哈佛结构,使用分离

的指令和数据总线(冯诺伊曼结构下,数据和指令共用一条总线)。从本质上来说,哈佛结构

在物理上更为复杂,但是处理速度明显加快。根据摩尔定理,复杂性并不是一件非常重要的

事,而吞吐量的增加却极具价值。

ARM公司对Cortex-M3的定位是:向专业嵌入式市场提供低成本、低功耗的芯片。在成本和

功耗方面,Cortex-M3具有相当好的性能,ARM公司认为它特别适用于汽车和无线通信领域。

和所有的ARM内核一样,ARM公司将内该设计授权给各个制造商来开发具体的芯片。迄今为

止,已经有多家芯片制造商开始生产基于Cortex-M3内核的微控制器。

ARM7TDMI(包括ARM7TDMIS)系列的ARM内核也是面向同一类市场的。这类内核已经存在了十

多年之久,并推动了ARM成为处理器内核领域的主导者。众多的制造商出售基于ARM7系列

的处理器以及其他配套的系统软件、开发和调试工具。在许多方面,ARM7TDMI都可以称得

上是嵌入式领域的实干家。

2.两者差异

除了使用哈佛结构,Cortex-M3还具有其它显著的优点:具有更小的基础内核,价格更低,

速度更快。与内核集成在一起的是一些系统外设,如中断控制器、总线矩阵、调试功能模块,

而这些外设通常都是由芯片制造商增加的。Cortex-M3还集成了睡眠模式和可选的完整的八

区域存储器保护单元。它采用THUMB-2指令集,最大限度降低了汇编器使用率。

3.指令集

ARM7可以使用ARM和Thumb两种指令集,而Cortex-M3只支持最新的Thumb-2指令集。这

样设计的优势在于:

●免去Thumb和ARM代码的互相切换,对于早期的处理器来说,这种状态切换会降低性能。

●Thumb-2指令集的设计是专门面向C语言的,且包括If/Then结构(预测接下来的四条语

句的条件执行)、硬件除法以及本地位域操作。

●Thumb-2指令集允许用户在C代码层面维护和修改应用程序,C代码部分非常易于重用。

●Thumb-2指令集也包含了调用汇编代码的功能:Luminary公司认为没有必要使用任何汇编

语言。

●综合以上这些优势,新产品的开发将更易于实现,上市时间也大为缩短。

4.中断

Cortex-M3的另一个创新在于嵌套向量中断控制器NVIC(Nested Vector Interrupt

Controller)。相对于ARM7使用的外部中断控制器,Cortex-M3内核中集成了中断控制器,

芯片制造厂商可以对其进行配置,提供基本的32个物理中断,具有8层优先级,最高可达

到240个物理中断和256个中断优先级。此类设计是确定的且具有低延迟性,特别适用于汽

车应用。

NVIC使用的是基于堆栈的异常模型。在处理中断时,将程序计数器,程序状态寄存器,链

接寄存器和通用寄存器压入堆栈,中断处理完成后,在恢复这些寄存器。堆栈处理是由硬件

完成的,无需用汇编语言创建中断服务程序的堆栈操作。

中断嵌套是可以是实现的。中断可以改为使用比之前服务程序更高的优先级,而且可以在运

行时改变优先级状态。使用末尾连锁(tail-chaining)连续中断技术只需消耗三个时钟周期,

相比于32个时钟周期的连续压、出堆栈,大大降低了延迟,提高了性能。

如果在更高优先级的中断到来之前,NVIC已经压堆栈了,那就只需要获取一个新的向量地

址,就可以为更高优先级的中断服务了。同样的,NVIC不会用出堆栈的操作来服务新的中

断。这种做法是完全确定的且具有低延迟性。

5.睡眠

Cortex-M3的电源管理方案通过NVIC支持Sleep Now,Sleep on Exit,(退出最低优先级的

ISR)和SLEEPDEEP modes这三种睡眠模式。

为了产生定期的中断时间间隔,NVIC还集成了系统节拍计时器,这个计时器也可以作为RTOS

和调度任务的心跳。这种做法与先前的ARM架构的不同之处就在于不需要外部时钟。

6.存储器保护单元

存储器保护单元是一个可选组建。选用了这个选项,内存区域就可以与应用程序特定进程按

照其他进程所定义的规则联系在一起。例如,一些内存可以完全被其他进程阻止,而另外一

部分内存能对某些进程表现为只读。还可以禁止进程进入存储器区域。可靠性,特别是实时

性因此得到重大改进。

7.调试

对Cortex-M3处理器系统进行调试和追踪是通过调试访问端口(Debug Access Port)来实现

的。调试访问端口可以是一个2针的串行调试端口(Serial Wire Debug Port)或者串行JTAG

调试端口(Serial Wire JTAG Debug Port)。通过Flash片、断点单元、数据观察点、跟踪

单元,以及可选的嵌入式跟踪宏单元(Embedded Trace Macrocell)和指令跟踪宏单元

(Instrumentation Trace Macrocell)等一系列功能相结合,在内核部分就可以采用多种类

型的调试方法及监控函数。例如,可以设置断点、观察点、定义缺省条件或执行调试请求、

监控停止操作或继续操作。所有的这些功能在ARM架构的产品中已经实现,只是Cortex-M3

将这些功能整合起来,方便开发人员使用。

8.应用范围

虽然ARM7内核并没有像Cortex系列那样集成很多外设,但是大量的基于ARM7的器件,从

通用MCU,到面向应用的MCU、SOC甚至是Actel公司基于ARM7内核的FPGA,都拥有更为众

多的外围设备。大约有150种MCU是基于ARM7内核的(根据不同的统计方法,这个数字可能

会更高)。

你会发现ARM7都可以实现几乎所有的嵌入式应用,或采用定制的方式来满足需求。基于标

准内核,芯片厂商可以加入不同类型、大小的存储器和其他外围设备,比如串行接口、总线

控制器、存储器控制器和图形单元,并针对工业、汽车或者其他要求苛刻的领域,使用不同

的芯片封装,提供不同温度范围的芯片版本。芯片厂商也可能绑定特定的软件,比如TCP/IP

协议栈或面向特定应用的软件。

例如,STMicroelectronics公司的STR7产品线有三个主要系列共45个成员,具有不同的

封装和存储器。每一个系列都针对特定的应用领域,具有不同外设集合。比如STR730家族

是专为工业和汽车应用设计的,因此具有可扩展的温度范围,包括多个I/O口和3个CAN

总线接口。STR710则是面向于消费市场以及高端的工业应用,它具有多个通信接口,比如

USB、CAN、ISO7816以及4个UART,还有大容量的存储器和一个外部存储器接口。

芯片厂商也可以选择利于开发人员开发产品的措施,比如采用ARM的嵌入式跟踪宏单元

ETM(Embedded Trace Macrocell),并提供开发和调试工具。

Luminary、STMicroelectronics这两家公司已经有基于Cortex-M3的芯片,其他公司如NXP、

Atmel也宣布生产该类产品。

9.配套工具

ARM7应用已经非常普及,它已经有非常多第三方的开发和调试工具支持。在ARM的网站上

有超过130家工具公司名称列表。

大多数厂商提供了基本的开发板,并提供下载程序的接口、调试工具以及外部设备的驱动,

包括LED灯的显示状态或者屏幕上的单行显示。通常,开发套件包括编译器、一些调试软件

以及开发板。更为高级的套件包括第三方的集成开发环境(IDE),IDE中包含编译器、链接

器、调试器、编辑器和其他工具,也可能包括仿真硬件,比如说JTAG仿真器。内电路仿真

器(ICE)是最早的也是最有用的调试工具形式之一,很多厂商都在ARM7上提供了这一接口。

软件开发工具范围很广:从建模到可视化设计,到编译器。现在很多的产品也用到实时操作

系统(RTOS)和中间件,以加速开发进程、降低开发难度。另外,还有一个非常重要的因素,

很多的开发人员对ARM7的开发经验非常丰富。

虽然现在已经有新兴的Cortex-M3工具,但显然还是有一定的差距。不过,Cortex-M3的集

成调试性能使调试变得简单且有效,且无需用到内电路仿真器ICE。

10.决策

那么,你应该如何做出何种选择呢?如果成本是最主要考虑因素,您应该选择Cortex-M3;

如果在低成本的情况下寻求更好的性能和改进功耗,您最好考虑选用Cortex-M3;特别是如

果你的应用是汽车和无线领域,最好也采用Cortex-M3,这正是Coretex-M3的主要定位市

场。

由于Cortex-M3内核中的多种集成元素以及采用Thumb-2指令集,其开发和调试比ARM7TDMI

要简单快捷。然而,由于重定义ARM7TDMI的应用不是一件困难的事,特别是在使用了RTOS

的情况下。保守者可能会沿用ARM7TDMI内核的芯片,并避免使用那些会使重定义变得复杂

的功能。

IAR Systems公司是最早做C编译器的厂商,提供一系列ARM开发工具,包括IAR visualSTATE

建模工具、IAR Embedded Workbench for ARM集成开发环境、IAR PowerPac实时操作系统

和中间件、J-Link硬件仿真工具以及开发套件。不管用户的选择是ARM7还是Cortex-M3,

IAR都会让开发变得简单而有趣。

Cortex-M3和ARM7的比较

比较项

ARM7 Cortex-M3

ARMv4T(冯诺依曼) ARMv7-M(哈佛)

架构

指令和数据总线共用,会出现瓶颈 指令和数据总线分开,无瓶颈

32位ARM指令+16位Thumb指令 Thumb/Thumb-2指令集 16位和32位

指令集

两套指令之间需要进行状态切换 指令可直接混写,无需状态切换

3级流水线 若出现转移则需要刷新3级流水线+分支预测 出现转移时流

流水线

流水线,损失惨重 水线无需刷新,几乎无损失

性能 0.95DMIPS/MHz(ARM模式)

功耗 0.28mW/MHz

低功耗

模式

面积 0.62mm2(仅内核)

1.25DMIPS/MHz

0.19mW/MHz

内置睡眠模式

0.86mm2(内核+外设)

中断 普通中断IRQ和快速中断FIQ太少,不可屏蔽中断NMI+1-240个物理中断

大量外设不得不复用中断

中断延

24-42个时钟周期,缓慢

中断压

软件手工压栈,代码长且效率低

每个外设都可以独占一个中断,效率

12个时钟周期,最快只需6个

硬件自动压栈,无需代码且效率高

存储器

无 8段存储器保护单元(MPU)

保护

内核寄寄存器分为多组、结构复杂、占核

寄存器不分组(SP除外),结构简单

存器 面积多

工作模

7种工作模式,比较复杂

乘除法

多周期乘法指令,无除法指令

指令

无 访问外设寄存器需分“读-改-

位操作

写”3步走

系统节

拍定时

只有线程模式和处理模式两种,简单

单周期乘法指令,2-12周期除法指令

先进的Bit-band位操作技术,可直

接访问外设寄存器的某个值

内置系统节拍定时器,有利于操作系

统移植

发布评论

评论列表 (0)

  1. 暂无评论