2024年9月24日发(作者:庚思萱)
ARM11 CPU 处理器的详细介绍
ARM11 CPU
处理器的详细介绍
处理器的详细介绍
目录:产品导购资讯 人气:3729 发表时间:2010年01月29日
文章出处:车百饰汽车影音网 责任编辑:车百饰汽车影音网 作者:车百
饰汽车影音网
ARM11
ARM11系列微处理器是ARM公司近年推出的新一代RISC处理器。它是ARM
新指令架构——ARMv6
新指令架构——
ARMv6的第一代设计实现。该系列主要有ARM1136J,
ARM1136J
,ARM1156T2
和ARM1176JZ三个内核型号,分别针对不同应用领域。
ARMv6结构体系
结构体系
实现新一代微处理器的第一步就是订立一个新的结构体系。这里所说的结构
体系只是对处理器行为进行描述,并不包括具体地指定处理器是如何被建造的。
结构体系的定义提供了处理器和外界(操作系统,应用程序和调试支持)的接口,
从细节上说,处理器结构体系定义了指令集、编程模式和最近的存储器之间的接
处理器结构体系定义了指令集、
编程模式和最近的存储器之间的接
口。最新的ARM处理器架构—ARMv6
处理器架构—
ARMv6,发布于
ARMv6
,发布于2001年10月,它建立于过去十年
ARM许多成功的结构体系基础上。同处理器的授权相似,ARM也向客户授权它的
结构体系。比如,Intel
结构体系。比如,
Intel的XScale就是基于ARMv5TE的处理器。
的处理器。
目标应用
目标应用
ARMv6架构是根据下一代的消费类电子、无线设备、网络应用和汽车电子产
品等需求而制定的。ARM11
品等需求而制定的。
ARM11的媒体处理能力和低功耗特点,特别适用于无线和消
费类电子产品;其高数据吞吐量和高性能的结合非常适合网络处理应用;另外,
也在实时性能和浮点处理等方面ARM11可以满足汽车电子应用的需求。可以预言,
基于AMRv6体系结构的ARM11系列处理器将在上述领域发挥巨大的作用。
主要特点
主要特点
对于各种无线移动应用,毫无节制的提供高性能处理器是无用的。同成本控
毫无节制的提供高性能处理器是无用的。
同成本控
制类似,功耗的控制也是一个重要因素。ARM11
制类似,功耗的控制也是一个重要因素。
ARM11系列处理器展示了在性能上的巨
大提升,首先推出350M~500MHz时钟频率的内核,在未来将上升到1GHz时钟频
率ARM11处理器在提供高性能的同时,也允许在性能和功耗间做权衡以满足某些
特殊应用。通过动态调整时钟频率和供应电压,开发者完全可以控制这两者的平
通过动态调整时钟频率和供应电压,
开发者完全可以控制这两者的平
衡。在0.13um工艺,1.2v
工艺,
1.2v条件下,ARM11
条件下,
ARM11处理器的功耗可以低至0.4mW/MHz。
0.4mW/MHz
。
ARM11处理器同时提供了可综合版本和半定制硬核两种实现。可综合版本可以让
处理器同时提供了可综合版本和半定制硬核两种实现。
可综合版本可以让
客户根据自己的半导体工艺开发出各有特色的处理器内核,并保持足够灵活性。
ARM实现的硬核则是为了满足那些极高性能和速度要求的应用,同时为客户节省
实现的硬核则是为了满足那些极高性能和速度要求的应用,
同时为客户节省
实现的成本和时间。为了让客户更方便地走完实现流程,ARM11处理器采用了易
于综合的流水线结构,并和常用的综合工具以及RAM compiler良好结合,确保
了客户可以成功并迅速的达到时序收敛。目前已有的ARM11处理器在不包含
Cache的情况下面积小于2.7mm2,对于当前复杂的
2.7mm2
,对于当前复杂的SoC设计来说,如此小的die
size对芯片成本的降低是极其重要的。ARM11处理器在很多方面为软件开发者带
来便利。一方面,
来便利。
一方面,它包含了更多的多媒体处理指令来加速视频和音频处理;
一方面,
它包含了更多的多媒体处理指令来加速视频和音频处理;另一
它包含了更多的多媒体处理指令来加速视频和音频处理;
另一
方面,它的新型存储器系统进一步提高了操作系统的性能;
方面,
它的新型存储器系统进一步提高了操作系统的性能;此外,
它的新型存储器系统进一步提高了操作系统的性能;
此外,还提供了新指
此外,
还提供了新指
令来加速实时性能和中断的响应。再次,目前有很多应用要求多处理器的配置(多
个ARM内核,或ARM+DSP的组合),ARM11
的组合),
ARM11处理器从设计伊始就注重更容易地与
其他处理器共享数据,以及从非ARM的处理器上移植软件。此外,ARM
的处理器上移植软件。此外,
ARM还开发了
基于ARM11系列的多处理器系统——MPCORE(由二个到四个ARM11内核组成)。
系列的多处理器系统——
MPCORE
优秀的性能
优秀的性能
ARM11处理器的超强性能是由一系列的架构特点所决定的。
ARMv6—决定性能的基础
ARMv6
—决定性能的基础
—决定性能的基础
ARMv6架构决定了可以达到高性能处理器的基础。总的来说,ARMv6架构通
过以下几点来增强处理器的性能:
过以下几点来增强处理器的性能:
1.多媒体处理扩展
1.
多媒体处理扩展
多媒体处理扩展
使MPEG4编码/
编码
/解码加快一倍
解码加快一倍
音频处理加快一倍
音频处理加快一倍
2.增强的
2.
增强的Cache结构
结构
实地址Cache4
减少Cache的刷新和重载
的刷新和重载
减少上下文切换的开销
减少上下文切换的开销
3.增强的异常和中断处理
3.
增强的异常和中断处理
增强的异常和中断处理
使实时任务的处理更加迅速
使实时任务的处理更加迅速
4.支持软件移植更简单,
4.
支持Unaligned和Mixed-endian数据访问
数据访问
使数据共享、
也有利于节省存储器空间
也有利于节省存储器空间
对绝大多数应用来说,ARMv6保持了100%的二进制向下兼容,
100%
的二进制向下兼容,使用户过去开
发的程序可以进一步继承下去。ARMv6保持了所有过去架构中的T(Thumb指令)
和E(DSP指令)扩展,使代码压缩和DSP处理特点得到延续;为了加速Java
代码执行速度的ARM Jazalle技术也继续在ARMv6架构中发挥重要作用。
架构中发挥重要作用。
ARM11处理器的内核特点
处理器的内核特点
ARM11处理器是为了有效的提供高性能处理能力而设计的。在这里需要强调
处理器是为了有效的提供高性能处理能力而设计的。
在这里需要强调
的是,ARM
的是,
ARM并不是不能设计出运行在更高频率的处理器,而是,在处理器能提供
超高性能的同时,还要保证功耗、面积的有效性。ARM11优秀的流水线设计是这
些功能的重要保证。
些功能的重要保证。
ARM11处理器的流水线和以前的ARM内核不同,它由8级流水线组成,比以
前的ARM内核提高了至少40%的吞吐量。8级流水线可以使8条指令同时被执行。
40%
的吞吐量。
条指令同时被执行。
从通常的角度说,过长的流水线往往会削弱指令的执行效率。
从通常的角度说,
过长的流水线往往会削弱指令的执行效率。一方面,
过长的流水线往往会削弱指令的执行效率。
一方面,如果
一方面,
如果
随后的指令需要用到前面指令的执行结果作为输入,它就需要等到前面指令执行
完。ARM11
完。
ARM11处理器通过forwarding来避免这种流水线中的数据冲突,它可以让
指令执行的结果快速进入到后面指令的流水线中。另一方面,
指令执行的结果快速进入到后面指令的流水线中。
另一方面,如果指令执行的正
常顺序被打断(如出现跳转指令),普通流水线处理器往往要付出更大的代价,
ARM11通过实现跳转预测技术来保持最佳的流水线效率。这些特殊技术的使用,
使ARM11处理器优化到更高的流水线吞吐量的同时,还能保持和
处理器优化到更高的流水线吞吐量的同时,
还能保持和5级流水线(如
ARM9处理器中的流水结构)一样的有效性。
跳转预测及管理
跳转预测及管理
跳转指令通常都是条件执行的。问题在于那些决定是否跳转的条件要在跳转
指令被译码的后3~4个周期才能就绪。如果不做特殊处理,跳转指令必须等待,
这样使指令执行效率变得让人难以忍受。跳转预测就是用来帮助解决这种延迟的。
ARM11处理器提供两种技术来对跳转作出预测—动态预测和静态预测。
动态预测:在ARM11处理器中包含了64个4状态跳转地址缓存器(4-state
branch target address cache)来保存最近发生的跳转指令的结果。通过对这
branch target address cache
)来保存最近发生的跳转指令的结果。通过对这
些历史纪录的查找,处理器可以预测出当前的跳转指令是否会被执行。
静态预测:当在动态预测的缓存器中无法查到和当前指令匹配的记录,ARM11
处理器就从跳转的方式来判断是否执行。如果是向回跳转,
处理器就从跳转的方式来判断是否执行。
如果是向回跳转,大多数情况是遇到一
个循环,处理器会假设这条指令被执行。
个循环,
处理器会假设这条指令被执行。如果是向前跳转,
处理器会假设这条指令被执行。
如果是向前跳转,处理器会假设这条指
如果是向前跳转,
处理器会假设这条指
令不被执行。
令不被执行。
动态预测和静态预测的组合使ARM11处理器能达到85%的预测正确性,
85%
的预测正确性,对于
的预测正确性,
对于
每一个正确的预测,给指令执行带来的是减少5个时钟周期的等待时间。
个时钟周期的等待时间。
增强的存储器访问
增强的存储器访问
在ARM11处理器中,指令和数据可以更长时间的被保存在Cache中。一方面
是由于物理地址Cache的实现,使上下文切换避免了反复重载Cache,另一方面
Cache
,另一方面
是由于ARM11的Cache还有很多其它新颖的技术特点。
还有很多其它新颖的技术特点。
如果数据的访问引起了CacheMiss,
CacheMiss
,Cache将到存储器中读取需要的数据。
但是ARM11处理器的流水线并不会停止下来。只要后面的指令没有用到Cache
Miss将读回来的数据,ARM11处理器就会继续执行下去。即使下一条指令还是存
处理器就会继续执行下去。
即使下一条指令还是存
储器访问指令,只要数据存放在Cache中,ARM11
中,
ARM11也会允许这条指令被执行。只
有这条指令又引起一次CacheMiss,处理器才会停止下来。在大多数应用中,经
CacheMiss
,处理器才会停止下来。在大多数应用中,经
过编译器调配后,这种情况并不多见。
流水线的并行机制
流水线的并行机制
尽管ARM11是单指令发射处理器,但是在流水线的后半部分允许了极大程度
的并行性。一旦指令被解码,将根据操作类型发射到不同的执行单元中。ARM11
的数据通路中包含多个处理单元,允许
的数据通路中包含多个处理单元,
允许ALU操作、乘法操作和存储器访问操作同
时进行。
时进行。
考虑到不同的指令需要不同的执行时间,当三类指令先后被发射到流水线中,
它们就可以同时被执行。而且ARM11处理器允许指令的乱续完成,如果在指令之
处理器允许指令的乱续完成,
如果在指令之
间没有数据的相关性,所有指令都可以不必等待前面的指令完成而结束自己的执
行。
行。
64位的数据通道
位的数据通道
在绝大多数的应用中,一个真正的64位处理器,在功耗面积的成本上还是
不经济的。ARM11
不经济的。
ARM11处理器展示了一种以32位处理器的成本,提供64位处理器性
能的解决方案。ARM11
能的解决方案。
ARM11处理中,内核和Cache,及协处理器之间的数据通路是
Cache
,及协处理器之间的数据通路是64
位的。这使处理器可以每周期读入两条指令或存放两个连续的数据,以大大提高
这使处理器可以每周期读入两条指令或存放两个连续的数据,
以大大提高
数据访问和处理的速度。经过评测,这已经和64位处理器的性能相差无几。
位处理器的性能相差无几。
浮点运算
浮点运算
ARM11处理器将浮点运算当成一个可供用户选择的设计。用户可以在向ARM
要求授权的时候选择是否包括浮点处理器的内核。在流水线上的重要区别不仅是
为了达到更高的性能,还是从实现的角度来考虑的。所以,ARM11内核在运行于
极高频率的同时,也能非常容易的被集成在SoC设计中。同时,ARM11
设计中。同时,
ARM11处理器提
供的向上兼容性,使OEM可以放心的选用任何基于ARM的产品。
的产品。
总结
总结
ARM11处理器是ARMv6架构的第一代实现,ARM
架构的第一代实现,
ARM的合作伙伴可以从不同的方
面(功耗、性能或面积)优化和实现差异化的ARM11内核,也可以根据自己特定
的工艺技术来开发不同的特性。这些ARM11处理器瞄准的是下一代高端的移动无
线,消费类电子,
线,
消费类电子,网络和汽车电子应用。
消费类电子,
网络和汽车电子应用。而且
网络和汽车电子应用。
而且ARM11内核的很多特性使它还能充
分适应高端嵌入式实时应用系统,如:未来的网络和家庭娱乐产品。
此外,ARM11
此外,
ARM11的成功还得益于ARM完整的开发环境和广泛的IP解决方案,
以及不断扩大的ARM开发者和合作伙伴联盟。
开发者和合作伙伴联盟。
ARM公司近日公布了四个新的ARM11系列微处理器内核(ARM1156T2-S内核、
ARM1156T2F-S内核ARM1176JZ-S内核和ARM11JZF-S内核),以及应用于
ARM1176JZ-S 和
ARM1176JZ-S
和ARM11JZF-S内核系列的PrimeXsys平台、相关的CoreSight技
术。
术。
ARM1156T2-S和ARM1156T2F-S内核都基于ARMv6指令集体系结构,将是首
批含有ARM Thumb-2内核技术的产品,可令合作伙伴进一步减少与存储系统相关
内核技术的产品,
可令合作伙伴进一步减少与存储系统相关
的生产成本。两款新内核主要用于多种深嵌入式存储器、汽车网络和成像应用产
两款新内核主要用于多种深嵌入式存储器、
汽车网络和成像应用产
品,提供了更高的
品,
提供了更高的CPU性能和吞吐量,并增加了许多特殊功能,
性能和吞吐量,
并增加了许多特殊功能,可解决新一代装
并增加了许多特殊功能,
可解决新一代装
置的设计难题。体系结构中增添的功能包括:对于汽车安全系统类安全应用产品
体系结构中增添的功能包括:
对于汽车安全系统类安全应用产品
的开发至关重要的存储器容错能力。ARM1156T2-S
的开发至关重要的存储器容错能力。
ARM1156T2-S和ARM1156T2F-S内核与新的
AMBA 3.0 AXI总线标准一致,可满足高性能系统的大量数据存取需求。Thumb-2
内核技术结合了16位、32
位、
32位指令集体系结构,提供更低的功耗、更高的性能、
更短的编码,该技术提供的软件技术方案较现用的ARM技术方案减少使用26%
26
%
的存储空间、较现用的Thumb技术方案增速25%。
25
%。
%。
ARM1176JZ-S和ARM1176JZF-S内核及PrimeXsys平台是首批以ARM
TrustZone技术实现手持装置和消费电子装置中公开操作系统的超强安全性的
产品,同时也是首次对可节约高达75%处理器功耗的
75
%处理器功耗的ARM智能能量管理(ARM
智能能量管理(
ARM
Intelligent Energy Manager)进行一体化支持。
Manager
)进行一体化支持。ARM1176JZ-S
)进行一体化支持。
ARM1176JZ-S和ARM1176JZF-S
内核基于ARMv6指令集体系结构,主要为服务供应商和运营商所提供的新一代消
费电子装置的电子商务和安全的网络下载提供支持。
CoreSight技术建于ARM Embedded
ARM
Embedded Trace
Embedded
Trace Macrocell
Trace
Macrocell (
Macrocell
(ETM)实时跟踪模块
ETM
)实时跟踪模块
中,为完整的片上系统(SoC
中,为完整的片上系统(
SoC)设计提供最全面的调试、跟踪技术方案,通过最
SoC
)设计提供最全面的调试、跟踪技术方案,通过最
小端口可获得全面的系统可见度,并为开发者大大节约了产品上市时间。ARM
CoreSight技术提供了最标准的调试和跟踪性能,适用于各种内核和复杂外设,
可对核内指令和数据进行追踪。该技术为半导体制造商和工具供应商建立了可真
正协同工作的系统调试标准,可满足嵌入式开发者和半导体制造商的各种需求,
如以最低的成本来提供全面的系统可见度,从而降低处理器成本。
ARM公司嵌入式内核经理Richard Phelan先生说:"
先生说:
"随着竞争的日益激烈,
系统开发者必须以低廉的费用实现嵌入式系统的高性能并延长电池的待机时间。
ARM1156T2-S和ARM1156T2F-S内核在0.13
μ
工艺下新的操作频率高达550MHz,
550MHz
,
拥有高效的Thumb-2指令集和AMBA 3.0 AXI系统总线,ARM1156T2-S
系统总线,
ARM1156T2-S和
ARM1156T2F-S内核为合作伙伴们提供了所需的知识产权(IP),满足各种新兴
IP
),满足各种新兴
的嵌入式控制应用产品的高性能需求。"
ARM CPU产品经理David Cormie先生评论说:"
先生评论说:
"为了进一步提高新一代消费
电子装置和无线装置的安全性,运营商、
电子装置和无线装置的安全性,
运营商、服务商和消费者的重要数据的保护、
运营商、
服务商和消费者的重要数据的保护、隐
服务商和消费者的重要数据的保护、
隐
私保护需要一个可信赖的计算环境。ARM1176JZ-S
私保护需要一个可信赖的计算环境。
ARM1176JZ-S和ARM1176JZF-S内核及
PrimeXsys平台结合了ARM TrustZone
ARM
TrustZone技术,为计算装置提供了理想的可信赖基
础。系统设计者首次在芯片核心部分运用TrustZone技术来解决安全性问题。用
户将拥有更多的下载选择,运营商将增加营业额收入,
户将拥有更多的下载选择,
运营商将增加营业额收入,他们都无需担心网络的安
运营商将增加营业额收入,
他们都无需担心网络的安
全问题。"
全问题。
"
ARM1176JZ-S和ARM1176JZF-S内核、PrimeXsys平台提供了安全的低功耗设
计,含有AMBA 3.0 AXI,可对频率和电压变化进行控制;系统级
AMBA 3.0 AXI
,可对频率和电压变化进行控制;系统级TrustZone软
硬件参考设计。两个新内核中集成了ARM Jazelle技术,可加快嵌入式Java执
行。ARM1176JZF-S
行。
ARM1176JZF-S内核包含一个浮点协处理器,极适合用于嵌入式3D图像应用
产品。两个新内核的标准配置中都含有ARM-Synopsys RTL
ARM-Synopsys
RTL to
RTL
to GDSII
to
GDSII参考技术方
案,都是可综合的,在0.13
μ
工艺中,最低频率可达333-550MHz。
333-550MHz
。PrimeXsys
平台包含ARM CoreSight?技术,提供了世界领先的调试和跟踪技术方案。
ARM CoreSight?
技术,提供了世界领先的调试和跟踪技术方案。
ARM CoreSight技术可快速地对不同地软件进行调试,通过对多核和AMBA?
总线的情况进行同时跟踪。此外,同时对多核进行暂停和调试,CoreSight技术
可对AMBA上的存储器和外设进行调试,无需暂停处理器工作,达到不易做到的
实时开发。ARM
实时开发。
ARM CoreSight技术拥有更高的压缩率,为半导体制造商们提供了对
新的更高频处理器进行调试、跟踪的技术方案。
新的更高频处理器进行调试、
跟踪的技术方案。使用
跟踪的技术方案。
使用CoreSight技术,制造商们
技术,
制造商们
可通过减少调试所需的管脚、减少片上跟踪缓存所需的芯片面积等手段来降低生
产成本。
产成本。
2024年9月24日发(作者:庚思萱)
ARM11 CPU 处理器的详细介绍
ARM11 CPU
处理器的详细介绍
处理器的详细介绍
目录:产品导购资讯 人气:3729 发表时间:2010年01月29日
文章出处:车百饰汽车影音网 责任编辑:车百饰汽车影音网 作者:车百
饰汽车影音网
ARM11
ARM11系列微处理器是ARM公司近年推出的新一代RISC处理器。它是ARM
新指令架构——ARMv6
新指令架构——
ARMv6的第一代设计实现。该系列主要有ARM1136J,
ARM1136J
,ARM1156T2
和ARM1176JZ三个内核型号,分别针对不同应用领域。
ARMv6结构体系
结构体系
实现新一代微处理器的第一步就是订立一个新的结构体系。这里所说的结构
体系只是对处理器行为进行描述,并不包括具体地指定处理器是如何被建造的。
结构体系的定义提供了处理器和外界(操作系统,应用程序和调试支持)的接口,
从细节上说,处理器结构体系定义了指令集、编程模式和最近的存储器之间的接
处理器结构体系定义了指令集、
编程模式和最近的存储器之间的接
口。最新的ARM处理器架构—ARMv6
处理器架构—
ARMv6,发布于
ARMv6
,发布于2001年10月,它建立于过去十年
ARM许多成功的结构体系基础上。同处理器的授权相似,ARM也向客户授权它的
结构体系。比如,Intel
结构体系。比如,
Intel的XScale就是基于ARMv5TE的处理器。
的处理器。
目标应用
目标应用
ARMv6架构是根据下一代的消费类电子、无线设备、网络应用和汽车电子产
品等需求而制定的。ARM11
品等需求而制定的。
ARM11的媒体处理能力和低功耗特点,特别适用于无线和消
费类电子产品;其高数据吞吐量和高性能的结合非常适合网络处理应用;另外,
也在实时性能和浮点处理等方面ARM11可以满足汽车电子应用的需求。可以预言,
基于AMRv6体系结构的ARM11系列处理器将在上述领域发挥巨大的作用。
主要特点
主要特点
对于各种无线移动应用,毫无节制的提供高性能处理器是无用的。同成本控
毫无节制的提供高性能处理器是无用的。
同成本控
制类似,功耗的控制也是一个重要因素。ARM11
制类似,功耗的控制也是一个重要因素。
ARM11系列处理器展示了在性能上的巨
大提升,首先推出350M~500MHz时钟频率的内核,在未来将上升到1GHz时钟频
率ARM11处理器在提供高性能的同时,也允许在性能和功耗间做权衡以满足某些
特殊应用。通过动态调整时钟频率和供应电压,开发者完全可以控制这两者的平
通过动态调整时钟频率和供应电压,
开发者完全可以控制这两者的平
衡。在0.13um工艺,1.2v
工艺,
1.2v条件下,ARM11
条件下,
ARM11处理器的功耗可以低至0.4mW/MHz。
0.4mW/MHz
。
ARM11处理器同时提供了可综合版本和半定制硬核两种实现。可综合版本可以让
处理器同时提供了可综合版本和半定制硬核两种实现。
可综合版本可以让
客户根据自己的半导体工艺开发出各有特色的处理器内核,并保持足够灵活性。
ARM实现的硬核则是为了满足那些极高性能和速度要求的应用,同时为客户节省
实现的硬核则是为了满足那些极高性能和速度要求的应用,
同时为客户节省
实现的成本和时间。为了让客户更方便地走完实现流程,ARM11处理器采用了易
于综合的流水线结构,并和常用的综合工具以及RAM compiler良好结合,确保
了客户可以成功并迅速的达到时序收敛。目前已有的ARM11处理器在不包含
Cache的情况下面积小于2.7mm2,对于当前复杂的
2.7mm2
,对于当前复杂的SoC设计来说,如此小的die
size对芯片成本的降低是极其重要的。ARM11处理器在很多方面为软件开发者带
来便利。一方面,
来便利。
一方面,它包含了更多的多媒体处理指令来加速视频和音频处理;
一方面,
它包含了更多的多媒体处理指令来加速视频和音频处理;另一
它包含了更多的多媒体处理指令来加速视频和音频处理;
另一
方面,它的新型存储器系统进一步提高了操作系统的性能;
方面,
它的新型存储器系统进一步提高了操作系统的性能;此外,
它的新型存储器系统进一步提高了操作系统的性能;
此外,还提供了新指
此外,
还提供了新指
令来加速实时性能和中断的响应。再次,目前有很多应用要求多处理器的配置(多
个ARM内核,或ARM+DSP的组合),ARM11
的组合),
ARM11处理器从设计伊始就注重更容易地与
其他处理器共享数据,以及从非ARM的处理器上移植软件。此外,ARM
的处理器上移植软件。此外,
ARM还开发了
基于ARM11系列的多处理器系统——MPCORE(由二个到四个ARM11内核组成)。
系列的多处理器系统——
MPCORE
优秀的性能
优秀的性能
ARM11处理器的超强性能是由一系列的架构特点所决定的。
ARMv6—决定性能的基础
ARMv6
—决定性能的基础
—决定性能的基础
ARMv6架构决定了可以达到高性能处理器的基础。总的来说,ARMv6架构通
过以下几点来增强处理器的性能:
过以下几点来增强处理器的性能:
1.多媒体处理扩展
1.
多媒体处理扩展
多媒体处理扩展
使MPEG4编码/
编码
/解码加快一倍
解码加快一倍
音频处理加快一倍
音频处理加快一倍
2.增强的
2.
增强的Cache结构
结构
实地址Cache4
减少Cache的刷新和重载
的刷新和重载
减少上下文切换的开销
减少上下文切换的开销
3.增强的异常和中断处理
3.
增强的异常和中断处理
增强的异常和中断处理
使实时任务的处理更加迅速
使实时任务的处理更加迅速
4.支持软件移植更简单,
4.
支持Unaligned和Mixed-endian数据访问
数据访问
使数据共享、
也有利于节省存储器空间
也有利于节省存储器空间
对绝大多数应用来说,ARMv6保持了100%的二进制向下兼容,
100%
的二进制向下兼容,使用户过去开
发的程序可以进一步继承下去。ARMv6保持了所有过去架构中的T(Thumb指令)
和E(DSP指令)扩展,使代码压缩和DSP处理特点得到延续;为了加速Java
代码执行速度的ARM Jazalle技术也继续在ARMv6架构中发挥重要作用。
架构中发挥重要作用。
ARM11处理器的内核特点
处理器的内核特点
ARM11处理器是为了有效的提供高性能处理能力而设计的。在这里需要强调
处理器是为了有效的提供高性能处理能力而设计的。
在这里需要强调
的是,ARM
的是,
ARM并不是不能设计出运行在更高频率的处理器,而是,在处理器能提供
超高性能的同时,还要保证功耗、面积的有效性。ARM11优秀的流水线设计是这
些功能的重要保证。
些功能的重要保证。
ARM11处理器的流水线和以前的ARM内核不同,它由8级流水线组成,比以
前的ARM内核提高了至少40%的吞吐量。8级流水线可以使8条指令同时被执行。
40%
的吞吐量。
条指令同时被执行。
从通常的角度说,过长的流水线往往会削弱指令的执行效率。
从通常的角度说,
过长的流水线往往会削弱指令的执行效率。一方面,
过长的流水线往往会削弱指令的执行效率。
一方面,如果
一方面,
如果
随后的指令需要用到前面指令的执行结果作为输入,它就需要等到前面指令执行
完。ARM11
完。
ARM11处理器通过forwarding来避免这种流水线中的数据冲突,它可以让
指令执行的结果快速进入到后面指令的流水线中。另一方面,
指令执行的结果快速进入到后面指令的流水线中。
另一方面,如果指令执行的正
常顺序被打断(如出现跳转指令),普通流水线处理器往往要付出更大的代价,
ARM11通过实现跳转预测技术来保持最佳的流水线效率。这些特殊技术的使用,
使ARM11处理器优化到更高的流水线吞吐量的同时,还能保持和
处理器优化到更高的流水线吞吐量的同时,
还能保持和5级流水线(如
ARM9处理器中的流水结构)一样的有效性。
跳转预测及管理
跳转预测及管理
跳转指令通常都是条件执行的。问题在于那些决定是否跳转的条件要在跳转
指令被译码的后3~4个周期才能就绪。如果不做特殊处理,跳转指令必须等待,
这样使指令执行效率变得让人难以忍受。跳转预测就是用来帮助解决这种延迟的。
ARM11处理器提供两种技术来对跳转作出预测—动态预测和静态预测。
动态预测:在ARM11处理器中包含了64个4状态跳转地址缓存器(4-state
branch target address cache)来保存最近发生的跳转指令的结果。通过对这
branch target address cache
)来保存最近发生的跳转指令的结果。通过对这
些历史纪录的查找,处理器可以预测出当前的跳转指令是否会被执行。
静态预测:当在动态预测的缓存器中无法查到和当前指令匹配的记录,ARM11
处理器就从跳转的方式来判断是否执行。如果是向回跳转,
处理器就从跳转的方式来判断是否执行。
如果是向回跳转,大多数情况是遇到一
个循环,处理器会假设这条指令被执行。
个循环,
处理器会假设这条指令被执行。如果是向前跳转,
处理器会假设这条指令被执行。
如果是向前跳转,处理器会假设这条指
如果是向前跳转,
处理器会假设这条指
令不被执行。
令不被执行。
动态预测和静态预测的组合使ARM11处理器能达到85%的预测正确性,
85%
的预测正确性,对于
的预测正确性,
对于
每一个正确的预测,给指令执行带来的是减少5个时钟周期的等待时间。
个时钟周期的等待时间。
增强的存储器访问
增强的存储器访问
在ARM11处理器中,指令和数据可以更长时间的被保存在Cache中。一方面
是由于物理地址Cache的实现,使上下文切换避免了反复重载Cache,另一方面
Cache
,另一方面
是由于ARM11的Cache还有很多其它新颖的技术特点。
还有很多其它新颖的技术特点。
如果数据的访问引起了CacheMiss,
CacheMiss
,Cache将到存储器中读取需要的数据。
但是ARM11处理器的流水线并不会停止下来。只要后面的指令没有用到Cache
Miss将读回来的数据,ARM11处理器就会继续执行下去。即使下一条指令还是存
处理器就会继续执行下去。
即使下一条指令还是存
储器访问指令,只要数据存放在Cache中,ARM11
中,
ARM11也会允许这条指令被执行。只
有这条指令又引起一次CacheMiss,处理器才会停止下来。在大多数应用中,经
CacheMiss
,处理器才会停止下来。在大多数应用中,经
过编译器调配后,这种情况并不多见。
流水线的并行机制
流水线的并行机制
尽管ARM11是单指令发射处理器,但是在流水线的后半部分允许了极大程度
的并行性。一旦指令被解码,将根据操作类型发射到不同的执行单元中。ARM11
的数据通路中包含多个处理单元,允许
的数据通路中包含多个处理单元,
允许ALU操作、乘法操作和存储器访问操作同
时进行。
时进行。
考虑到不同的指令需要不同的执行时间,当三类指令先后被发射到流水线中,
它们就可以同时被执行。而且ARM11处理器允许指令的乱续完成,如果在指令之
处理器允许指令的乱续完成,
如果在指令之
间没有数据的相关性,所有指令都可以不必等待前面的指令完成而结束自己的执
行。
行。
64位的数据通道
位的数据通道
在绝大多数的应用中,一个真正的64位处理器,在功耗面积的成本上还是
不经济的。ARM11
不经济的。
ARM11处理器展示了一种以32位处理器的成本,提供64位处理器性
能的解决方案。ARM11
能的解决方案。
ARM11处理中,内核和Cache,及协处理器之间的数据通路是
Cache
,及协处理器之间的数据通路是64
位的。这使处理器可以每周期读入两条指令或存放两个连续的数据,以大大提高
这使处理器可以每周期读入两条指令或存放两个连续的数据,
以大大提高
数据访问和处理的速度。经过评测,这已经和64位处理器的性能相差无几。
位处理器的性能相差无几。
浮点运算
浮点运算
ARM11处理器将浮点运算当成一个可供用户选择的设计。用户可以在向ARM
要求授权的时候选择是否包括浮点处理器的内核。在流水线上的重要区别不仅是
为了达到更高的性能,还是从实现的角度来考虑的。所以,ARM11内核在运行于
极高频率的同时,也能非常容易的被集成在SoC设计中。同时,ARM11
设计中。同时,
ARM11处理器提
供的向上兼容性,使OEM可以放心的选用任何基于ARM的产品。
的产品。
总结
总结
ARM11处理器是ARMv6架构的第一代实现,ARM
架构的第一代实现,
ARM的合作伙伴可以从不同的方
面(功耗、性能或面积)优化和实现差异化的ARM11内核,也可以根据自己特定
的工艺技术来开发不同的特性。这些ARM11处理器瞄准的是下一代高端的移动无
线,消费类电子,
线,
消费类电子,网络和汽车电子应用。
消费类电子,
网络和汽车电子应用。而且
网络和汽车电子应用。
而且ARM11内核的很多特性使它还能充
分适应高端嵌入式实时应用系统,如:未来的网络和家庭娱乐产品。
此外,ARM11
此外,
ARM11的成功还得益于ARM完整的开发环境和广泛的IP解决方案,
以及不断扩大的ARM开发者和合作伙伴联盟。
开发者和合作伙伴联盟。
ARM公司近日公布了四个新的ARM11系列微处理器内核(ARM1156T2-S内核、
ARM1156T2F-S内核ARM1176JZ-S内核和ARM11JZF-S内核),以及应用于
ARM1176JZ-S 和
ARM1176JZ-S
和ARM11JZF-S内核系列的PrimeXsys平台、相关的CoreSight技
术。
术。
ARM1156T2-S和ARM1156T2F-S内核都基于ARMv6指令集体系结构,将是首
批含有ARM Thumb-2内核技术的产品,可令合作伙伴进一步减少与存储系统相关
内核技术的产品,
可令合作伙伴进一步减少与存储系统相关
的生产成本。两款新内核主要用于多种深嵌入式存储器、汽车网络和成像应用产
两款新内核主要用于多种深嵌入式存储器、
汽车网络和成像应用产
品,提供了更高的
品,
提供了更高的CPU性能和吞吐量,并增加了许多特殊功能,
性能和吞吐量,
并增加了许多特殊功能,可解决新一代装
并增加了许多特殊功能,
可解决新一代装
置的设计难题。体系结构中增添的功能包括:对于汽车安全系统类安全应用产品
体系结构中增添的功能包括:
对于汽车安全系统类安全应用产品
的开发至关重要的存储器容错能力。ARM1156T2-S
的开发至关重要的存储器容错能力。
ARM1156T2-S和ARM1156T2F-S内核与新的
AMBA 3.0 AXI总线标准一致,可满足高性能系统的大量数据存取需求。Thumb-2
内核技术结合了16位、32
位、
32位指令集体系结构,提供更低的功耗、更高的性能、
更短的编码,该技术提供的软件技术方案较现用的ARM技术方案减少使用26%
26
%
的存储空间、较现用的Thumb技术方案增速25%。
25
%。
%。
ARM1176JZ-S和ARM1176JZF-S内核及PrimeXsys平台是首批以ARM
TrustZone技术实现手持装置和消费电子装置中公开操作系统的超强安全性的
产品,同时也是首次对可节约高达75%处理器功耗的
75
%处理器功耗的ARM智能能量管理(ARM
智能能量管理(
ARM
Intelligent Energy Manager)进行一体化支持。
Manager
)进行一体化支持。ARM1176JZ-S
)进行一体化支持。
ARM1176JZ-S和ARM1176JZF-S
内核基于ARMv6指令集体系结构,主要为服务供应商和运营商所提供的新一代消
费电子装置的电子商务和安全的网络下载提供支持。
CoreSight技术建于ARM Embedded
ARM
Embedded Trace
Embedded
Trace Macrocell
Trace
Macrocell (
Macrocell
(ETM)实时跟踪模块
ETM
)实时跟踪模块
中,为完整的片上系统(SoC
中,为完整的片上系统(
SoC)设计提供最全面的调试、跟踪技术方案,通过最
SoC
)设计提供最全面的调试、跟踪技术方案,通过最
小端口可获得全面的系统可见度,并为开发者大大节约了产品上市时间。ARM
CoreSight技术提供了最标准的调试和跟踪性能,适用于各种内核和复杂外设,
可对核内指令和数据进行追踪。该技术为半导体制造商和工具供应商建立了可真
正协同工作的系统调试标准,可满足嵌入式开发者和半导体制造商的各种需求,
如以最低的成本来提供全面的系统可见度,从而降低处理器成本。
ARM公司嵌入式内核经理Richard Phelan先生说:"
先生说:
"随着竞争的日益激烈,
系统开发者必须以低廉的费用实现嵌入式系统的高性能并延长电池的待机时间。
ARM1156T2-S和ARM1156T2F-S内核在0.13
μ
工艺下新的操作频率高达550MHz,
550MHz
,
拥有高效的Thumb-2指令集和AMBA 3.0 AXI系统总线,ARM1156T2-S
系统总线,
ARM1156T2-S和
ARM1156T2F-S内核为合作伙伴们提供了所需的知识产权(IP),满足各种新兴
IP
),满足各种新兴
的嵌入式控制应用产品的高性能需求。"
ARM CPU产品经理David Cormie先生评论说:"
先生评论说:
"为了进一步提高新一代消费
电子装置和无线装置的安全性,运营商、
电子装置和无线装置的安全性,
运营商、服务商和消费者的重要数据的保护、
运营商、
服务商和消费者的重要数据的保护、隐
服务商和消费者的重要数据的保护、
隐
私保护需要一个可信赖的计算环境。ARM1176JZ-S
私保护需要一个可信赖的计算环境。
ARM1176JZ-S和ARM1176JZF-S内核及
PrimeXsys平台结合了ARM TrustZone
ARM
TrustZone技术,为计算装置提供了理想的可信赖基
础。系统设计者首次在芯片核心部分运用TrustZone技术来解决安全性问题。用
户将拥有更多的下载选择,运营商将增加营业额收入,
户将拥有更多的下载选择,
运营商将增加营业额收入,他们都无需担心网络的安
运营商将增加营业额收入,
他们都无需担心网络的安
全问题。"
全问题。
"
ARM1176JZ-S和ARM1176JZF-S内核、PrimeXsys平台提供了安全的低功耗设
计,含有AMBA 3.0 AXI,可对频率和电压变化进行控制;系统级
AMBA 3.0 AXI
,可对频率和电压变化进行控制;系统级TrustZone软
硬件参考设计。两个新内核中集成了ARM Jazelle技术,可加快嵌入式Java执
行。ARM1176JZF-S
行。
ARM1176JZF-S内核包含一个浮点协处理器,极适合用于嵌入式3D图像应用
产品。两个新内核的标准配置中都含有ARM-Synopsys RTL
ARM-Synopsys
RTL to
RTL
to GDSII
to
GDSII参考技术方
案,都是可综合的,在0.13
μ
工艺中,最低频率可达333-550MHz。
333-550MHz
。PrimeXsys
平台包含ARM CoreSight?技术,提供了世界领先的调试和跟踪技术方案。
ARM CoreSight?
技术,提供了世界领先的调试和跟踪技术方案。
ARM CoreSight技术可快速地对不同地软件进行调试,通过对多核和AMBA?
总线的情况进行同时跟踪。此外,同时对多核进行暂停和调试,CoreSight技术
可对AMBA上的存储器和外设进行调试,无需暂停处理器工作,达到不易做到的
实时开发。ARM
实时开发。
ARM CoreSight技术拥有更高的压缩率,为半导体制造商们提供了对
新的更高频处理器进行调试、跟踪的技术方案。
新的更高频处理器进行调试、
跟踪的技术方案。使用
跟踪的技术方案。
使用CoreSight技术,制造商们
技术,
制造商们
可通过减少调试所需的管脚、减少片上跟踪缓存所需的芯片面积等手段来降低生
产成本。
产成本。