2024年3月21日发(作者:南门虹颖)
CPU性能参数详解
一: 什么是酷睿:“酷睿”是一款领先节能的新型微架构,设计的出发点是提供卓然
出众的性能和能效,提高每瓦特性能,也就是所谓的能效比。早期的酷睿是基于笔记本处
理器的。酷睿2:英文Core 2Duo,是英特尔推出的新一代基于Core微架构的产品体系
统称。于2006年7月27日发布。酷睿2,是一个跨平台的构架体系,包括服务器版、桌
面版、移动版三大领域。其中,服务器版的开发代号为Woodcrest,桌面版的开发代号为
Conroe,移动版的开发代号为Merom。特性:全新的Core架构,彻底抛弃了Netburst
架构全部采用65nm制造工艺全线产品均为双核心,L2缓存容量提升到4MB晶体管数量
达到2.91 亿个,核心尺寸为143平方毫米 性能提升40%能耗降低40%,主流产品的平
均能耗为65瓦特,顶级的X6800也仅为75瓦特前端总线提升至1066Mhz(Conroe),
1333Mhz(Woodcrest),667Mhz(Merom)服务器类Woodcrest为开发代号,实际的
产品名称为Xeon 5100系列。采用LGA771接口。Xeon 5100系列包含两种FSB的产品
规格(5110采用1066 MHz,5130采用1333MHz)。拥有两个处理核心和4MB共享式
二级缓存,平均功耗为65W,最大仅为80W,较AMD的Opteron的95W功耗很具优
势。台式机类Conroe处理器分为普通版和至尊版两种,产品线包括E6000系列和E4000
系列,两者的主要差别为FSB频率不同。普通版E6000系列处理器主频从1.8GHz到
2.67GHz,频率虽低,但由于优秀的核心架构,Conroe处理器的性能表现优秀。此外,
Conroe处理器还支持Intel的VT、EIST、EM64T和XD技术,并加入了SSE4指令集。
由于Core的高效架构,Conroe不再提供对HT的支持。
二:什么是双核处理器双核与双芯(Dual Core Vs. Dual CPU):AMD和Intel的双
核技术在物理结构上也有很大不同之处。AMD将两个内核做在一个Die(晶元)上,通过
直连架构连接起来,集成度更高。Intel则是将放在不同Die(晶元)上的两个内核封装在
一起,因此有人将Intel的方案称为“双芯”,认为AMD的方案才是真正的“双核”。从
用户端的角度来看,AMD的方案能够使双核CPU的管脚、功耗等指标跟单核CPU保持
一致,从单核升级到双核,不需要更换电源、芯片组、散热系统和主板,只需要刷新BIOS
软件即可,这对于主板厂商、计算机厂商和最终用户的投资保护是非常有利的。客户可以
利用其现有的90纳米基础设施,通过BIOS更改移植到基于双核心的系统。计算机厂商可
以轻松地提供同一硬件的单核心与双核心版本,使那些既想提高性能又想保持IT环境稳定
性的客户能够在不中断业务的情况下升级到双核心。在一个机架密度较高的环境中,通过
在保持电源与基础设施投资不变的情况下移植到双核心,客户的系统性能将得到巨大的提
升。在同样的系统占地空间上,通过使用双核心处理器,客户将获得更高水平的计算能力
和性能。双核处理器(Dual Core Processor):双核处理器是指在一个处理器上集成两个运
算核心,从而提高计算能力。“双核”的概念最早是由IBM、HP、Sun等支持RISC架构
的高端服务器厂商提出的,不过由于RISC架构的服务器价格高、应用面窄,没有引起广
泛的注意。最近逐渐热起来的“双核”概念,主要是指基于X86开放架构的双核技术。在
这方面,起领导地位的厂商主要有AMD和Intel两家。其中,两家的思路又有不同。AMD
从一开始设计时就考虑到了对多核心的支持。所有组件都直接连接到CPU,消除系统架构
方面的挑战和瓶颈。两个处理器核心直接连接到同一个内核上,核心之间以芯片速度通信,
进一步降低了处理器之间的延迟。而Intel采用多个核心共享前端总线的方式。专家认为,
AMD的架构对于更容易实现双核以至多核,Intel的架构会遇到多个内核争用总线资源的
瓶颈问题。 目前Intel推出的台式机双核心处理器有Pentium D、PentiumEE(Pentium
Extreme Edition)和Core Duo三种类型,三者的工作原理有很大不同。 一、PentiumD
和Pentium EE Pentium D和PentiumEE分别面向主流市场以及高端市场,其每个核心
采用独立式缓存设计,在处理器内部两个核心之间是互相隔绝的,通过处理器外部(主板北
桥芯片)的仲裁器负责两个核心之间的任务分配以及缓存数据的同步等协调工作。两个核心
共享前端总线,并依靠前端总线在两个核心之间传输缓存同步数据。从架构上来看,这种
类型是基于独立缓存的松散型双核心处理器耦合方案,其优点是技术简单,只需要将两个
相同的处理器内核封装在同一块基板上即可;缺点是数据延迟问题比较严重,性能并不尽
如人意。另外,Pentium D和Pentium EE的最大区别就是Pentium EE支持超线程技术
而PentiumD则不支持,Pentium EE在打开超线程技术之后会被操作系统识别为四个逻
辑处理器。AMD双核处理器 AMD推出的双核心处理器分别是双核心的Opteron系列和
全新的Athlon 64 X2系列处理器。其中Athlon 64X2是用以抗衡Pentium D和Pentium
Extreme Edition的桌面双核心处理器系列。 AMD推出的Athlon 64X2是由两个Athlon
64处理器上采用的Venice核心组合而成,每个核心拥有独立的512KB(1MB)L2缓存及执
行单元。除了多出一个核芯之外,从架构上相对于目前Athlon 64在架构上并没有任何重
大的改变。 双核心Athlon 64X2的大部分规格、功能与我们熟悉的Athlon 64架构没有
任何区别,也就是说新推出的Athlon 64X2双核心处理器仍然支持1GHz规格的
HyperTransport总线,并且内建了支持双通道设置的DDR内存控制器。与Intel双核心
处理器不同的是,Athlon 64 X2的两个内核并不需要经过MCH进行相互之间的协调。
AMD在Athlon 64X2双核心处理器的内部提供了一个称为System RequestQueue(系统
请求队列)的技术,在工作的时候每一个核心都将其请求放在SRQ中,当获得资源之后请
求将会被送往相应的执行核心,也就是说所有的处理过程都在CPU核心范围之内完成,并
不需要借助外部设备。对于双核心架构,AMD的做法是将两个核心整合在同一片硅晶内
核之中,而Intel的双核心处理方式则更像是简单的将两个核心做到一起而已。与Intel的
双核心架构相比,AMD双核心处理器系统不会在两个核心之间存在传输瓶颈的问题。因
此从这个方面来说,Athlon 64X2的架构要明显优于Pentium D架构。虽然与Intel相比,
AMD并不用担心Prescott核心这样的功耗和发热大户,但是同样需要为双核心处理器考
虑降低功耗的方式。为此AMD并没有采用降低主频的办法,而是在其使用90nm工艺生
产的Athlon 64 X2处理器中采用了所谓的Dual StressLiner应变硅技术,与SOI技术配
合使用,能够生产出性能更高、耗电更低的晶体管。 AMD推出的Athlon 64X2处理器给
用户带来最实惠的好处就是,不需要更换平台就能使用新推出的双核心处理器,只要对老
主板升级一下BIOS就可以了,这与Intel双核心处理器必须更换新平台才能支持的做法相
比,升级双核心系统会节省不少费用
三:什么是CPU主频:在电子技术中,脉冲信号是一个按一定电压幅度,一定时间间
隔连续发出的脉冲信号。脉冲信号之间的时间间隔称为周期;而将在单位时间(如1秒)
内所产生的脉冲个数称为频率。频率是描述周期性循环信号(包括脉冲信号)在单位时间
内所出现的脉冲数量多少的计量名称;频率的标准计量单位是Hz(赫)。电脑中的系统时
钟就是一个典型的频率相当精确和稳定的脉冲信号发生器。频率在数学表达式中用“f”表
示,其相应的单位有:Hz(赫)、kHz(千赫)、MHz(兆赫)、GHz(吉赫)。其中
1GHz=1000MHz,1MHz=1000kHz,1kHz=1000Hz。计算脉冲信号周期的时间单位及
相应的换算关系是:s(秒)、ms(毫秒)、μs(微秒)、ns(纳秒),其中:1s=1000ms,
1ms=1000μs,1μs=1000ns。 CPU的主频,即CPU内核工作的时钟频率(CPU
ClockSpeed)。通常所说的某某CPU是多少兆赫的,而这个多少兆赫就是“CPU的主频”。
很多人认为CPU的主频就是其运行速度,其实不然。CPU的主频表示在CPU内数字脉冲
信号震荡的速度,与CPU实际的运算能力并没有直接关系。主频和实际的运算速度存在一
定的关系,但目前还没有一个确定的公式能够定量两者的数值关系,因为CPU的运算速度
还要看CPU的流水线的各方面的性能指标(缓存、指令集,CPU的位数等等)。由于主频
并不直接代表运算速度,所以在一定情况下,很可能会出现主频较高的CPU实际运算速度
较低的现象。比如AMD公司的AthlonXP系列CPU大多都能已较低的主频,达到英特尔
公司的Pentium4系列CPU较高主频的CPU性能,所以AthlonXP系列CPU才以PR值
的方式来命名。因此主频仅是CPU性能表现的一个方面,而不代表CPU的整体性能。
CPU的主频不代表CPU的速度,但提高主频对于提高CPU运算速度却是至关重要的。举
个例子来说,假设某个CPU在一个时钟周期内执行一条运算指令,那么当CPU运行在
100MHz主频时,将比它运行在50MHz主频时速度快一倍。因为100MHz的时钟周期
比50MHz的时钟周期占用时间减少了一半,也就是工作在100MHz主频的CPU执行一
条运算指令所需时间仅为10ns比工作在50MHz主频时的20ns缩短了一半,自然运算速
度也就快了一倍。只不过电脑的整体运行速度不仅取决于CPU运算速度,还与其它各分系
统的运行情况有关,只有在提高主频的同时,各分系统运行速度和各分系统之间的数据传
输速度都能得到提高后,电脑整体的运行速度才能真正得到提高。 提高CPU工作主频
主要受到生产工艺的限制。由于CPU是在半导体硅片上制造的,在硅片上的元件之间需要
导线进行联接,由于在高频状态下要求导线越细越短越好,这样才能减小导线分布电容等
杂散干扰以保证CPU运算正确。因此制造工艺的限制,是CPU主频发展的最大障碍之一。
四:什么是前端总线:微机中总线一般有内部总线、系统总线和外部总线。内部总线
是微机内部各外围芯片与处理器之间的总线,用于芯片一级的互连;而系统总线是微机中
各插件板与系统板之间的总线,用于插件板一级的互连;外部总线则是微机和外部设备之
间的总线,微机作为一种设备,通过该总线和其他设备进行信息与数据交换,它用于设备
一级的互连。 什么是前端总线:“前端总线”这个名称是由AMD在推出K7CPU时提出
的概念,但是一直以来都被大家误认为这个名词不过是外频的另一个名称。我们所说的外
频指的是CPU与主板连接的速度,这个概念是建立在数字脉冲信号震荡速度基础之上的,
而前端总线的速度指的是数据传输的速度,由于数据传输最大带宽取决于所有同时传输的
数据的宽度和传输频率,即数据带宽=(总线频率×数据位宽)÷8。目前PC机上所能达
到的前端总线频率有266MHz、333MHz、400MHz、533MHz、800MHz、1066MHz、
1333MHz几种,前端总线频率越大,代表着CPU与内存之间的数据传输量越大,更能充
分发挥出CPU的功能。现在的CPU技术发展很快,运算速度提高很快,而足够大的前端
总线可以保障有足够的数据供给给CPU。较低的前端总线将无法供给足够的数据给CPU,
这样就限制了CPU性能得发挥,成为系统瓶颈。前端总线的英文名字是Front SideBus,
通常用FSB表示,是将CPU连接到北桥芯片的总线。选购主板和CPU时,要注意两者搭
配问题,一般来说,如果CPU不超频,那么前端总线是由CPU决定的,如果主板不支持
CPU所需要的前端总线,系统就无法工作。也就是说,需要主板和CPU都支持某个前端
总线,系统才能工作,只不过一个CPU默认的前端总线是唯一的,因此看一个系统的前端
总线主要看CPU就可以。北桥芯片负责联系内存、显卡等数据吞吐量最大的部件,并和南
桥芯片连接。CPU就是通过前端总线(FSB)连接到北桥芯片,进而通过北桥芯片和内存、
显卡交换数据。前端总线是CPU和外界交换数据的最主要通道,因此前端总线的数据传输
能力对计算机整体性能作用很大,如果没足够快的前端总线,再强的CPU也不能明显提高
计算机整体速度。数据传输最大带宽取决于所有同时传输的数据的宽度和传输频率,即数
据带宽=(总线频率×数据位宽)÷8。目前PC机上所能达到的前端总线频率有266MHz、
333MHz、400MHz、533MHz、800MHz几种,前端总线频率越大,代表着CPU与北
桥芯片之间的数据传输能力越大,更能充分发挥出CPU的功能。现在的CPU技术发展很
快,运算速度提高很快,而足够大的前端总线可以保障有足够的数据供给给CPU,较低的
前端总线将无法供给足够的数据给CPU,这样就限制了CPU性能得发挥,成为系统瓶颈。
显然同等条件下,前端总线越快,系统性能越好。外频与前端总线频率的区别:前端总线
的速度指的是数据传输的速度,外频是CPU与主板之间同步运行的速度。也就是说,
100MHz外频特指数字脉冲信号在每秒钟震荡一千万次;而100MHz前端总线指的是每
秒钟CPU可接受的数据传输量是100MHz×64bit=6400Mbit/s=800MByte/s
(1Byte=8bit)。
五:多媒体指令集:CPU依靠指令来计算和控制系统,每款CPU在设计时就规定了
一系列与其硬件电路相配合的指令系统。指令的强弱也是CPU的重要指标,指令集是提高
微处理器效率的最有效工具之一。从现阶段的主流体系结构讲,指令集可分为复杂指令集
和精简指令集两部分,而从具体运用看,如Intel的MMX(Multi Media Extended)、SSE、
SSE2(Streaming-Singleinstruction multiple data-Extensions2)和AMD的3DNow!
等都是CPU的扩展指令集,分别增强了CPU的多媒体、图形图象和Internet等的处理能
力。我们通常会把CPU的扩展指令集称为"CPU的指令集"。1、精简指令集的运用 在
最初发明计算机的数十年里,随着计算机功能日趋增大,性能日趋变强,内部元器件也越
来越多,指令集日趋复杂,过于冗杂的指令严重的影响了计算机的工作效率。后来经过研
究发现,在计算机中,80%程序只用到了20%的指令集,基于这一发现,RISC精简指令
集被提了出来,这是计算机系统架构的一次深刻革命。RISC体系结构的基本思路是:抓住
CISC指令系统指令种类太多、指令格式不规范、寻址方式太多的缺点,通过减少指令种类、
规范指令格式和简化寻址方式,方便处理器内部的并行处理,提高VLSI器件的使用效率,
从而大幅度地提高处理器的性能。 RISC指令集有许多特征,其中最重要的有:指令种
类少,指令格式规范:RISC指令集通常只使用一种或少数几种格式。指令长度单一(一般
4个字节),并且在字边界上对齐,字段位置、特别是操作码的位置是固定的。寻址方式简
化:几乎所有指令都使用寄存器寻址方式,寻址方式总数一般不超过5个。其他更为复杂
的寻址方式,如间接寻址等则由软件利用简单的寻址方式来合成。大量利用寄存器间操作:
RISC指令集中大多数操作都是寄存器到寄存器操作,只以简单的Load和Store操作访问
内存。因此,每条指令中访问的内存地址不会超过1个,访问内存的操作不会与算术操作
混在一起。简化处理器结构:使用RISC指令集,可以大大简化处理器的控制器和其他功
能单元的设计,不必使用大量专用寄存器,特别是允许以硬件线路来实现指令操作,而不
必像CISC处理器那样使用微程序来实现指令操作。因此RISC处理器不必像CISC处理器
那样设置微程序控制存储器,就能够快速地直接执行指令。便于使用VLSI技术:随着LSI
和VLSI技术的发展,整个处理器(甚至多个处理器)都可以放在一个芯片上。RISC体系
结构可以给设计单芯片处理器带来很多好处,有利于提高性能,简化VLSI芯片的设计和实
现。基于VLSI技术,制造RISC处理器要比CISC处理器工作量小得多,成本也低得多。
加强了处理器并行能力:RISC指令集能够非常有效地适合于采用流水线、超流水线和超标
量技术,从而实现指令级并行操作,提高处理器的性能。目前常用的处理器内部并行操作
技术基本上是基于RISC体系结构发展和走向成熟的。 正由于RISC体系所具有的优势,
它在高端系统得到了广泛的应用,而CISC体系则在桌面系统中占据统治地位。而在如今,
在桌面领域,RISC也不断渗透,预计未来,RISC将要一统江湖。2、CPU的扩展指令集
对于CPU来说,在基本功能方面,它们的差别并不太大,基本的指令集也都差不多,但是
许多厂家为了提升某一方面性能,又开发了扩展指令集,扩展指令集定义了新的数据和指
令,能够大大提高某方面数据处理能力,但必需要有软件支持。MMX 指令集 MMX
(Multi MediaeXtension,多媒体扩展指令集)指令集是Intel公司于1996年推出的一
项多媒体指令增强技术。MMX指令集中包括有57条多媒体指令,通过这些指令可以一次
处理多个数据,在处理结果超过实际处理能力的时候也能进行正常处理,这样在软件的配
合下,就可以得到更高的性能。MMX的益处在于,当时存在的操作系统不必为此而做出
任何修改便可以轻松地执行MMX程序。但是,问题也比较明显,那就是MMX指令集与
x87浮点运算指令不能够同时执行,必须做密集式的交错切换才可以正常执行,这种情况
就势必造成整个系统运行质量的下降。SSE指令集 SSE(Streaming SIMD Extensions,
单指令多数据流扩展)指令集是Intel在PentiumIII处理器中率先推出的。其实,早在PIII
正式推出之前,Intel公司就曾经通过各种渠道公布过所谓的KNI(Katmai NewInstruction)
指令集,这个指令集也就是SSE指令集的前身,并一度被很多传媒称之为MMX指令集的
下一个版本,即MMX2指令集。究其背景,原来"KNI"指令集是Intel公司最早为其下一
代芯片命名的指令集名称,而所谓的"MMX2"则完全是硬件评论家们和媒体凭感觉和印象
对"KNI"的评价,Intel公司从未正式发布过关于MMX2的消息。 而最终推出的SSE
指令集也就是所谓胜出的"互联网SSE"指令集。SSE指令集包括了70条指令,其中包含提
高3D图形运算效率的50条SIMD(单指令多数据技术)浮点运算指令、12条MMX整
数运算增强指令、8条优化内存中连续数据块传输指令。理论上这些指令对目前流行的图
像处理、浮点运算、3D运算、视频处理、音频处理等诸多多媒体应用起到全面强化的作用。
SSE指令与3DNow!指令彼此互不兼容,但SSE包含了3DNow!技术的绝大部分功能,只
是实现的方法不同。SSE兼容MMX指令,它可以通过SIMD和单时钟周期并行处理多个
浮点数据来有效地提高浮点运算速度。SSE2指令集 SSE2(Streaming SIMD Extensions 2,
Intel官方称为SIMD 流技术扩展2或数据流单指令多数据扩展指令集2)指令集是Intel
公司在SSE指令集的基础上发展起来的。相比于SSE,SSE2使用了144个新增指令,扩
展了MMX技术和SSE技术,这些指令提高了广大应用程序的运行性能。随MMX技术引
进的SIMD整数指令从64位扩展到了128位,使SIMD整数类型操作的有效执行率成倍
提高。双倍精度浮点SIMD指令允许以SIMD格式同时执行两个浮点操作,提供双倍精度
操作支持有助于加速内容创建、财务、工程和科学应用。除SSE2指令之外,最初的SSE
指令也得到增强,通过支持多种数据类型(例如,双字和四字)的算术运算,支持灵活并且
动态范围更广的计算功能。SSE2指令可让软件开发员极其灵活的实施算法,并在运行诸如
MPEG-2、MP3、3D图形等之类的软件时增强性能。Intel是从Willamette核心的
Pentium4开始支持SSE2指令集的,而AMD则是从K8架构的SledgeHammer核心的
Opteron开始才支持SSE2指令集的。SSE3指令集 SSE3(Streaming SIMD Extensions 3,
Intel官方称为SIMD 流技术扩展3或数据流单指令多数据扩展指令集3)指令集是Intel
公司在SSE2指令集的基础上发展起来的。相比于SSE2,SSE3在SSE2的基础上又增加了
13个额外的SIMD指令。SSE3中13个新指令的主要目的是改进线程同步和特定应用程
序领域,例如媒体和游戏。这些新增指令强化了处理器在浮点转换至整数、复杂算法、视
频编码、SIMD浮点寄存器操作以及线程同步等五个方面的表现,最终达到提升多媒体和
游戏性能的目的。Intel是从Prescott核心的Pentium4开始支持SSE3指令集的,而AMD
则是从2005年下半年Troy核心的Opteron开始才支持SSE3的。但是需要注意的是,
AMD所支持的SSE3与Intel的SSE3并不完全相同,主要是删除了针对Intel超线程技术
优化的部分指令。3D Now!(3D no waiting)指令集 3DNow!是AMD公司开发的
SIMD指令集,可以增强浮点和多媒体运算的速度,并被AMD广泛应用于其K6-2、K6-3
以及Athlon(K7)处理器上。3DNow!指令集技术其实就是21条机器码的扩展指令集。
与Intel公司的MMX技术侧重于整数运算有所不同,3DNow!指令集主要针对三维建模、
坐标变换和效果渲染等三维应用场合,在软件的配合下,可以大幅度提高3D处理性能。
后来在Athlon上开发了Enhanced3DNow!。这些AMD标准的SIMD指令和Intel的SSE
具有相同效能。因为受到Intel在商业上以及PentiumIII成功的影响,软件在支持SSE上
比起3DNow!更为普遍。Enhanced3DNow!AMD公司继续增加至52个指令,包含了一
些SSE码,因而在针对SSE做最佳化的软件中能获得更好的效能
六:什么是64位技术:这里的64位技术是相对于32位而言的,这个位数指的是CPU
GPRs(General-PurposeRegisters,通用寄存器)的数据宽度为64位,64位指令集就
是运行64位数据的指令,也就是说处理器一次可以运行64bit数据。64bit处理器并非现
在才有的,在高端的RISC(Reduced Instruction SetComputing,精简指令集计算机)
很早就有64bit处理器了,比如SUN公司的UltraSparcⅢ、IBM公司的POWER5、HP
公司的Alpha等。64bit计算主要有两大优点:可以进行更大范围的整数运算;可以支持
更大的内存。不能因为数字上的变化,而简单的认为64bit处理器的性能是32bit处理器
性能的两倍。实际上在32bit应用下,32bit处理器的性能甚至会更强,即使是64bit处理
器,目前情况下也是在32bit应用下性能更强。所以要认清64bit处理器的优势,但不可
迷信64bit。要实现真正意义上的64位计算,光有64位的处理器是不行的,还必须得有
64位的操作系统以及64位的应用软件才行,三者缺一不可,缺少其中任何一种要素都是
无法实现64位计算的。目前,在64位处理器方面,Intel和AMD两大处理器厂商都发布
了多个系列多种规格的64位处理器;而在操作系统和应用软件方面,目前的情况不容乐
观。因为真正适合于个人使用的64位操作系统现在就只有Windows XP X64,而Windows
XPX64本身也只是一个过渡性质的64位操作系统,在Windows Vista发布以后就将被淘
汰,而且Windows XPX64本身也不太完善,易用性不高,一个明显的例子就是各种硬件
设备的驱动程序很不完善,而且现在64位的应用软件还基本上没有,确实硬件厂商和软
件厂商也不愿意去为一个过渡性质的操作系统编写驱动程序和应用软件。所以要想实现真
正的64位计算,恐怕还得等到WindowsVista普及一段时间之后才行。目前主流CPU使
用的64位技术主要有AMD公司的AMD64位技术、Intel公司的EM64T技术、和Intel
公司的IA-64技术。其中IA-64是Intel独立开发,不兼容现在的传统的32位计算机,仅
用于Itanium(安腾)以及后续产品Itanium2,一般用户不会涉及到,因此这里仅对AMD64
位技术和Intel的EM64T技术做一下简单介绍。 AMD64位技术X86-64:AMD64的位
技术是在原始32位X86指令集的基础上加入了X86-64扩展64位X86指令集,使这款
芯片在硬件上兼容原来的32位X86软件,并同时支持X86-64的扩展64位计算,使得这
款芯片成为真正的64位X86芯片。这是一个真正的64位的标准,X86-64具有64位的
寻址能力。X86-64新增的几组CPU寄存器将提供更快的执行效率。寄存器是CPU内部
用来创建和储存CPU运算结果和其它运算结果的地方。标准的32-bitx86架构包括8个
通用寄存器(GPR),AMD在X86-64中又增加了8组(R8-R9),将寄存器的数目提高到
了16组。X86-64寄存器默认位64-bit。还增加了8组128-bitXMM寄存器(也叫SSE
寄存器,XMM8-XMM15),将能给单指令多数据流技术(SIMD)运算提供更多的空间,
这些128位的寄存器将提供在矢量和标量计算模式下进行128位双精度处理,为3D建模、
矢量分析和虚拟现实的实现提供了硬件基础。通过提供了更多的寄存器,按照X86-64标
准生产的CPU可以更有效的处理数据,可以在一个时钟周期中传输更多的信息。EM64T
技术 Intel官方是给EM64T这样定义的:EM64T全称Extended Memory 64Technology,
即扩展64bit内存技术。EM64T是Intel IA-32架构的扩展,即IA-32e
(IntelArchitectur-32extension)。IA-32处理器通过附加EM64T技术,便可在兼容IA-32
软件的情况下,允许软件利用更多的内存地址空间,并且允许软件进行32 bit线性地址写
入。EM64T特别强调的是对32 bit和64 bit的兼容性。Intel为新核心增加了8个64
bitGPRs(R8-R15),并且把原有GRPs全部扩展为64 bit,这样可以提高整数运算能力。
增加8个128bitSSE寄存器(XMM8-XMM15),是为了增强多媒体性能,包括对SSE、
SSE2和SSE3的支持。Intel为支持EM64T技术的处理器设计了两大模式:传统IA-32模
式(legacy IA-32mode)和IA-32e扩展模式(IA-32e mode)。在支持EM64T技术的
处理器内有一个称之为扩展功能激活寄存器(extendedfeature enableregister,
IA32_EFER)的部件,其中的Bit10控制着EM64T是否激活。Bit10被称作IA-32e模式
有效(IA-32emode active)或长模式有效(long mode active,LMA)。当LMA=0时,
处理器便作为一颗标准的32bit(IA32)处理器运行在传统IA-32模式;当LMA=1时,
EM64T便被激活,处理器会运行在IA-32e扩展模式下。目前AMD方面支持64位技术
的CPU有Athlon 64系列、AthlonFX系列和Opteron系列。Intel方面支持64位技术
的CPU有使用Nocona核心的Xeon系列、使用Prescott2M核心的Pentium 4 6系列
和使用Prescott 2M核心的P4 EE系列。 浅谈 EM64T技术和AMD64区别X86-64
(AMD64 / EM64T) :AMD公司设计,可以在同一时间内处理64位的整数运算,并
兼容于X86-32架构。其中支持64位逻辑定址,同时提供转换为32位定址选项;但数据
操作指令默认为32位和8位,提供转换成64位和16位的选项;支持常规用途寄存器,
如果是32位运算操作,就要将结果扩展成完整的64位。这样,指令中有“直接执行”和
“转换执行”的区别,其指令字段是8位或32位,可以避免字段过长。x86-64(AMD64)
的产生也并非空穴来风,x86处理器的32bit寻址空间限制在4GB内存,而IA-64的处理
器又不能兼容x86。AMD充分考虑顾客的需求,加强x86指令集的功能,使这套指令集
可同时支持64位的运算模式,因此AMD把它们的结构称之为x86-64。在技术上AMD
在x86-64架构中为了进行64位运算,AMD为其引入了新增了R8-R15通用寄存器作为
原有X86处理器寄存器的扩充,但在而在32位环境下并不完全使用到这些寄存器。原来
的寄存器诸如EAX、EBX也由32位扩张至64位。在SSE单元中新加入了8个新寄存器
以提供对SSE2的支持。寄存器数量的增加将带来性能的提升。与此同时,为了同时支持
32和64位代码及寄存器,x86-64架构允许处理器工作在以下两种模式:LongMode(长
模式)和Legacy Mode(遗传模式),Long模式又分为两种子模式(64bit模式和
Compatibilitymode兼容模式)。该标准已经被引进在AMD服务器处理器中的Opteron
处理器。而今年也推出了支持64位的EM64T技术,再还没被正式命为EM64T之前是
IA32E,这是英特尔64位扩展技术的名字,用来区别X86指令集。Intel的EM64T支持64
位sub-mode,和AMD的X86-64技术类似,采用64位的线性平面寻址,加入8个新
的通用寄存器(GPRs),还增加8个寄存器支持SSE指令。与AMD相类似,Intel的64
位技术将兼容IA32和IA32E,只有在运行64位操作系统下的时候,才将会采用IA32E。
IA32E将由2个sub-mode组成:64位sub-mode和32位sub-mode,同AMD64一
样是向下兼容的。Intel的EM64T将完全兼容AMD的X86-64技术。现在Nocona处理
器已经加入了一些64位技术,Intel的Pentium4E处理器也支持64位技术。应该说,这
两者都是兼容x86指令集的64位微处理器架构,但EM64T与AMD64还是有一些不一
样的地方,AMD64处理器中的NX位在Intel的处理器中将没有提供
七: 什么是迅驰技术:2003年3月英特尔正式发布了迅驰移动计算技术,英特尔的
迅驰移动计算技术并非以往的处理器、芯片组等单一产品形式,其代表了一整套移动计算
解决方案,迅驰的构成分为三个部分:奔腾M处理器、855/915系列芯片组和英特尔PRO
无线网上,三项缺一不可共同组成了迅驰移动计算技术。 奔腾M首次改版叫Dothan在
两年多时间里,迅驰技术经历了一次改版和一次换代。初期迅驰中奔腾M处理器的核心代
号为Bannis,采用130纳米工艺,1MB高速二级缓存,400MHz前端总线。迅驰首次改
版是在2004年5月,采用90纳米工艺Dothan核心的奔腾M处理器出现,其二级缓存
容量提供到2MB,前端总线仍为400MHz,它也就是我们常说的Dothan迅驰。首次改
版后,Dothan核心的奔腾M处理器迅速占领市场,Bannis核心产品逐渐退出主流。虽
然市场中流行着将Dothan核心称之为迅驰二代,但英特尔官方并没有给出明确的定义,
仍然叫做迅驰。也就是在Dothan奔腾M推出的同时,英特尔更改了以主频定义处理器编
号的惯例,取而代之的是一系列数字,例如:奔腾M715/725等,它们分别对应1.5GHz
和1.6GHz主频。首次改版中,原802.11b无线网卡也改为了支持802.11b/g规范,网络
传输从11Mbps提供至14Mbps. 新一代迅驰Sonoma迅驰的换代是2005年1月19日,
英特尔正式发布基于Sonoma平台的新一代迅驰移动计算技术,其构成组件中,奔腾M
处理器升级为Dothan核心、90纳米工艺、533MHz前端总线和2MB高速二级缓存,处
理器编号由奔腾M730—770,主频由1.60GHz起,最高2.13GHz。915GM/PM芯片组
让迅驰进入了PCI-E时代,其中915GM整合了英特尔GMA900图形引擎,让非独立显
卡笔记本在多媒体性能上有了较大提高。915PM/GM还支持单通道DDR333或双通道
DDR2400/533MHz内存,性能提供同时也降低了部分功耗。目前Sonoma平台的新一代
迅驰渐渐成为市场主流。现在又推出了迅驰三代。迅驰平台的构成:迅驰一:PM CPU+855
芯片+IEEE802.11B无线网卡迅驰 二:。。 +915.。 +802.11B/G迅驰 三:酷睿(双核或
单核)+945+802.11A/B/G
2024年3月21日发(作者:南门虹颖)
CPU性能参数详解
一: 什么是酷睿:“酷睿”是一款领先节能的新型微架构,设计的出发点是提供卓然
出众的性能和能效,提高每瓦特性能,也就是所谓的能效比。早期的酷睿是基于笔记本处
理器的。酷睿2:英文Core 2Duo,是英特尔推出的新一代基于Core微架构的产品体系
统称。于2006年7月27日发布。酷睿2,是一个跨平台的构架体系,包括服务器版、桌
面版、移动版三大领域。其中,服务器版的开发代号为Woodcrest,桌面版的开发代号为
Conroe,移动版的开发代号为Merom。特性:全新的Core架构,彻底抛弃了Netburst
架构全部采用65nm制造工艺全线产品均为双核心,L2缓存容量提升到4MB晶体管数量
达到2.91 亿个,核心尺寸为143平方毫米 性能提升40%能耗降低40%,主流产品的平
均能耗为65瓦特,顶级的X6800也仅为75瓦特前端总线提升至1066Mhz(Conroe),
1333Mhz(Woodcrest),667Mhz(Merom)服务器类Woodcrest为开发代号,实际的
产品名称为Xeon 5100系列。采用LGA771接口。Xeon 5100系列包含两种FSB的产品
规格(5110采用1066 MHz,5130采用1333MHz)。拥有两个处理核心和4MB共享式
二级缓存,平均功耗为65W,最大仅为80W,较AMD的Opteron的95W功耗很具优
势。台式机类Conroe处理器分为普通版和至尊版两种,产品线包括E6000系列和E4000
系列,两者的主要差别为FSB频率不同。普通版E6000系列处理器主频从1.8GHz到
2.67GHz,频率虽低,但由于优秀的核心架构,Conroe处理器的性能表现优秀。此外,
Conroe处理器还支持Intel的VT、EIST、EM64T和XD技术,并加入了SSE4指令集。
由于Core的高效架构,Conroe不再提供对HT的支持。
二:什么是双核处理器双核与双芯(Dual Core Vs. Dual CPU):AMD和Intel的双
核技术在物理结构上也有很大不同之处。AMD将两个内核做在一个Die(晶元)上,通过
直连架构连接起来,集成度更高。Intel则是将放在不同Die(晶元)上的两个内核封装在
一起,因此有人将Intel的方案称为“双芯”,认为AMD的方案才是真正的“双核”。从
用户端的角度来看,AMD的方案能够使双核CPU的管脚、功耗等指标跟单核CPU保持
一致,从单核升级到双核,不需要更换电源、芯片组、散热系统和主板,只需要刷新BIOS
软件即可,这对于主板厂商、计算机厂商和最终用户的投资保护是非常有利的。客户可以
利用其现有的90纳米基础设施,通过BIOS更改移植到基于双核心的系统。计算机厂商可
以轻松地提供同一硬件的单核心与双核心版本,使那些既想提高性能又想保持IT环境稳定
性的客户能够在不中断业务的情况下升级到双核心。在一个机架密度较高的环境中,通过
在保持电源与基础设施投资不变的情况下移植到双核心,客户的系统性能将得到巨大的提
升。在同样的系统占地空间上,通过使用双核心处理器,客户将获得更高水平的计算能力
和性能。双核处理器(Dual Core Processor):双核处理器是指在一个处理器上集成两个运
算核心,从而提高计算能力。“双核”的概念最早是由IBM、HP、Sun等支持RISC架构
的高端服务器厂商提出的,不过由于RISC架构的服务器价格高、应用面窄,没有引起广
泛的注意。最近逐渐热起来的“双核”概念,主要是指基于X86开放架构的双核技术。在
这方面,起领导地位的厂商主要有AMD和Intel两家。其中,两家的思路又有不同。AMD
从一开始设计时就考虑到了对多核心的支持。所有组件都直接连接到CPU,消除系统架构
方面的挑战和瓶颈。两个处理器核心直接连接到同一个内核上,核心之间以芯片速度通信,
进一步降低了处理器之间的延迟。而Intel采用多个核心共享前端总线的方式。专家认为,
AMD的架构对于更容易实现双核以至多核,Intel的架构会遇到多个内核争用总线资源的
瓶颈问题。 目前Intel推出的台式机双核心处理器有Pentium D、PentiumEE(Pentium
Extreme Edition)和Core Duo三种类型,三者的工作原理有很大不同。 一、PentiumD
和Pentium EE Pentium D和PentiumEE分别面向主流市场以及高端市场,其每个核心
采用独立式缓存设计,在处理器内部两个核心之间是互相隔绝的,通过处理器外部(主板北
桥芯片)的仲裁器负责两个核心之间的任务分配以及缓存数据的同步等协调工作。两个核心
共享前端总线,并依靠前端总线在两个核心之间传输缓存同步数据。从架构上来看,这种
类型是基于独立缓存的松散型双核心处理器耦合方案,其优点是技术简单,只需要将两个
相同的处理器内核封装在同一块基板上即可;缺点是数据延迟问题比较严重,性能并不尽
如人意。另外,Pentium D和Pentium EE的最大区别就是Pentium EE支持超线程技术
而PentiumD则不支持,Pentium EE在打开超线程技术之后会被操作系统识别为四个逻
辑处理器。AMD双核处理器 AMD推出的双核心处理器分别是双核心的Opteron系列和
全新的Athlon 64 X2系列处理器。其中Athlon 64X2是用以抗衡Pentium D和Pentium
Extreme Edition的桌面双核心处理器系列。 AMD推出的Athlon 64X2是由两个Athlon
64处理器上采用的Venice核心组合而成,每个核心拥有独立的512KB(1MB)L2缓存及执
行单元。除了多出一个核芯之外,从架构上相对于目前Athlon 64在架构上并没有任何重
大的改变。 双核心Athlon 64X2的大部分规格、功能与我们熟悉的Athlon 64架构没有
任何区别,也就是说新推出的Athlon 64X2双核心处理器仍然支持1GHz规格的
HyperTransport总线,并且内建了支持双通道设置的DDR内存控制器。与Intel双核心
处理器不同的是,Athlon 64 X2的两个内核并不需要经过MCH进行相互之间的协调。
AMD在Athlon 64X2双核心处理器的内部提供了一个称为System RequestQueue(系统
请求队列)的技术,在工作的时候每一个核心都将其请求放在SRQ中,当获得资源之后请
求将会被送往相应的执行核心,也就是说所有的处理过程都在CPU核心范围之内完成,并
不需要借助外部设备。对于双核心架构,AMD的做法是将两个核心整合在同一片硅晶内
核之中,而Intel的双核心处理方式则更像是简单的将两个核心做到一起而已。与Intel的
双核心架构相比,AMD双核心处理器系统不会在两个核心之间存在传输瓶颈的问题。因
此从这个方面来说,Athlon 64X2的架构要明显优于Pentium D架构。虽然与Intel相比,
AMD并不用担心Prescott核心这样的功耗和发热大户,但是同样需要为双核心处理器考
虑降低功耗的方式。为此AMD并没有采用降低主频的办法,而是在其使用90nm工艺生
产的Athlon 64 X2处理器中采用了所谓的Dual StressLiner应变硅技术,与SOI技术配
合使用,能够生产出性能更高、耗电更低的晶体管。 AMD推出的Athlon 64X2处理器给
用户带来最实惠的好处就是,不需要更换平台就能使用新推出的双核心处理器,只要对老
主板升级一下BIOS就可以了,这与Intel双核心处理器必须更换新平台才能支持的做法相
比,升级双核心系统会节省不少费用
三:什么是CPU主频:在电子技术中,脉冲信号是一个按一定电压幅度,一定时间间
隔连续发出的脉冲信号。脉冲信号之间的时间间隔称为周期;而将在单位时间(如1秒)
内所产生的脉冲个数称为频率。频率是描述周期性循环信号(包括脉冲信号)在单位时间
内所出现的脉冲数量多少的计量名称;频率的标准计量单位是Hz(赫)。电脑中的系统时
钟就是一个典型的频率相当精确和稳定的脉冲信号发生器。频率在数学表达式中用“f”表
示,其相应的单位有:Hz(赫)、kHz(千赫)、MHz(兆赫)、GHz(吉赫)。其中
1GHz=1000MHz,1MHz=1000kHz,1kHz=1000Hz。计算脉冲信号周期的时间单位及
相应的换算关系是:s(秒)、ms(毫秒)、μs(微秒)、ns(纳秒),其中:1s=1000ms,
1ms=1000μs,1μs=1000ns。 CPU的主频,即CPU内核工作的时钟频率(CPU
ClockSpeed)。通常所说的某某CPU是多少兆赫的,而这个多少兆赫就是“CPU的主频”。
很多人认为CPU的主频就是其运行速度,其实不然。CPU的主频表示在CPU内数字脉冲
信号震荡的速度,与CPU实际的运算能力并没有直接关系。主频和实际的运算速度存在一
定的关系,但目前还没有一个确定的公式能够定量两者的数值关系,因为CPU的运算速度
还要看CPU的流水线的各方面的性能指标(缓存、指令集,CPU的位数等等)。由于主频
并不直接代表运算速度,所以在一定情况下,很可能会出现主频较高的CPU实际运算速度
较低的现象。比如AMD公司的AthlonXP系列CPU大多都能已较低的主频,达到英特尔
公司的Pentium4系列CPU较高主频的CPU性能,所以AthlonXP系列CPU才以PR值
的方式来命名。因此主频仅是CPU性能表现的一个方面,而不代表CPU的整体性能。
CPU的主频不代表CPU的速度,但提高主频对于提高CPU运算速度却是至关重要的。举
个例子来说,假设某个CPU在一个时钟周期内执行一条运算指令,那么当CPU运行在
100MHz主频时,将比它运行在50MHz主频时速度快一倍。因为100MHz的时钟周期
比50MHz的时钟周期占用时间减少了一半,也就是工作在100MHz主频的CPU执行一
条运算指令所需时间仅为10ns比工作在50MHz主频时的20ns缩短了一半,自然运算速
度也就快了一倍。只不过电脑的整体运行速度不仅取决于CPU运算速度,还与其它各分系
统的运行情况有关,只有在提高主频的同时,各分系统运行速度和各分系统之间的数据传
输速度都能得到提高后,电脑整体的运行速度才能真正得到提高。 提高CPU工作主频
主要受到生产工艺的限制。由于CPU是在半导体硅片上制造的,在硅片上的元件之间需要
导线进行联接,由于在高频状态下要求导线越细越短越好,这样才能减小导线分布电容等
杂散干扰以保证CPU运算正确。因此制造工艺的限制,是CPU主频发展的最大障碍之一。
四:什么是前端总线:微机中总线一般有内部总线、系统总线和外部总线。内部总线
是微机内部各外围芯片与处理器之间的总线,用于芯片一级的互连;而系统总线是微机中
各插件板与系统板之间的总线,用于插件板一级的互连;外部总线则是微机和外部设备之
间的总线,微机作为一种设备,通过该总线和其他设备进行信息与数据交换,它用于设备
一级的互连。 什么是前端总线:“前端总线”这个名称是由AMD在推出K7CPU时提出
的概念,但是一直以来都被大家误认为这个名词不过是外频的另一个名称。我们所说的外
频指的是CPU与主板连接的速度,这个概念是建立在数字脉冲信号震荡速度基础之上的,
而前端总线的速度指的是数据传输的速度,由于数据传输最大带宽取决于所有同时传输的
数据的宽度和传输频率,即数据带宽=(总线频率×数据位宽)÷8。目前PC机上所能达
到的前端总线频率有266MHz、333MHz、400MHz、533MHz、800MHz、1066MHz、
1333MHz几种,前端总线频率越大,代表着CPU与内存之间的数据传输量越大,更能充
分发挥出CPU的功能。现在的CPU技术发展很快,运算速度提高很快,而足够大的前端
总线可以保障有足够的数据供给给CPU。较低的前端总线将无法供给足够的数据给CPU,
这样就限制了CPU性能得发挥,成为系统瓶颈。前端总线的英文名字是Front SideBus,
通常用FSB表示,是将CPU连接到北桥芯片的总线。选购主板和CPU时,要注意两者搭
配问题,一般来说,如果CPU不超频,那么前端总线是由CPU决定的,如果主板不支持
CPU所需要的前端总线,系统就无法工作。也就是说,需要主板和CPU都支持某个前端
总线,系统才能工作,只不过一个CPU默认的前端总线是唯一的,因此看一个系统的前端
总线主要看CPU就可以。北桥芯片负责联系内存、显卡等数据吞吐量最大的部件,并和南
桥芯片连接。CPU就是通过前端总线(FSB)连接到北桥芯片,进而通过北桥芯片和内存、
显卡交换数据。前端总线是CPU和外界交换数据的最主要通道,因此前端总线的数据传输
能力对计算机整体性能作用很大,如果没足够快的前端总线,再强的CPU也不能明显提高
计算机整体速度。数据传输最大带宽取决于所有同时传输的数据的宽度和传输频率,即数
据带宽=(总线频率×数据位宽)÷8。目前PC机上所能达到的前端总线频率有266MHz、
333MHz、400MHz、533MHz、800MHz几种,前端总线频率越大,代表着CPU与北
桥芯片之间的数据传输能力越大,更能充分发挥出CPU的功能。现在的CPU技术发展很
快,运算速度提高很快,而足够大的前端总线可以保障有足够的数据供给给CPU,较低的
前端总线将无法供给足够的数据给CPU,这样就限制了CPU性能得发挥,成为系统瓶颈。
显然同等条件下,前端总线越快,系统性能越好。外频与前端总线频率的区别:前端总线
的速度指的是数据传输的速度,外频是CPU与主板之间同步运行的速度。也就是说,
100MHz外频特指数字脉冲信号在每秒钟震荡一千万次;而100MHz前端总线指的是每
秒钟CPU可接受的数据传输量是100MHz×64bit=6400Mbit/s=800MByte/s
(1Byte=8bit)。
五:多媒体指令集:CPU依靠指令来计算和控制系统,每款CPU在设计时就规定了
一系列与其硬件电路相配合的指令系统。指令的强弱也是CPU的重要指标,指令集是提高
微处理器效率的最有效工具之一。从现阶段的主流体系结构讲,指令集可分为复杂指令集
和精简指令集两部分,而从具体运用看,如Intel的MMX(Multi Media Extended)、SSE、
SSE2(Streaming-Singleinstruction multiple data-Extensions2)和AMD的3DNow!
等都是CPU的扩展指令集,分别增强了CPU的多媒体、图形图象和Internet等的处理能
力。我们通常会把CPU的扩展指令集称为"CPU的指令集"。1、精简指令集的运用 在
最初发明计算机的数十年里,随着计算机功能日趋增大,性能日趋变强,内部元器件也越
来越多,指令集日趋复杂,过于冗杂的指令严重的影响了计算机的工作效率。后来经过研
究发现,在计算机中,80%程序只用到了20%的指令集,基于这一发现,RISC精简指令
集被提了出来,这是计算机系统架构的一次深刻革命。RISC体系结构的基本思路是:抓住
CISC指令系统指令种类太多、指令格式不规范、寻址方式太多的缺点,通过减少指令种类、
规范指令格式和简化寻址方式,方便处理器内部的并行处理,提高VLSI器件的使用效率,
从而大幅度地提高处理器的性能。 RISC指令集有许多特征,其中最重要的有:指令种
类少,指令格式规范:RISC指令集通常只使用一种或少数几种格式。指令长度单一(一般
4个字节),并且在字边界上对齐,字段位置、特别是操作码的位置是固定的。寻址方式简
化:几乎所有指令都使用寄存器寻址方式,寻址方式总数一般不超过5个。其他更为复杂
的寻址方式,如间接寻址等则由软件利用简单的寻址方式来合成。大量利用寄存器间操作:
RISC指令集中大多数操作都是寄存器到寄存器操作,只以简单的Load和Store操作访问
内存。因此,每条指令中访问的内存地址不会超过1个,访问内存的操作不会与算术操作
混在一起。简化处理器结构:使用RISC指令集,可以大大简化处理器的控制器和其他功
能单元的设计,不必使用大量专用寄存器,特别是允许以硬件线路来实现指令操作,而不
必像CISC处理器那样使用微程序来实现指令操作。因此RISC处理器不必像CISC处理器
那样设置微程序控制存储器,就能够快速地直接执行指令。便于使用VLSI技术:随着LSI
和VLSI技术的发展,整个处理器(甚至多个处理器)都可以放在一个芯片上。RISC体系
结构可以给设计单芯片处理器带来很多好处,有利于提高性能,简化VLSI芯片的设计和实
现。基于VLSI技术,制造RISC处理器要比CISC处理器工作量小得多,成本也低得多。
加强了处理器并行能力:RISC指令集能够非常有效地适合于采用流水线、超流水线和超标
量技术,从而实现指令级并行操作,提高处理器的性能。目前常用的处理器内部并行操作
技术基本上是基于RISC体系结构发展和走向成熟的。 正由于RISC体系所具有的优势,
它在高端系统得到了广泛的应用,而CISC体系则在桌面系统中占据统治地位。而在如今,
在桌面领域,RISC也不断渗透,预计未来,RISC将要一统江湖。2、CPU的扩展指令集
对于CPU来说,在基本功能方面,它们的差别并不太大,基本的指令集也都差不多,但是
许多厂家为了提升某一方面性能,又开发了扩展指令集,扩展指令集定义了新的数据和指
令,能够大大提高某方面数据处理能力,但必需要有软件支持。MMX 指令集 MMX
(Multi MediaeXtension,多媒体扩展指令集)指令集是Intel公司于1996年推出的一
项多媒体指令增强技术。MMX指令集中包括有57条多媒体指令,通过这些指令可以一次
处理多个数据,在处理结果超过实际处理能力的时候也能进行正常处理,这样在软件的配
合下,就可以得到更高的性能。MMX的益处在于,当时存在的操作系统不必为此而做出
任何修改便可以轻松地执行MMX程序。但是,问题也比较明显,那就是MMX指令集与
x87浮点运算指令不能够同时执行,必须做密集式的交错切换才可以正常执行,这种情况
就势必造成整个系统运行质量的下降。SSE指令集 SSE(Streaming SIMD Extensions,
单指令多数据流扩展)指令集是Intel在PentiumIII处理器中率先推出的。其实,早在PIII
正式推出之前,Intel公司就曾经通过各种渠道公布过所谓的KNI(Katmai NewInstruction)
指令集,这个指令集也就是SSE指令集的前身,并一度被很多传媒称之为MMX指令集的
下一个版本,即MMX2指令集。究其背景,原来"KNI"指令集是Intel公司最早为其下一
代芯片命名的指令集名称,而所谓的"MMX2"则完全是硬件评论家们和媒体凭感觉和印象
对"KNI"的评价,Intel公司从未正式发布过关于MMX2的消息。 而最终推出的SSE
指令集也就是所谓胜出的"互联网SSE"指令集。SSE指令集包括了70条指令,其中包含提
高3D图形运算效率的50条SIMD(单指令多数据技术)浮点运算指令、12条MMX整
数运算增强指令、8条优化内存中连续数据块传输指令。理论上这些指令对目前流行的图
像处理、浮点运算、3D运算、视频处理、音频处理等诸多多媒体应用起到全面强化的作用。
SSE指令与3DNow!指令彼此互不兼容,但SSE包含了3DNow!技术的绝大部分功能,只
是实现的方法不同。SSE兼容MMX指令,它可以通过SIMD和单时钟周期并行处理多个
浮点数据来有效地提高浮点运算速度。SSE2指令集 SSE2(Streaming SIMD Extensions 2,
Intel官方称为SIMD 流技术扩展2或数据流单指令多数据扩展指令集2)指令集是Intel
公司在SSE指令集的基础上发展起来的。相比于SSE,SSE2使用了144个新增指令,扩
展了MMX技术和SSE技术,这些指令提高了广大应用程序的运行性能。随MMX技术引
进的SIMD整数指令从64位扩展到了128位,使SIMD整数类型操作的有效执行率成倍
提高。双倍精度浮点SIMD指令允许以SIMD格式同时执行两个浮点操作,提供双倍精度
操作支持有助于加速内容创建、财务、工程和科学应用。除SSE2指令之外,最初的SSE
指令也得到增强,通过支持多种数据类型(例如,双字和四字)的算术运算,支持灵活并且
动态范围更广的计算功能。SSE2指令可让软件开发员极其灵活的实施算法,并在运行诸如
MPEG-2、MP3、3D图形等之类的软件时增强性能。Intel是从Willamette核心的
Pentium4开始支持SSE2指令集的,而AMD则是从K8架构的SledgeHammer核心的
Opteron开始才支持SSE2指令集的。SSE3指令集 SSE3(Streaming SIMD Extensions 3,
Intel官方称为SIMD 流技术扩展3或数据流单指令多数据扩展指令集3)指令集是Intel
公司在SSE2指令集的基础上发展起来的。相比于SSE2,SSE3在SSE2的基础上又增加了
13个额外的SIMD指令。SSE3中13个新指令的主要目的是改进线程同步和特定应用程
序领域,例如媒体和游戏。这些新增指令强化了处理器在浮点转换至整数、复杂算法、视
频编码、SIMD浮点寄存器操作以及线程同步等五个方面的表现,最终达到提升多媒体和
游戏性能的目的。Intel是从Prescott核心的Pentium4开始支持SSE3指令集的,而AMD
则是从2005年下半年Troy核心的Opteron开始才支持SSE3的。但是需要注意的是,
AMD所支持的SSE3与Intel的SSE3并不完全相同,主要是删除了针对Intel超线程技术
优化的部分指令。3D Now!(3D no waiting)指令集 3DNow!是AMD公司开发的
SIMD指令集,可以增强浮点和多媒体运算的速度,并被AMD广泛应用于其K6-2、K6-3
以及Athlon(K7)处理器上。3DNow!指令集技术其实就是21条机器码的扩展指令集。
与Intel公司的MMX技术侧重于整数运算有所不同,3DNow!指令集主要针对三维建模、
坐标变换和效果渲染等三维应用场合,在软件的配合下,可以大幅度提高3D处理性能。
后来在Athlon上开发了Enhanced3DNow!。这些AMD标准的SIMD指令和Intel的SSE
具有相同效能。因为受到Intel在商业上以及PentiumIII成功的影响,软件在支持SSE上
比起3DNow!更为普遍。Enhanced3DNow!AMD公司继续增加至52个指令,包含了一
些SSE码,因而在针对SSE做最佳化的软件中能获得更好的效能
六:什么是64位技术:这里的64位技术是相对于32位而言的,这个位数指的是CPU
GPRs(General-PurposeRegisters,通用寄存器)的数据宽度为64位,64位指令集就
是运行64位数据的指令,也就是说处理器一次可以运行64bit数据。64bit处理器并非现
在才有的,在高端的RISC(Reduced Instruction SetComputing,精简指令集计算机)
很早就有64bit处理器了,比如SUN公司的UltraSparcⅢ、IBM公司的POWER5、HP
公司的Alpha等。64bit计算主要有两大优点:可以进行更大范围的整数运算;可以支持
更大的内存。不能因为数字上的变化,而简单的认为64bit处理器的性能是32bit处理器
性能的两倍。实际上在32bit应用下,32bit处理器的性能甚至会更强,即使是64bit处理
器,目前情况下也是在32bit应用下性能更强。所以要认清64bit处理器的优势,但不可
迷信64bit。要实现真正意义上的64位计算,光有64位的处理器是不行的,还必须得有
64位的操作系统以及64位的应用软件才行,三者缺一不可,缺少其中任何一种要素都是
无法实现64位计算的。目前,在64位处理器方面,Intel和AMD两大处理器厂商都发布
了多个系列多种规格的64位处理器;而在操作系统和应用软件方面,目前的情况不容乐
观。因为真正适合于个人使用的64位操作系统现在就只有Windows XP X64,而Windows
XPX64本身也只是一个过渡性质的64位操作系统,在Windows Vista发布以后就将被淘
汰,而且Windows XPX64本身也不太完善,易用性不高,一个明显的例子就是各种硬件
设备的驱动程序很不完善,而且现在64位的应用软件还基本上没有,确实硬件厂商和软
件厂商也不愿意去为一个过渡性质的操作系统编写驱动程序和应用软件。所以要想实现真
正的64位计算,恐怕还得等到WindowsVista普及一段时间之后才行。目前主流CPU使
用的64位技术主要有AMD公司的AMD64位技术、Intel公司的EM64T技术、和Intel
公司的IA-64技术。其中IA-64是Intel独立开发,不兼容现在的传统的32位计算机,仅
用于Itanium(安腾)以及后续产品Itanium2,一般用户不会涉及到,因此这里仅对AMD64
位技术和Intel的EM64T技术做一下简单介绍。 AMD64位技术X86-64:AMD64的位
技术是在原始32位X86指令集的基础上加入了X86-64扩展64位X86指令集,使这款
芯片在硬件上兼容原来的32位X86软件,并同时支持X86-64的扩展64位计算,使得这
款芯片成为真正的64位X86芯片。这是一个真正的64位的标准,X86-64具有64位的
寻址能力。X86-64新增的几组CPU寄存器将提供更快的执行效率。寄存器是CPU内部
用来创建和储存CPU运算结果和其它运算结果的地方。标准的32-bitx86架构包括8个
通用寄存器(GPR),AMD在X86-64中又增加了8组(R8-R9),将寄存器的数目提高到
了16组。X86-64寄存器默认位64-bit。还增加了8组128-bitXMM寄存器(也叫SSE
寄存器,XMM8-XMM15),将能给单指令多数据流技术(SIMD)运算提供更多的空间,
这些128位的寄存器将提供在矢量和标量计算模式下进行128位双精度处理,为3D建模、
矢量分析和虚拟现实的实现提供了硬件基础。通过提供了更多的寄存器,按照X86-64标
准生产的CPU可以更有效的处理数据,可以在一个时钟周期中传输更多的信息。EM64T
技术 Intel官方是给EM64T这样定义的:EM64T全称Extended Memory 64Technology,
即扩展64bit内存技术。EM64T是Intel IA-32架构的扩展,即IA-32e
(IntelArchitectur-32extension)。IA-32处理器通过附加EM64T技术,便可在兼容IA-32
软件的情况下,允许软件利用更多的内存地址空间,并且允许软件进行32 bit线性地址写
入。EM64T特别强调的是对32 bit和64 bit的兼容性。Intel为新核心增加了8个64
bitGPRs(R8-R15),并且把原有GRPs全部扩展为64 bit,这样可以提高整数运算能力。
增加8个128bitSSE寄存器(XMM8-XMM15),是为了增强多媒体性能,包括对SSE、
SSE2和SSE3的支持。Intel为支持EM64T技术的处理器设计了两大模式:传统IA-32模
式(legacy IA-32mode)和IA-32e扩展模式(IA-32e mode)。在支持EM64T技术的
处理器内有一个称之为扩展功能激活寄存器(extendedfeature enableregister,
IA32_EFER)的部件,其中的Bit10控制着EM64T是否激活。Bit10被称作IA-32e模式
有效(IA-32emode active)或长模式有效(long mode active,LMA)。当LMA=0时,
处理器便作为一颗标准的32bit(IA32)处理器运行在传统IA-32模式;当LMA=1时,
EM64T便被激活,处理器会运行在IA-32e扩展模式下。目前AMD方面支持64位技术
的CPU有Athlon 64系列、AthlonFX系列和Opteron系列。Intel方面支持64位技术
的CPU有使用Nocona核心的Xeon系列、使用Prescott2M核心的Pentium 4 6系列
和使用Prescott 2M核心的P4 EE系列。 浅谈 EM64T技术和AMD64区别X86-64
(AMD64 / EM64T) :AMD公司设计,可以在同一时间内处理64位的整数运算,并
兼容于X86-32架构。其中支持64位逻辑定址,同时提供转换为32位定址选项;但数据
操作指令默认为32位和8位,提供转换成64位和16位的选项;支持常规用途寄存器,
如果是32位运算操作,就要将结果扩展成完整的64位。这样,指令中有“直接执行”和
“转换执行”的区别,其指令字段是8位或32位,可以避免字段过长。x86-64(AMD64)
的产生也并非空穴来风,x86处理器的32bit寻址空间限制在4GB内存,而IA-64的处理
器又不能兼容x86。AMD充分考虑顾客的需求,加强x86指令集的功能,使这套指令集
可同时支持64位的运算模式,因此AMD把它们的结构称之为x86-64。在技术上AMD
在x86-64架构中为了进行64位运算,AMD为其引入了新增了R8-R15通用寄存器作为
原有X86处理器寄存器的扩充,但在而在32位环境下并不完全使用到这些寄存器。原来
的寄存器诸如EAX、EBX也由32位扩张至64位。在SSE单元中新加入了8个新寄存器
以提供对SSE2的支持。寄存器数量的增加将带来性能的提升。与此同时,为了同时支持
32和64位代码及寄存器,x86-64架构允许处理器工作在以下两种模式:LongMode(长
模式)和Legacy Mode(遗传模式),Long模式又分为两种子模式(64bit模式和
Compatibilitymode兼容模式)。该标准已经被引进在AMD服务器处理器中的Opteron
处理器。而今年也推出了支持64位的EM64T技术,再还没被正式命为EM64T之前是
IA32E,这是英特尔64位扩展技术的名字,用来区别X86指令集。Intel的EM64T支持64
位sub-mode,和AMD的X86-64技术类似,采用64位的线性平面寻址,加入8个新
的通用寄存器(GPRs),还增加8个寄存器支持SSE指令。与AMD相类似,Intel的64
位技术将兼容IA32和IA32E,只有在运行64位操作系统下的时候,才将会采用IA32E。
IA32E将由2个sub-mode组成:64位sub-mode和32位sub-mode,同AMD64一
样是向下兼容的。Intel的EM64T将完全兼容AMD的X86-64技术。现在Nocona处理
器已经加入了一些64位技术,Intel的Pentium4E处理器也支持64位技术。应该说,这
两者都是兼容x86指令集的64位微处理器架构,但EM64T与AMD64还是有一些不一
样的地方,AMD64处理器中的NX位在Intel的处理器中将没有提供
七: 什么是迅驰技术:2003年3月英特尔正式发布了迅驰移动计算技术,英特尔的
迅驰移动计算技术并非以往的处理器、芯片组等单一产品形式,其代表了一整套移动计算
解决方案,迅驰的构成分为三个部分:奔腾M处理器、855/915系列芯片组和英特尔PRO
无线网上,三项缺一不可共同组成了迅驰移动计算技术。 奔腾M首次改版叫Dothan在
两年多时间里,迅驰技术经历了一次改版和一次换代。初期迅驰中奔腾M处理器的核心代
号为Bannis,采用130纳米工艺,1MB高速二级缓存,400MHz前端总线。迅驰首次改
版是在2004年5月,采用90纳米工艺Dothan核心的奔腾M处理器出现,其二级缓存
容量提供到2MB,前端总线仍为400MHz,它也就是我们常说的Dothan迅驰。首次改
版后,Dothan核心的奔腾M处理器迅速占领市场,Bannis核心产品逐渐退出主流。虽
然市场中流行着将Dothan核心称之为迅驰二代,但英特尔官方并没有给出明确的定义,
仍然叫做迅驰。也就是在Dothan奔腾M推出的同时,英特尔更改了以主频定义处理器编
号的惯例,取而代之的是一系列数字,例如:奔腾M715/725等,它们分别对应1.5GHz
和1.6GHz主频。首次改版中,原802.11b无线网卡也改为了支持802.11b/g规范,网络
传输从11Mbps提供至14Mbps. 新一代迅驰Sonoma迅驰的换代是2005年1月19日,
英特尔正式发布基于Sonoma平台的新一代迅驰移动计算技术,其构成组件中,奔腾M
处理器升级为Dothan核心、90纳米工艺、533MHz前端总线和2MB高速二级缓存,处
理器编号由奔腾M730—770,主频由1.60GHz起,最高2.13GHz。915GM/PM芯片组
让迅驰进入了PCI-E时代,其中915GM整合了英特尔GMA900图形引擎,让非独立显
卡笔记本在多媒体性能上有了较大提高。915PM/GM还支持单通道DDR333或双通道
DDR2400/533MHz内存,性能提供同时也降低了部分功耗。目前Sonoma平台的新一代
迅驰渐渐成为市场主流。现在又推出了迅驰三代。迅驰平台的构成:迅驰一:PM CPU+855
芯片+IEEE802.11B无线网卡迅驰 二:。。 +915.。 +802.11B/G迅驰 三:酷睿(双核或
单核)+945+802.11A/B/G