2024年6月1日发(作者:赫从霜)
INTEL CPU全系列架构发展史及深度测试!
壮士断腕,Conroe临危受命
在很久很久以前的286时代,英特尔还只是一个小公司,它负责给IBM提供IBM PC中的微处理器。
那会儿,IBM PC销量很大,兼容机还没出现。为了能保证微处理器供货充足,上帝般的IBM强迫英特尔
将微处理器技术无偿授权给另一家公司。看IBM脸色吃饭的英特尔虽然老大不愿意但也没办法,最后选择
了AMD作为微处理器技术无偿提供对象(一不小心养虎成患,现在英特尔估计后悔到死)。为了制约AMD,
英特尔又将微处理器技术无偿授权给了Cyrix。
1982年2月1日,英特尔推出80286微处理器
在当时来说,英特尔除了产能占优外,在技术上是没有任何优势的,三家公司的微处理器架构基本一
致。但是这时候,IBM公司内部倒产生了巨大的分歧:许多人反对快速转换到286计算机的生产和销售,
因为这会对IBM的小型机与之前的PC XT销售造成影响,他们希望过渡的步伐能慢一些。
但英特尔并不能等,80286处理器已经批量生产了,不可能堆在仓库里等IBM慢慢消化。此时康柏公
司就钻了空子——快速推出286的IBM PC兼容机,并一举打败IBM成为PC市场的新霸主。随着IBM PC
兼容机的大量涌现,英特尔处理器也卖得越来越多,名气越来越大,实力与日俱增,也就不用再唯IBM马
首是瞻了。
1993年3月22日,英特尔发布新一代P5架构586微处理器,这款历史性的产品被英特尔命名为
Pentium(奔腾),并不再对AMD和Cyrix授权。
1993.3.22 英特尔推出里程碑式的Pentium处理器
而AMD也非昔日可比了,它具有很强的研发能力,并很快发布了K6处理器迎战,更逐渐衍生出K6-2
和K6-3处理器。K6-2处理器凭借架构上的优势令英特尔感到了巨大的压力。为此1995年英特尔又推出
新的P6架构取代奔腾/奔腾MMX的P5架构,以求在性能上保持领先地位。
1995.11.1 英特尔推出采用P6架构的Pentium Pro
最早采用P6架构的微处理器是高能奔腾(Pentium Pro)。P6架构与奔腾的P5架构最大的不同在于,
过去集成在主板上的二级缓存被整合到处理器内,从而大大地加快了数据读取时间和提高命中率。另外,
P6架构是一个纯32位的微处理器架构。
1997.4.7 英特尔推出Pentium II
为了将P6架构平价化,以对抗AMD等竞争对手,英特尔采用了将二级缓存从CPU核心移出,改用
外置于集成CPU核心的PCB板上的做法, 这“萌生”了1997年推出的奔腾II处理器。奔腾II处理器的二
级缓存外置于CPU核心以外,只能以处理器工作主频一半的速度运行,而不像奔腾Pro的二级缓存那样
以全速运行。随着0.25微米工艺的成熟,英特尔才尝试重新将二级缓存集成在核心内。
为了进一步巩固自己的领导地位,英特尔1999年1月推出了PentiumIII。
1999.1 英特尔推出PentiumIII
在PentiumIII时代之前,AMD和Cyrix一直是英特尔的追随者,但是AMD Athlon推出之后,历史发
生了微妙的变化:在AMD推出Athlon 650MHz的时候,英特尔处理器的最高主频才550MHz,这也是英
特尔第一次被竞争对手超过!为了保住自己颜面,英特尔匆匆推出了采用0.18微米工艺,代号"Coppermine"
的奔腾III处理器,主频有500MHz至700MHz几个型号。
这时候英特尔与AMD主频之争的激烈程度前所未有,我们熟悉的频率“攀比”战开始了。
最先达到1GHz主频的是AMD的Athlon处理器,同频的奔腾III处理器在落后不到一个月面世,但这
足以让AMD自豪了。由于1GHz的Athlon性能不敌1GHz奔腾III,AMD决定开发核心整合二级缓存的
Athlon XP。
随后英特尔霸王硬上弓,抢先推出1.13GHz的奔腾III,在性能上领先倒是领先了,但当时的0.18微
米工艺生产1.13GHz的奔腾III实在是勉为其难。后果就是全面回收几乎不能正常运行的奔腾III 1.13GHz
处理器。而此时,AMD推出了1.1GHz Athlon XP处理器。
◆ 饱受责难的NetBurst架构奔腾4
2000.11.20 英特尔推出Pentium4
英特尔在AMD强大的压力下,开始鼓吹“唯主频论”。在奔腾III及以前的微处理器时代,是一个处理
器性能与主频紧密结合的时代。那个时候无论是英特尔还是AMD,他们的处理器产品在主频提升的同时,
同样也会带来相应的性能提升。到了奔腾4,英特尔的“唯主频论”颠覆了“性能等于主频”的传统观念。
2000年11月20日,英特尔正式发布了NetBurst架构的奔腾4。这不仅仅是一款新产品的发布,它
还标志着一个处理器新时代的开始。奔腾4 1.4 GHz/1.5 GHz的出现,吸引了全世界的眼光。然而有专业
媒体质疑:为何奔腾4的主频这么高,但是实际测试项目很多都不如P6架构的1GHz奔腾III呢?英特尔
回答:奔腾4是一种全新的架构,它的性能不能再用传统的观点去评判。
奔腾4能够在同样的0.18微米工艺下轻松达到2GHz,而奔腾III 去到1.13GHz就已经到了极限,这
是因为奔腾4的运算流水管线多达20级甚至31级,而奔腾III只有11级。运算流水管线越长,就越容易
在同样制造工艺下达到更高的工作主频。Athlon在同样制造工艺下可以达到奔腾III难以达到的高主频,就
是因为Athlon的运算流水管线比奔腾III略长。但是运算流水管线过长也会带来负面影响,管线越长,单
位主频下的处理器执行效率就越低,性能的发挥就会受到影响。
第二代Northwood核心的奔腾4采用了0.13微米工艺制造,较好地解决了发热与功耗的问题,迅速
成为市场主流。此后随着800MHz FSB、超线程等新技术的引入,Pentium 4 NetBurst架构的威力的以充
分发挥,所以从性能/功耗上来讲,这个时候的奔腾4达到了巅峰。
随着主频的不断攀升,NetBurst架构的弊端越来越明显。第三代Prescott奔腾4流水线达到31级,
晶体管达到了125百万个(Northwood只有55百万个),以至于它每个时钟周期比Northwood多产生大
约60%的热量,同时功率消耗也增加大约10%!3.2GHz的Prescott TDP达到了触目惊心的103W!人
们开始戏称Pentium 4为烤炉,高主频带来的高功耗使得英特尔的忠实支持者要为奔腾的芯付出更多的电
费,同时更要忍受高性能处理器风扇所带来的巨大噪音……
64岁的英特尔总裁贝瑞特面对着6500人惊天一跪:“请原谅我们”(2004.10)
奔腾4最终止步于3.8GHz,原计划推出的4GHz奔腾4处理器也被胎死腹中。英特尔意识到处理器
研发道路上走入了“唯主频论”的误区,2004年10月,英特尔总裁贝瑞特惊天一跪,面对着6500人说道:
“请原谅我们”,真心地对公司的失误表示忏悔。
英特尔终于承认自己错了。不要忘记当初英特尔发布奔腾4时吹嘘说奔腾4是为10GHz的运算速度
设计的,这是到目前为止英特尔历史上最重要的或许也是最广为人知的工程失败事件。
◆ 临危受命的Core微架构
实际上,英特尔除了拥有NetBurst研发小组外,还有一支位于以色列海法的研发团队。该以色列团队
早在2003年就因为设计出兼具高性能与低功耗的Banias移动处理器而闻名天下,Core微架构是他们最
新的杰作,由于NetBurst架构的失败,Core微架构一下就成了英特尔的救命符。
2006年3月英特尔在春季IDF大会宣布下一代处理器将采用的Core微架构。英特尔指出未来处理器
的技术发展重点将是“每瓦特性能”(Performance per Watt)。而这届IDF的主题更加明确:功耗最优化平
台(Power-Optimized Platforms)。根据英特尔的说法,采用Core微架构的处理器将在性能方面得到极
大的飞跃,肯定将超过竞争对手AMD的产品。
更好的消息Core在功耗方面将比前任大幅下降。
Core微架构将一统江湖
Core微架构被英特尔推上前台,被赋予了取代NetBurst微架构、一统桌面、移动与服务器平台的历
史使命。针对笔记本、桌面级用户和服务器,Core均有不同的产品。
Conroe是基于Core微架构的桌面平台级产品(我们常说的“扣肉”),由于“Core”和“Conroe”两个单词
在结构上颇为类似,因此有不少消费者往往便认为“Core”和“Conroe”指得是同样一种产品。实际上,我们
通常把“Core”直接音译为“酷睿”,它是Intel新一代处理器产品统一采用的微架构,而Conroe(扣肉)只是对
基于Core(酷睿)微架构的桌面平台级产品。
除桌面的Conroe处理器之外,Core微架构还包括代号为“Merom”的移动平台处理器和代号为
“Woodcrest”的服务器平台处理器。
由于上一代采用Yonah微架构的处理器产品被命名为Intel Core Duo,因此为了便于与前代双核处理
器区分,Conroe以及Merom都将采用相同的命名方式——Core 2 Duo。另外,Intel最高性能的桌面服务
器芯片Woodcrest将命名为Core 2 Extreme,以区分于普通桌面/笔记本处理器产品。
Conroe处理器沿用了L1 Cache设计,L1数据Cache和L1指令Cache分别为32KB,两个核心共
享4MB或2MB的L2 Cache,它结合了Pentium M高效率和NetBurst动态执行性能优越两方面的优点。
Conroe处理器的数据流水线长度从Prescott的31级大幅度缩短至目前的14级。其算术逻辑运算单元ALU
数量由上代NetBurst微构架的2组提升至3组,同时在Cache构架上也经过了大幅度的改良,整体运算
性能大大增加。
Core微架构与Yonah微架构
目前比较普遍的看法是,Core微架构是Pentium Pro架构,或者说是P6微架构的延续。Core微架构
中只有预取机制是从NetBurst微架构获得的灵感,所有其它的设计都是从Yonah微架构(Core Duo处理
器)演变而来,而Yonah微架构是从Banias处理器和Dothan处理器演变而来的。所有Banias、Dothan、
Yonah和采用Core微架构的处理器都继承了NetBurst处理器的前端总线设计,但除此之外,它们毫无疑
问都是曾经获得巨大成功的P6微架构的后代。
英特尔P6微架构的总工程师之一Robert Colwell在其回忆录中表示他之所以离开英特尔,主要就是
因为他并不认同英特尔在NetBurst微架构中所选择的设计路线,因为他相信“The future is mobile”,如何
在维持省电与最长电池续航能力的前提下,达到足够的运算效能,才是处理器技术发展的未来方向。
NetBurst微架构的失败,与P6微架构的复兴,恰恰证明了英特尔之前策略的失败和他的远见。
不过这并不意味着只是把Yonah处理器的一些功能单元和解码器重新包装一下然后换了个名字就推出
来。英特尔Core开发人员称,Woodcrest、Conroe和Merom处理器都是基于Yonah处理器的,但是几
乎80%的架构和电路设计需要重新进行。
2006.7.27 英特尔Conroe全球同步上海发布会
2006年7月27日,英特尔全球同步发布基于其Core微架构的Conroe桌面平台处理器,承接6月
发布的服务器处理器Woodcrest,以及8月登场的笔记本处理器Merom,英特尔处理器全面从上一代
NetBurst微架构转向新的Core微架构。
◆ 解读Core微架构
英特尔对Core微架构的要求非常高,需要有很好的跨平台性,又要兼顾到功耗,最重要的是能提供
更高的性能。其中特别引人注意的就是英特尔在Core设计中导入的全新的每瓦特效率的设计概念,因为
这个概念的出现将真正影响未来英特尔处理器架构的发展,而这也对产业发展产生了重大的影响。
Core微架构的目标就是构建一个高效的双核心架构,因此采取共享式二级缓存设计,2个核心共享二
级缓存。内核采用高效的14级有效流水线设计,每个核心内建4组指令解码单元,支持微指令融合与宏
指令融合技术,每个时钟周期最多可以解码5条X86指令,并拥有改进的分支预测功能。每个核心内建5
个执行单元,执行资源庞大。采用新的内存相关性预测技术。支持增强的电源管理功能。支持硬件虚拟化
技术和硬件防病毒功能。内建数字温度传感器。还可提供功率报告和温度报告等,配合系统实现动态的功
耗控制和散热控制。
重要的一点是,Core微架构加入了对EM64T指令集的支持,随着Windows Vista的到来以及Intel、
AMD全面更换到64bit处理器,64bit计算的普及只是时间问题。
·14级指令执行流水线设计
流水线深度一直是影响处理器效率的重要因素,流水线深度的增加可以让处理器时钟频率进一步提高,
但带来的反面影响就是处理器的单周期执行效率降低、发热量上升,同时容易产生分支预测等问题,
Prescott核心的P4达到了31级流水线长度,要比当年的Pentium III和Athlon处理器高出许多,也让
Prescott最终走上失败之路。
在Core架构中,其指令流水线深度达到14级,这个深度是要高于Pentium M的12级,但是却比AMD
的K8处理器架构的17级要低上3级。目前的Core架构是兼顾执行效率和降低功耗的折中设计。
流水线的“条数”与“级数”是完全不同的概念。能够完整执行各种指令的一系列功能单元组成“一条”流水
线。而关于流水线级数,可以这样简单理解:一条流水线所包含的功能单元一般可以被划分为多个部分,
它可以被划分成几个部分,就称这条流水线是“几级”的。
Core微架构的14级有效流水线与Prescott核心的31级有效流水线的对比,也只有参考意义。那些
仅仅根据这个数字的对比就断言Core微架构只能达到很低的频率的说法是不具有足够的说服力的。
Conroe XE 3.33GHz处理器的存在已经让很多相信这个说法的人大吃一惊。而实际上,已经有很多玩家在
风冷下将Conroe处理器超频达到4GHz以上的频率。
除此之外,Core微架构加入了五大重要创新,其中包括宽区动态执行(Intel Wide Dynamic Execution)、
高级智能高速缓存(Intel Adcanced Smart Cache)、智能内存访问(Intel Smart Memory Acess)及高级
数字媒体增强技术(Intel Adcanced Digital Media Boost)、智能功率能力(Intel Intelligent Power
Capability),这里我们就只是对这五大重要创新作个简单介绍:
·宽区动态执行(intel Wide Dynamic Execution)
宽区动态执行(Intel Wide Dynamic Execution)技术就是通过提升每个时钟周期完成的指令数,从而
显著改进执行能力。通俗的说就是,每个内核将变得更加“宽阔”,这样每个内核就可以同时处理更多的指
令。
毫无疑问,Core微架构是一个比NetBurst或Yonah微架构更宽的设计。Core微架构拥有4组解码
单元,每周期可以生成7条微指令;Yonah 微架构拥有3组,每周期可以生成6条微指令;而NetBurst
微架构由于解码方式不同,不容易比较解码单元的数目,但是NetBurst微架构每周期只能生成3条微指令。
Core微架构把解码单元增加到4组,这个变化可以说是Core微架构最大的特色之一。X86指令集的
指令长度、格式与定址模式都相当混乱,导致X86指令解码器的设计是非常困难的。增加解码单元,特别
是复杂解码单元,固然会大大增强处理器的解码能力,但是解码单元复杂的电路也必然会提高内核的复杂
度和处理器的功耗。权衡利弊,英特尔最终选择了增加1组简单解码单元的折衷方案。
此外,Core架构的每个核心都拥有3个算术逻辑单元(ALU),而之前的NetBurst仅有2个ALU,
P6架构的处理器仅为1个,这样的设计使得Core架构拥有比较高的处理能力。
酷睿微体系结构在提升每个时钟周期的指令数方面做了很多努力,例如新加入宏融合(Macro-Fusion)
技术,它可以让处理器在解码的同时,将同类的指令融合为单一的指令,这样可以减少处理的指令总数,
让处理器在更短的时间内处理更多的指令。酷睿架构也改良了ALU以支持宏融合技术。
·高级智能高速缓存(Intel Advanced Smart Cache)
以往的多核心处理器,其每个核心的L2缓存是各自独立的,这就造成了L2缓存不能够被充分利用,
并且两个核心之间的数据交换路线也更为冗长,影响了处理器工作效率。如果采用L2缓存共享设计,那么
只需要数据被载入到L2缓存中,数据可以被两个核心同时使用。
这样做的另一个好处是每个内核之间都共享着更大的L2缓存,其缓存可以被任何一个核心所独占,这
样理论上每个核心都有可能获得100%的L2缓存掌控权,特别是对于一些单核心优化的程序,由于不需要
使用到第二个核心,这种时候,第二个核心自动关闭降低功耗,而第一个核心可以共享双倍于单核L2缓存
容量的空间来存放数据,要知道高速L2缓存的容量越大,可以使得总体效率也有响应提升。
·智能内存访问(Intel Smart Memory Access)
智能内存访问是另一个能够提高系统性能的特性,通过缩短内存延迟来优化内存数据访问。智能内存
访问能够预测系统的需要,从而提前载入或预取数据,反映到用户的直接使用体验上,就是大幅提高了执
行程序的效率。
以前我们要从内存中读取数据,就需要等待处理器完成前面的所以指令后才可以进行,这样的效率显
然是低下的。而Core架构中可以智能地预测和装载下一条指令所需要的数据,从而优化内存子系统对可
用数据带宽的使用,并隐藏内存访问的延迟。该目标是为了确保能够尽快地使用数据,并使该数据可能地
用于需要的地方,以将延迟最小化,最终提高效率和速度。
智能内存访问包含一项重要的被称作内存消歧(Memory DisaMBIguATIon)的新能力,该能力提高了
乱序处理的效率,因为它可以为执行内核提供内建的智能,以帮助其在执行完所有预先存储的指令前,预
测性地载入指令即将需要执行的数据。除内存消歧外,英特尔智能内存访问还包含增强的预取器。预取器
负责“预取”内存内容,并将其放入高速缓存中,以备读取。增加从高速缓存而非内存的装载量将缩短内存
延迟并提高性能。
总之,改进的预取器和内存消歧通过最大化可用系统总线带宽和隐藏内存子系统延迟,提高了执行吞
吐率。
·高级数字媒体增强技术(Intel Advanced Digital Media Boost)
性能=频率×每个时钟周期的指令数,英特尔高级数字媒体增强是为了提高每个时钟周期的指令数而诞
生。它是一项可以显著提高执行SIMD流指令扩展(SSE)指令性能的特性。128位SIMD整数算法和128
位SIMD双精度浮点操作减少了执行特定程序任务所需的全部指令数,将能够促使整体性能的增高。
Core微架构的上一代Yonah具有一个比较明显的缺点,只具有64bit的SIMD运算架构,在涉及到
128位SIMD运算的时候,需要两个时钟周期才能完成,效率非常低下,Yonah也因此难以实现64bit运
算,而Core微架构经过改良之后,可以单个周期就能完成同样的操作,效率提高达一倍。Intel配合这个
改进,并结合新的SSE3指令集,并称为Intel Advanced Digital Media Boost。
·智能功率能力(Intel Intelligent Power Capability)
NetBurst架构、Prescott核心处理器的耗电/功耗表现向来被竞争对手和用户诟病,因此新一代Core
架构在功耗上进行改进也就十分重要,并被称为Intel Intelligent Power Capability,包括采用了先进的65nm
Strained Silicon应变硅技术、Low-K介质等技术,还对各个运算部件都单独加入了电源控制功能,仅在需
要的时候才开启相应工作电路。先进的能源管理技术让Core架构的处理器的功耗表现很出色,这也是
Conroe处理器迅速被用户接受的一个重要因素。
◆ Intel Core2处理器技术一览 EIST、ClE、TM2、VT、XD
EIST技术
EIST全称为Enhanced Intel SpeedStep Technology,是Intel专门为移动平台和服务器平台处理器开
发的一种节电技术,它能够根据不同的系统工作量自动调节处理器的电压和频率,以减少耗电量和发热量。
到后来,从Pentium 4 6xx系列开始Intel把这项技术也移植到桌面处理器上。
ClE技术
ClE全称为C1E enhanced halt stat,它首次出现是在Pentium4 5xxJ系列处理器上,取代了以前的
Pentium 4处理器和其它大部分x86处理器中的所常用的C1 halt state。C1 halt state由操作系统idel进
行发出的HLT命令触发,然后处理器就会进入到低功耗的挂起状态(halt state)。最新的C1E halt state
也是由HLT命令触发的,它是通过调节倍频来逐级的降低处理器的主频,同时还可以降低电压。?
C1E与EIST的不同
EIST的触发机制同C1E halt state是不同的,它的运作需要BIOS和操作系统的支持(Windows XP
SP2/Windows Server 2003 SP1/Linux 2.6 kernel 或更新的版本 ),由操作系统通过ACPI进行调节。简
而言之,EIST能更有智慧地来管理处理器资源,可以根据必需的处理器负载程度与系统速度来自动调整处
理器的电压与核心频率,而且调节的级别更加的细致,因此相比C1E halt可以更加精确的调节处理器的状
态。
Thermal Monitor2(TM2)
TM2全称Thermal Monitor2,是Intel在LGA775封装的Prescott核心处理器中增加的新的过热保护
机制。类似于Pentium4处理器中的温度回馈装置TM1(Thermal Monitor1),当处理器过热时,Pentium4
处理器的主频会降低一半,此时功耗也会降低一半,从而降低处理器温度达到保护处理器安全的目的。与
TM1相比,TM2可以提供更智能,更有效的处理器热量功耗的管理方式,在保证处理器基本性能的前提下
尽可能在满负荷情况下降低处理器的功耗和温度。
TM2的主要工作方式仍然是通过TCC进行处理器主频的控制,不过它被称为“Enhanced TCC(增强
型TCC)”,通过调节处理器的倍频和输入电压来降低处理器的功耗。
TM2为处理器的工作状态预设了两个点:第一点的工作状态是正常的主频和核心电压;第二点是低主
频和低电压点。一旦TM2侦测到处理器的温度上升到预设的警戒温度时,E-TCC电路被激活,调整处理
器的第一点主频和电压,朝着第二点的预设值转换。这一转换的过程非常快――仅5微妙。在转换的这段
时间之内,处理器不能响应系统总线的访问请求的。
处理器的主频降到预设的低值之后,便会向主板上的电压控制模块发出新的电压识别信号(VID
Code)。因此,要实现TM2,主板的电压控制模块必须支持处理器的多电压转换过程,具备较低的电压输
出能力。在处理器电压转换的过程中,可以接受系统总线对其的访问,执行指令。
处理器温度下降到正常值时,处理器的工作主频和电压便会朝正常的值上升。首先上升的是电压,这
样可以保证处理器恢复到正常频率工作后的稳定性(因为低压高频一般会导致处理器工作不稳,就像加压
超频的原理)。
来自: /weidongzhen/blog/item/
一款支持TM2的处理器在TCC激活的情况下发生的变化。当温度触及设计上限时,首先是PROCHOT#
信号变为低电平,接着主频下降至低点预设值。电压在保持一段时间后会以0.0025v为步进下降,到达预
设低点。温度下降一段时间后PROCHOT#变为高电平,首先是电压重新上升到正常值,接着主频会恢复
到正常水平。 VT是Virtualization Technology(虚拟化技术)的缩写,它能够可以让一个CPU工作起来
就像多个CPU并行运行,从而使得在一部内同时运行多个操作系统成为可能,它的出现能够使用户在他们
的个人上建立多套虚拟的运行环境以便能够在同一台个人上运行不同的操作系统。VT还能够允许IT技术
管理员下载系统补丁或者升级个人的一部分的同时,用户能够在另一个虚拟环境中运行他们的应用程序。
根据Intel的资料,Intel虚拟技术的实现需要同时具有处理器、、BIOS、VMM的支持,这些特定的平台必
须全部到位,同时性能方面要视不同的硬件和平台而定。 Intel Execute Disable Bit(简称“XD”)中文译作
“英特尔防病毒攻击内存保护机制”,开启该功能后,可以防止病毒、蠕虫、木马等程序利用溢出、无限扩
大等手法去破坏系统内存,抑制病毒的复制和传播,避免速度变慢、死机等故障的出现。其工作原理是:
处理器在内存中划分出几块区域,部分区域可执行应用程序代码,而另一些区域则不允许。要实现处理器
的“Execute Disable Bit”功能,还需要操作系统的配合才行。现在Windows XP SP2、Windows Server 2003
SP1、Linux 9.2及Red Hat Enterprise Linux 3 Update 3等均支持这一功能。 在去年7月27日,英
特尔正式发布Core微架构的桌面平台处理器Conroe系列,发布之日一共推出有五款处理器,即Core 2
Extreme X6800、Core 2 Duo E6700、Core 2 Duo E6600、Core 2 Duo E6400和Core 2 Duo E6300。然
而即便是最低档的E6300,其价格也要183美元(当时约1450元人民币)。显然光有好的性能还不足以
抢占更多市场份额,价格是另一个主要原因。 最初的Conroe市场定位较为尴尬,其狭窄的市场空间
造成了产品叫好不叫座境况。英特尔要想彻底击垮AMD,单单靠中高端Conroe产品是不可能的,最完美
的做法就是尽快将Conroe系列细分。基于此原因,英特尔随后推出了很多款Core架构的桌面平台处理器,
涵盖高中低端市场。 英特尔的桌面处理器产品线大致上可以按照核心数量、前端总线频率、二级缓存、
核心频率四大主要特征进行区分。在加入新一批酷睿2处理器之后,整个桌面处理器产品线中,处于最顶
端的产品当然是拥有四个物理核心,1333MHz FSB,8MB L2缓存和3GHz核心频率的Core 2 Extreme
QX6850,它也是目前整个桌面处理器市场最先进和最高端的产品。 主流市场Core 2 Duo(C2D)系
列,包括E6000系列(E6850、E6750、、、E6550、E6540、、、和)、E4000系列(E4500、E4400、,
第四季度将会推出E4600),红色字体的型号表示将被淘汰,下同。 入门级市场Pentium E2000(PDC,
Pentium Dual-Core)系列,虽然打着Pentium的旗号,但采用的Core微架构,现有E2140和E2160两
款,第四季度将会发布E2180。 高端市场Core 2 Quad(C2Q)系列,这是四核心的处理器,现有
Q6700和Q6600两款产品。 至尊版的Core 2 Extreme(C2E)系列,现有QX6850、QX6800、和四
款产品。 另外在低端市场还有采用Conroe-L核心的Celeron 400系列,有440、430和420三款产品。
E6000系列是英特尔主流市场的王牌,目前这个系列一共有十个型号的处理器有售。FSB从最初的
1066MHz全面提升到1333MHz,原来1066MHz的六款产品将陆续会停产。 在今年4月,英特尔对
其全系列产品线进行了大幅的价格调整,并在调价的前一天发布了Core 2 Duo E6300/E6400的升级版
Core 2 Duo E6320/E6420。其采用4MB L2 Cahce的增强设计,相比起原有的优势在于缓存翻倍,但价格
则与E6300/E6400完全保持一致。早期的E6300/E6400均是通过屏蔽的方式把B2 Stepping的L2 Cahce
实现为2MB,而E6320/E6420则是把被屏蔽的2MB缓存释放,使得产品的缓存规格与配置与较为高端的
E6600/6700保持一致,有利于产品线的进一步延伸。 同样是在英特尔调价的日子,7月22日,英特
尔推出了六款的Core 2处理器,其中有四款Core 2 Duo处理器,即Core 2 Duo
E6850/E6750/E6550/E6540。E6x50系列+“3”系列芯片组,让英特尔平台正式进入1333MHz FSB时代,
能与未来DDR3内存更好的配合,提升系统整体带宽。1333MHz FSB的Core 2采用了最新的G0步进,
据了解,这一版本相比之前的B2并没有提供什么技术上的革新,不过很多玩家发现,新的G0步进在超频
方面的表现很不错,并且功耗相比之前又有进一步的降低。E6540除不支持TXT和vPro技术外与E6550
相同。 英特尔的这次处理器命名方式很有意思,启用E6x50的命名模式,这一方面为了区分同老处理
器之间的差别,同时也可以让用户支持处理器之间的实际性能差异,譬如E6750的工作频率同E6700一
样,均为2.66GHz,但由于E6750采用1333MHz的总线,因此在数据吞吐量上是占有优势的,因此可以
理解为E6750的效率更高;而E6550的实际工作频率为2.33GHz,而E6600的工作频率为2.4GHz,因
此用户也可以由命名知道,E6550的效率要比E6600低一些 在E6x50处理器中,加入了新的Intel Trust
Execution Technology(简称Intel TXT)技术,配合新一代的Microsoft Vista操作系统,能够提供更强大
的数据安全与保护解决方案。由于TXT是处理器、芯片组及I/O系统所提供的硬件功能,因此这一功能甚
至可以凌驾于所有软件甚至是操作系统之上。 在Pentium D以及Pentium 4处理器慢慢淡出市场
后,英特尔用什么来巩固中低档市场呢?此前基于Core架构最低端的处理器就是Core 2 Duo E6300,但
是其超过160美元的还是会让很多人望而生畏。英特尔自然知道这个问题,早就想好了应对的办法,在今
年1月,英特尔推出了代号为Allendale的E4000系列的首款产品Core 2 Duo E4300,矛头直指1000元
左右的处理器市场。 为了进一步拉开产品之间的距离,英特尔让这种新一代的处理器将提供800MHz
的系统总线,而不是原本Core 2 Duo E6xxx那样的1066MHz的总线上,E4300始频率为1.8GHz,稍低
于E6300,不过9倍频设计更受超频爱好者欢迎,二级缓存为2MB,E4000系列处理器在功能方面还删
减了虚拟技术(Intel VT)和商业用博锐技术(Intel VPro),虽然如此,对于64位操作系统支持、ED Bit防病
毒技术、EIST节能技术,还有以家庭娱乐为主题的欢悦技术(Viiv)都一一保留,因此功能方面的差异没有
太大影响。 E4300是首款采用原生2M二级缓存设计的Intel Core 2 Duo处理器,后期的E6300和
E6400也是采用这种设计,此举将降低CPU的制作成本。 在4月,英特尔又推出了2.0GHz的E4400,
并计划在Q3和Q4分别推出2.2GHz和2.4GHz的E4500、E4600。 2007年6月3日英特尔发
布双核心处理器Pentium Dual-Core E2000系列以及单核心的Celeron 400系列,旧有NetBurst微架构向
Core微架构的过渡已进入尾声。 英特尔显然没有因为Core 2 Duo系列的成功而轻易放弃“Pentium”
这块金字招牌。不过其与先前的双核心产品Pentium D却有着天壤之别。“Pentium Dual-Core”形象地向我
们传达出它是一款基于Core微架构设计的双核心处理器,而“E2000”则又很容易地使我们将其同“Core 2
Duo”中的“E6000”以及“E4000”联系起来。 就现阶段而言,价格偏高也许是Core 2 Duo系列的缺
点,虽然千元以下有PDC E2000系列支撑,但在500元以下市场,Core微架构处理器还是一片空白。英
特尔自然不甘心放过这一巨大市场,Core微架构处理器将无处不在。于是Conroe-L以“单核心Core 2”为
卖点切入低端级处理器市场,高效能功耗比和低价格无疑将成为英特尔的杀手锏。 2007年6月3日,
基于Core微架构的Conroe-L单核心微处理器“Celeron 400”系列正式发布,截止至2007年第三季度,存
在了长达7年之久的单核心Pentium 4系列将正式退出主流零售市场。 Celeron 420、Celeron 430和
Celeron 440成为率先问世的Conroe-L核心处理器。 Conroe-L将采用与Conroe一样的LGA775,单
核心设计,前端总线800MHz,二级缓存512KBB,支持EDB(XD)防毒技术、EM64T技术等,但不支持
虚拟化(VT)技术和EIST(增强SpeedStep)省电技术。 Conroe-L和Conroe最大不同之处在于采用的是
单核心的架构,而这也意味着与Conroe相比,Conroe-L其中一个核心将被屏蔽。由于Core架构采用了
共享缓存的技术,当被关闭了其中一个核心,相应的缓存也会被关闭,而性能损失随之增大。但由于它有
了Conroe核心灵魂附身,所以它的性能依然不弱。 相比Cedar Mill核心Celeron D 3xx的533MHz
FSB,Celeron 400系列的800MHz FSB能让性能有较大提升,而且Celeron 400系列的TDP耗能仅为
35w,较之Cedar Mill核心Celeron D 3xx的65w降低了46%。 Core 2 Extreme(C2E)系列主要
是针对发烧级和高端应用推出的。在第一批的Conroe中,就有Core 2 Extreme X6800,也是当时桌面处
理器中性能之王。和Core 2 Duo相比,X6800仅仅是频率上的提升,最好的消息应该是Extreme系列没
有锁倍频,可以往上调(其它系列只能往下调倍频),更利于超频。当然X6800的TDP为75W,比Core
2 Duo的65W要高。 在2006年11月,英特尔发布了四核心的Core2 Extreme QX6700,处理器内
部将两颗DIE封装在一起,每两个核心共享4M L2缓存,通过一条的FSB与内存沟通。两个酷睿2核心
整合在一起就很快地设计出新的四核产品。对于来说,这样的好处是可以让四核很快地面世,而它的并行
处理能力提高幅度也是令人满意的。但问题是如果核心A需要调用核心B L2缓存内的信息则需要通过FSB
的中转,无形当中影响了处理器的速度。 在发布四核心的Core 2 Extreme QX6700后不久,英特
尔推出价格更低的Core 2 Quad Q6600四核产品,也是第一款上市的Core 2 Quad系列处理器,Core 2
Quad系列将和双核心的Core 2 Duo系列一起构成目前Intel在桌面市场的主打产品。 Core 2 Quad
系列在架构上和Core 2 Extreme四核心版本相同,1个封装当中包含了2个Core 2 Duo核心。Q6600的
工作频率从QX6700的2.66GHz下降到2.4GHz,同时TDP功耗也从130W下降到105W,FSB还是跑
1066 MHz,二级缓存8MB(每2核心共享4MB)。后期改良了工艺的G0制程Core 2 Quad Q6600处理
器TDP降低到了95W。 在7月22日,英特尔发布了新的Core 2 Quad Q6700处理器,频率为2.66MHz,
其它规格不变。目前Q6700的采购价为$530,Q6600的采购价为$266(和C2D E6850一样),很好地
填补了C2D和C2E间的空白。 根据Intel的计划,新一代的45nm Penryn处理器将在2007年第三季
度面世,而在此之前,Intel将通过1333MHz FSB的Core 2 Duo 6X50系列处理器来保持效能优势和巩固
市场份额。 为了与上一代1066MHz FSB的产品进行区分,1333MHz FSB版本处理器代号中第三个
数字由“0”改为“5”。首批的1333MHz FSB的6X50处理器包括四核的QX6850(主频3.0GHz),双核的
E6850、E6750、E6550(主频分别为3.00GHz、2.66GHz和2.33GHz)四款,除了拥有“传统”的虚拟机
技术(VT)、增强型节能技术(EIST)及EDB防病毒技术等功能外,它还首次加入商业运用的Intel Trust
Execution Technology(简称Intel TXT),提供进一步的数据保全方案。Intel在稍后还会推出E6540,它可
以看作是E6550不支持TXT和vPro技术的简化版。 其实6X50并不是Intel首款1333MHz FSB的产
品,早在Conroe发布后不久的2006年年底Intel就在Xeon 5000系列上率先引入了1333MHz FSB规格。
而最新的6X50系列+“3”系主板芯片组,则让英特尔桌面平台正式进入1333MHz FSB时代。1333MHz
规格的带宽高达10.7GB/s,比1066MHz FSB的8.5GB/s提升了26%,能与未来DDR3内存更好地配合,
籍此Intel可以继续保持在桌面平台效能和技术的双重领先。 新一代的6X50处理器在前端总线提升到
1333MHz,新的G0步进也更加省电,同时新品发布后价格更低,它相比旧的6X00系列处理器更加具有
吸引力,新装机的用户显然会更加偏向于购买6X50。不过对于老用户来说,目前手中的6X00系列是否有
必要升级到6X50呢?下面我们来看看1333MHz FSB vs 1066MHz FSB的结果,选择的处理器为同主频
的E6750和E6700。 可以看出,1333MHz FSB的E6750相比1066 MHz FSB的E6700效能有提升,
不过提升的幅度很有限,最多也不过5%,平均来说效能的提升也大概只有2%左右。 即使是对于四核
心处理器来说,1333MHz FSB带来的性能提升依旧较为有限,而且我们还要考虑到QX6850在频率要比
QX6800高出了70MHz,考虑到这一点,1333MHz FSB带来的性能提升更加不值一提了。 结论:购
买新电脑,首选1333MHz FSB的型号,但目前正在实用1066MHz FSB产品的用户则没有太大的必要急
于升级。 英特尔在4月推出的酷睿2新品Core 2 Duo E6420、E6320,是E6300和E6400的升
级版,二级缓存从2MB扩展到了4MB。 从技术角度来说E6320和E6420并没有什么全新的特性。
它们仍然采用Conroe核心,拥有4MB二级缓存,主频分别为1.86GHz和2.13GHz,拥有1066MHz FSB。
除了二级缓存,它们与E6300和E6400并无差别,既然它们的定价一致,那么E6300和E6400将逐渐被
淘汰出市场。 二级缓存的增加,显然会带来效能上的提升,不过具体的效能提升究竟有多大呢? 从
我们的测试结果来看,二级缓存对系统性能的提升是显而易见的。总的来说,E6320相对E6300效能提升
的幅度不到3%,而一些应用对二级缓存的大小不是太敏感,比如图形处理,同时我们注意到Vista内建
“Windows Experience Index Base Score” 公用程序测试中两者的得分是一样的,也就是说对于Vista的运
行来说,两者并不会有多大的区别。 虽然效能提升的幅度并不是非常高,不过4M二级缓存的E6X20
仍然是值得赞叹的,它们在性能提升的同时,价格还和旧型号的产品保持一致,对于这样的免费升级,消
费者没有理由去拒绝。 Intel给E2000系列处理器冠上了“Pentium”的前缀,而不肯将它们归类到
Conroe“扣肉”家族中,不过毕竟它们还是基于Core微架构的。对于不少消费者来说,正统的“扣肉”还是太
贵了,而Pentium E2000系列的出现无疑是一大福音。 Pentium E2000系列与Core 2 Duo E4000系
列同为800MHz FSB,频率上也大体相同,只是二级缓存由2MB进一步缩减到1MB。不少用户都对一再“阉
割”的Pentium E2000系列极为不屑,那么,这1M的二级缓存究竟会损失多少性能呢? 从上面的测
试结果来看,Pentiume E2160和Core 2 Duo E4300的性能差距大概在5%左右,在视频渲染、图片处理
等应用中两者的性能差距并不大。考虑到两者间200多元的差价,对于对价格敏感的消费者来说,Pentium
E2000系列无疑是高性价比的选择Core 2 Duo E4000系列处理器作为入门级双核处理器,只保留了2MB
的L2缓存,FSB也只有800MHz,在规格上显然不如E6000系列吸引人,不过凭借着更具吸引力的价格
和不错的超频能力,E4300还是成为最受欢迎的Core 2 Duo处理器。 在E4300之后,Intel又推出了
E4400和E4500,它的主频提升到了2.0GHz和2.2GHz,但L2缓存仍是2MB,FSB也没有变,仍为
800MHz。E4400/E4500和E6X20同时推出,不过大家的眼光都被E6x20的4MB的L2缓存吸引了,而
对前者关注甚少。 其实在Intel的计划中,E6300和E4300都会在07年第三季度淡出市场,取代它们
的正是E6320和E4400/E4500。由于Intel将E4500定位在Core 2 Duo桌面处理器的底端,它千颗批发
单价要比E6320便宜30多美元,而在国内零售市场上,两者的盒装版本差价为300多元人民币(10月
27日,市场E4500盒装报价999元,E6320盒装报价1310元)。E4300和E6300同为2MB的L2缓存,
但是主频上低了60MHz,FSB也低了266MHz,因此在性能上大概落后5%,而E4500在主频上则要比
E6320高340MHz,FSB低了266MHz,L2缓存少了2MB。从Intel的定位来看,800MHz FSB和2MB L2
缓存将使E4500在性能落后于E6320,那么事实上是否如此呢? 事实上,测试结果会令Intel感到比
较尴尬,E6320在大部分的测试中相对E4500处于劣势。很显然,1066MHz FSB和4M二级缓存并不能
弥补在主频上340MHz的差距,无论在视频渲染、图片处理还是高清视频播放乃至整体性能上,E6320全
面落后。 不过,对于消费者来说,这并不是什么坏事。由于E4500比E6320便宜大约300元,我们
建议用户选择前者,即使它的FSB不是那么高,二级缓存也不是那么大.
2024年6月1日发(作者:赫从霜)
INTEL CPU全系列架构发展史及深度测试!
壮士断腕,Conroe临危受命
在很久很久以前的286时代,英特尔还只是一个小公司,它负责给IBM提供IBM PC中的微处理器。
那会儿,IBM PC销量很大,兼容机还没出现。为了能保证微处理器供货充足,上帝般的IBM强迫英特尔
将微处理器技术无偿授权给另一家公司。看IBM脸色吃饭的英特尔虽然老大不愿意但也没办法,最后选择
了AMD作为微处理器技术无偿提供对象(一不小心养虎成患,现在英特尔估计后悔到死)。为了制约AMD,
英特尔又将微处理器技术无偿授权给了Cyrix。
1982年2月1日,英特尔推出80286微处理器
在当时来说,英特尔除了产能占优外,在技术上是没有任何优势的,三家公司的微处理器架构基本一
致。但是这时候,IBM公司内部倒产生了巨大的分歧:许多人反对快速转换到286计算机的生产和销售,
因为这会对IBM的小型机与之前的PC XT销售造成影响,他们希望过渡的步伐能慢一些。
但英特尔并不能等,80286处理器已经批量生产了,不可能堆在仓库里等IBM慢慢消化。此时康柏公
司就钻了空子——快速推出286的IBM PC兼容机,并一举打败IBM成为PC市场的新霸主。随着IBM PC
兼容机的大量涌现,英特尔处理器也卖得越来越多,名气越来越大,实力与日俱增,也就不用再唯IBM马
首是瞻了。
1993年3月22日,英特尔发布新一代P5架构586微处理器,这款历史性的产品被英特尔命名为
Pentium(奔腾),并不再对AMD和Cyrix授权。
1993.3.22 英特尔推出里程碑式的Pentium处理器
而AMD也非昔日可比了,它具有很强的研发能力,并很快发布了K6处理器迎战,更逐渐衍生出K6-2
和K6-3处理器。K6-2处理器凭借架构上的优势令英特尔感到了巨大的压力。为此1995年英特尔又推出
新的P6架构取代奔腾/奔腾MMX的P5架构,以求在性能上保持领先地位。
1995.11.1 英特尔推出采用P6架构的Pentium Pro
最早采用P6架构的微处理器是高能奔腾(Pentium Pro)。P6架构与奔腾的P5架构最大的不同在于,
过去集成在主板上的二级缓存被整合到处理器内,从而大大地加快了数据读取时间和提高命中率。另外,
P6架构是一个纯32位的微处理器架构。
1997.4.7 英特尔推出Pentium II
为了将P6架构平价化,以对抗AMD等竞争对手,英特尔采用了将二级缓存从CPU核心移出,改用
外置于集成CPU核心的PCB板上的做法, 这“萌生”了1997年推出的奔腾II处理器。奔腾II处理器的二
级缓存外置于CPU核心以外,只能以处理器工作主频一半的速度运行,而不像奔腾Pro的二级缓存那样
以全速运行。随着0.25微米工艺的成熟,英特尔才尝试重新将二级缓存集成在核心内。
为了进一步巩固自己的领导地位,英特尔1999年1月推出了PentiumIII。
1999.1 英特尔推出PentiumIII
在PentiumIII时代之前,AMD和Cyrix一直是英特尔的追随者,但是AMD Athlon推出之后,历史发
生了微妙的变化:在AMD推出Athlon 650MHz的时候,英特尔处理器的最高主频才550MHz,这也是英
特尔第一次被竞争对手超过!为了保住自己颜面,英特尔匆匆推出了采用0.18微米工艺,代号"Coppermine"
的奔腾III处理器,主频有500MHz至700MHz几个型号。
这时候英特尔与AMD主频之争的激烈程度前所未有,我们熟悉的频率“攀比”战开始了。
最先达到1GHz主频的是AMD的Athlon处理器,同频的奔腾III处理器在落后不到一个月面世,但这
足以让AMD自豪了。由于1GHz的Athlon性能不敌1GHz奔腾III,AMD决定开发核心整合二级缓存的
Athlon XP。
随后英特尔霸王硬上弓,抢先推出1.13GHz的奔腾III,在性能上领先倒是领先了,但当时的0.18微
米工艺生产1.13GHz的奔腾III实在是勉为其难。后果就是全面回收几乎不能正常运行的奔腾III 1.13GHz
处理器。而此时,AMD推出了1.1GHz Athlon XP处理器。
◆ 饱受责难的NetBurst架构奔腾4
2000.11.20 英特尔推出Pentium4
英特尔在AMD强大的压力下,开始鼓吹“唯主频论”。在奔腾III及以前的微处理器时代,是一个处理
器性能与主频紧密结合的时代。那个时候无论是英特尔还是AMD,他们的处理器产品在主频提升的同时,
同样也会带来相应的性能提升。到了奔腾4,英特尔的“唯主频论”颠覆了“性能等于主频”的传统观念。
2000年11月20日,英特尔正式发布了NetBurst架构的奔腾4。这不仅仅是一款新产品的发布,它
还标志着一个处理器新时代的开始。奔腾4 1.4 GHz/1.5 GHz的出现,吸引了全世界的眼光。然而有专业
媒体质疑:为何奔腾4的主频这么高,但是实际测试项目很多都不如P6架构的1GHz奔腾III呢?英特尔
回答:奔腾4是一种全新的架构,它的性能不能再用传统的观点去评判。
奔腾4能够在同样的0.18微米工艺下轻松达到2GHz,而奔腾III 去到1.13GHz就已经到了极限,这
是因为奔腾4的运算流水管线多达20级甚至31级,而奔腾III只有11级。运算流水管线越长,就越容易
在同样制造工艺下达到更高的工作主频。Athlon在同样制造工艺下可以达到奔腾III难以达到的高主频,就
是因为Athlon的运算流水管线比奔腾III略长。但是运算流水管线过长也会带来负面影响,管线越长,单
位主频下的处理器执行效率就越低,性能的发挥就会受到影响。
第二代Northwood核心的奔腾4采用了0.13微米工艺制造,较好地解决了发热与功耗的问题,迅速
成为市场主流。此后随着800MHz FSB、超线程等新技术的引入,Pentium 4 NetBurst架构的威力的以充
分发挥,所以从性能/功耗上来讲,这个时候的奔腾4达到了巅峰。
随着主频的不断攀升,NetBurst架构的弊端越来越明显。第三代Prescott奔腾4流水线达到31级,
晶体管达到了125百万个(Northwood只有55百万个),以至于它每个时钟周期比Northwood多产生大
约60%的热量,同时功率消耗也增加大约10%!3.2GHz的Prescott TDP达到了触目惊心的103W!人
们开始戏称Pentium 4为烤炉,高主频带来的高功耗使得英特尔的忠实支持者要为奔腾的芯付出更多的电
费,同时更要忍受高性能处理器风扇所带来的巨大噪音……
64岁的英特尔总裁贝瑞特面对着6500人惊天一跪:“请原谅我们”(2004.10)
奔腾4最终止步于3.8GHz,原计划推出的4GHz奔腾4处理器也被胎死腹中。英特尔意识到处理器
研发道路上走入了“唯主频论”的误区,2004年10月,英特尔总裁贝瑞特惊天一跪,面对着6500人说道:
“请原谅我们”,真心地对公司的失误表示忏悔。
英特尔终于承认自己错了。不要忘记当初英特尔发布奔腾4时吹嘘说奔腾4是为10GHz的运算速度
设计的,这是到目前为止英特尔历史上最重要的或许也是最广为人知的工程失败事件。
◆ 临危受命的Core微架构
实际上,英特尔除了拥有NetBurst研发小组外,还有一支位于以色列海法的研发团队。该以色列团队
早在2003年就因为设计出兼具高性能与低功耗的Banias移动处理器而闻名天下,Core微架构是他们最
新的杰作,由于NetBurst架构的失败,Core微架构一下就成了英特尔的救命符。
2006年3月英特尔在春季IDF大会宣布下一代处理器将采用的Core微架构。英特尔指出未来处理器
的技术发展重点将是“每瓦特性能”(Performance per Watt)。而这届IDF的主题更加明确:功耗最优化平
台(Power-Optimized Platforms)。根据英特尔的说法,采用Core微架构的处理器将在性能方面得到极
大的飞跃,肯定将超过竞争对手AMD的产品。
更好的消息Core在功耗方面将比前任大幅下降。
Core微架构将一统江湖
Core微架构被英特尔推上前台,被赋予了取代NetBurst微架构、一统桌面、移动与服务器平台的历
史使命。针对笔记本、桌面级用户和服务器,Core均有不同的产品。
Conroe是基于Core微架构的桌面平台级产品(我们常说的“扣肉”),由于“Core”和“Conroe”两个单词
在结构上颇为类似,因此有不少消费者往往便认为“Core”和“Conroe”指得是同样一种产品。实际上,我们
通常把“Core”直接音译为“酷睿”,它是Intel新一代处理器产品统一采用的微架构,而Conroe(扣肉)只是对
基于Core(酷睿)微架构的桌面平台级产品。
除桌面的Conroe处理器之外,Core微架构还包括代号为“Merom”的移动平台处理器和代号为
“Woodcrest”的服务器平台处理器。
由于上一代采用Yonah微架构的处理器产品被命名为Intel Core Duo,因此为了便于与前代双核处理
器区分,Conroe以及Merom都将采用相同的命名方式——Core 2 Duo。另外,Intel最高性能的桌面服务
器芯片Woodcrest将命名为Core 2 Extreme,以区分于普通桌面/笔记本处理器产品。
Conroe处理器沿用了L1 Cache设计,L1数据Cache和L1指令Cache分别为32KB,两个核心共
享4MB或2MB的L2 Cache,它结合了Pentium M高效率和NetBurst动态执行性能优越两方面的优点。
Conroe处理器的数据流水线长度从Prescott的31级大幅度缩短至目前的14级。其算术逻辑运算单元ALU
数量由上代NetBurst微构架的2组提升至3组,同时在Cache构架上也经过了大幅度的改良,整体运算
性能大大增加。
Core微架构与Yonah微架构
目前比较普遍的看法是,Core微架构是Pentium Pro架构,或者说是P6微架构的延续。Core微架构
中只有预取机制是从NetBurst微架构获得的灵感,所有其它的设计都是从Yonah微架构(Core Duo处理
器)演变而来,而Yonah微架构是从Banias处理器和Dothan处理器演变而来的。所有Banias、Dothan、
Yonah和采用Core微架构的处理器都继承了NetBurst处理器的前端总线设计,但除此之外,它们毫无疑
问都是曾经获得巨大成功的P6微架构的后代。
英特尔P6微架构的总工程师之一Robert Colwell在其回忆录中表示他之所以离开英特尔,主要就是
因为他并不认同英特尔在NetBurst微架构中所选择的设计路线,因为他相信“The future is mobile”,如何
在维持省电与最长电池续航能力的前提下,达到足够的运算效能,才是处理器技术发展的未来方向。
NetBurst微架构的失败,与P6微架构的复兴,恰恰证明了英特尔之前策略的失败和他的远见。
不过这并不意味着只是把Yonah处理器的一些功能单元和解码器重新包装一下然后换了个名字就推出
来。英特尔Core开发人员称,Woodcrest、Conroe和Merom处理器都是基于Yonah处理器的,但是几
乎80%的架构和电路设计需要重新进行。
2006.7.27 英特尔Conroe全球同步上海发布会
2006年7月27日,英特尔全球同步发布基于其Core微架构的Conroe桌面平台处理器,承接6月
发布的服务器处理器Woodcrest,以及8月登场的笔记本处理器Merom,英特尔处理器全面从上一代
NetBurst微架构转向新的Core微架构。
◆ 解读Core微架构
英特尔对Core微架构的要求非常高,需要有很好的跨平台性,又要兼顾到功耗,最重要的是能提供
更高的性能。其中特别引人注意的就是英特尔在Core设计中导入的全新的每瓦特效率的设计概念,因为
这个概念的出现将真正影响未来英特尔处理器架构的发展,而这也对产业发展产生了重大的影响。
Core微架构的目标就是构建一个高效的双核心架构,因此采取共享式二级缓存设计,2个核心共享二
级缓存。内核采用高效的14级有效流水线设计,每个核心内建4组指令解码单元,支持微指令融合与宏
指令融合技术,每个时钟周期最多可以解码5条X86指令,并拥有改进的分支预测功能。每个核心内建5
个执行单元,执行资源庞大。采用新的内存相关性预测技术。支持增强的电源管理功能。支持硬件虚拟化
技术和硬件防病毒功能。内建数字温度传感器。还可提供功率报告和温度报告等,配合系统实现动态的功
耗控制和散热控制。
重要的一点是,Core微架构加入了对EM64T指令集的支持,随着Windows Vista的到来以及Intel、
AMD全面更换到64bit处理器,64bit计算的普及只是时间问题。
·14级指令执行流水线设计
流水线深度一直是影响处理器效率的重要因素,流水线深度的增加可以让处理器时钟频率进一步提高,
但带来的反面影响就是处理器的单周期执行效率降低、发热量上升,同时容易产生分支预测等问题,
Prescott核心的P4达到了31级流水线长度,要比当年的Pentium III和Athlon处理器高出许多,也让
Prescott最终走上失败之路。
在Core架构中,其指令流水线深度达到14级,这个深度是要高于Pentium M的12级,但是却比AMD
的K8处理器架构的17级要低上3级。目前的Core架构是兼顾执行效率和降低功耗的折中设计。
流水线的“条数”与“级数”是完全不同的概念。能够完整执行各种指令的一系列功能单元组成“一条”流水
线。而关于流水线级数,可以这样简单理解:一条流水线所包含的功能单元一般可以被划分为多个部分,
它可以被划分成几个部分,就称这条流水线是“几级”的。
Core微架构的14级有效流水线与Prescott核心的31级有效流水线的对比,也只有参考意义。那些
仅仅根据这个数字的对比就断言Core微架构只能达到很低的频率的说法是不具有足够的说服力的。
Conroe XE 3.33GHz处理器的存在已经让很多相信这个说法的人大吃一惊。而实际上,已经有很多玩家在
风冷下将Conroe处理器超频达到4GHz以上的频率。
除此之外,Core微架构加入了五大重要创新,其中包括宽区动态执行(Intel Wide Dynamic Execution)、
高级智能高速缓存(Intel Adcanced Smart Cache)、智能内存访问(Intel Smart Memory Acess)及高级
数字媒体增强技术(Intel Adcanced Digital Media Boost)、智能功率能力(Intel Intelligent Power
Capability),这里我们就只是对这五大重要创新作个简单介绍:
·宽区动态执行(intel Wide Dynamic Execution)
宽区动态执行(Intel Wide Dynamic Execution)技术就是通过提升每个时钟周期完成的指令数,从而
显著改进执行能力。通俗的说就是,每个内核将变得更加“宽阔”,这样每个内核就可以同时处理更多的指
令。
毫无疑问,Core微架构是一个比NetBurst或Yonah微架构更宽的设计。Core微架构拥有4组解码
单元,每周期可以生成7条微指令;Yonah 微架构拥有3组,每周期可以生成6条微指令;而NetBurst
微架构由于解码方式不同,不容易比较解码单元的数目,但是NetBurst微架构每周期只能生成3条微指令。
Core微架构把解码单元增加到4组,这个变化可以说是Core微架构最大的特色之一。X86指令集的
指令长度、格式与定址模式都相当混乱,导致X86指令解码器的设计是非常困难的。增加解码单元,特别
是复杂解码单元,固然会大大增强处理器的解码能力,但是解码单元复杂的电路也必然会提高内核的复杂
度和处理器的功耗。权衡利弊,英特尔最终选择了增加1组简单解码单元的折衷方案。
此外,Core架构的每个核心都拥有3个算术逻辑单元(ALU),而之前的NetBurst仅有2个ALU,
P6架构的处理器仅为1个,这样的设计使得Core架构拥有比较高的处理能力。
酷睿微体系结构在提升每个时钟周期的指令数方面做了很多努力,例如新加入宏融合(Macro-Fusion)
技术,它可以让处理器在解码的同时,将同类的指令融合为单一的指令,这样可以减少处理的指令总数,
让处理器在更短的时间内处理更多的指令。酷睿架构也改良了ALU以支持宏融合技术。
·高级智能高速缓存(Intel Advanced Smart Cache)
以往的多核心处理器,其每个核心的L2缓存是各自独立的,这就造成了L2缓存不能够被充分利用,
并且两个核心之间的数据交换路线也更为冗长,影响了处理器工作效率。如果采用L2缓存共享设计,那么
只需要数据被载入到L2缓存中,数据可以被两个核心同时使用。
这样做的另一个好处是每个内核之间都共享着更大的L2缓存,其缓存可以被任何一个核心所独占,这
样理论上每个核心都有可能获得100%的L2缓存掌控权,特别是对于一些单核心优化的程序,由于不需要
使用到第二个核心,这种时候,第二个核心自动关闭降低功耗,而第一个核心可以共享双倍于单核L2缓存
容量的空间来存放数据,要知道高速L2缓存的容量越大,可以使得总体效率也有响应提升。
·智能内存访问(Intel Smart Memory Access)
智能内存访问是另一个能够提高系统性能的特性,通过缩短内存延迟来优化内存数据访问。智能内存
访问能够预测系统的需要,从而提前载入或预取数据,反映到用户的直接使用体验上,就是大幅提高了执
行程序的效率。
以前我们要从内存中读取数据,就需要等待处理器完成前面的所以指令后才可以进行,这样的效率显
然是低下的。而Core架构中可以智能地预测和装载下一条指令所需要的数据,从而优化内存子系统对可
用数据带宽的使用,并隐藏内存访问的延迟。该目标是为了确保能够尽快地使用数据,并使该数据可能地
用于需要的地方,以将延迟最小化,最终提高效率和速度。
智能内存访问包含一项重要的被称作内存消歧(Memory DisaMBIguATIon)的新能力,该能力提高了
乱序处理的效率,因为它可以为执行内核提供内建的智能,以帮助其在执行完所有预先存储的指令前,预
测性地载入指令即将需要执行的数据。除内存消歧外,英特尔智能内存访问还包含增强的预取器。预取器
负责“预取”内存内容,并将其放入高速缓存中,以备读取。增加从高速缓存而非内存的装载量将缩短内存
延迟并提高性能。
总之,改进的预取器和内存消歧通过最大化可用系统总线带宽和隐藏内存子系统延迟,提高了执行吞
吐率。
·高级数字媒体增强技术(Intel Advanced Digital Media Boost)
性能=频率×每个时钟周期的指令数,英特尔高级数字媒体增强是为了提高每个时钟周期的指令数而诞
生。它是一项可以显著提高执行SIMD流指令扩展(SSE)指令性能的特性。128位SIMD整数算法和128
位SIMD双精度浮点操作减少了执行特定程序任务所需的全部指令数,将能够促使整体性能的增高。
Core微架构的上一代Yonah具有一个比较明显的缺点,只具有64bit的SIMD运算架构,在涉及到
128位SIMD运算的时候,需要两个时钟周期才能完成,效率非常低下,Yonah也因此难以实现64bit运
算,而Core微架构经过改良之后,可以单个周期就能完成同样的操作,效率提高达一倍。Intel配合这个
改进,并结合新的SSE3指令集,并称为Intel Advanced Digital Media Boost。
·智能功率能力(Intel Intelligent Power Capability)
NetBurst架构、Prescott核心处理器的耗电/功耗表现向来被竞争对手和用户诟病,因此新一代Core
架构在功耗上进行改进也就十分重要,并被称为Intel Intelligent Power Capability,包括采用了先进的65nm
Strained Silicon应变硅技术、Low-K介质等技术,还对各个运算部件都单独加入了电源控制功能,仅在需
要的时候才开启相应工作电路。先进的能源管理技术让Core架构的处理器的功耗表现很出色,这也是
Conroe处理器迅速被用户接受的一个重要因素。
◆ Intel Core2处理器技术一览 EIST、ClE、TM2、VT、XD
EIST技术
EIST全称为Enhanced Intel SpeedStep Technology,是Intel专门为移动平台和服务器平台处理器开
发的一种节电技术,它能够根据不同的系统工作量自动调节处理器的电压和频率,以减少耗电量和发热量。
到后来,从Pentium 4 6xx系列开始Intel把这项技术也移植到桌面处理器上。
ClE技术
ClE全称为C1E enhanced halt stat,它首次出现是在Pentium4 5xxJ系列处理器上,取代了以前的
Pentium 4处理器和其它大部分x86处理器中的所常用的C1 halt state。C1 halt state由操作系统idel进
行发出的HLT命令触发,然后处理器就会进入到低功耗的挂起状态(halt state)。最新的C1E halt state
也是由HLT命令触发的,它是通过调节倍频来逐级的降低处理器的主频,同时还可以降低电压。?
C1E与EIST的不同
EIST的触发机制同C1E halt state是不同的,它的运作需要BIOS和操作系统的支持(Windows XP
SP2/Windows Server 2003 SP1/Linux 2.6 kernel 或更新的版本 ),由操作系统通过ACPI进行调节。简
而言之,EIST能更有智慧地来管理处理器资源,可以根据必需的处理器负载程度与系统速度来自动调整处
理器的电压与核心频率,而且调节的级别更加的细致,因此相比C1E halt可以更加精确的调节处理器的状
态。
Thermal Monitor2(TM2)
TM2全称Thermal Monitor2,是Intel在LGA775封装的Prescott核心处理器中增加的新的过热保护
机制。类似于Pentium4处理器中的温度回馈装置TM1(Thermal Monitor1),当处理器过热时,Pentium4
处理器的主频会降低一半,此时功耗也会降低一半,从而降低处理器温度达到保护处理器安全的目的。与
TM1相比,TM2可以提供更智能,更有效的处理器热量功耗的管理方式,在保证处理器基本性能的前提下
尽可能在满负荷情况下降低处理器的功耗和温度。
TM2的主要工作方式仍然是通过TCC进行处理器主频的控制,不过它被称为“Enhanced TCC(增强
型TCC)”,通过调节处理器的倍频和输入电压来降低处理器的功耗。
TM2为处理器的工作状态预设了两个点:第一点的工作状态是正常的主频和核心电压;第二点是低主
频和低电压点。一旦TM2侦测到处理器的温度上升到预设的警戒温度时,E-TCC电路被激活,调整处理
器的第一点主频和电压,朝着第二点的预设值转换。这一转换的过程非常快――仅5微妙。在转换的这段
时间之内,处理器不能响应系统总线的访问请求的。
处理器的主频降到预设的低值之后,便会向主板上的电压控制模块发出新的电压识别信号(VID
Code)。因此,要实现TM2,主板的电压控制模块必须支持处理器的多电压转换过程,具备较低的电压输
出能力。在处理器电压转换的过程中,可以接受系统总线对其的访问,执行指令。
处理器温度下降到正常值时,处理器的工作主频和电压便会朝正常的值上升。首先上升的是电压,这
样可以保证处理器恢复到正常频率工作后的稳定性(因为低压高频一般会导致处理器工作不稳,就像加压
超频的原理)。
来自: /weidongzhen/blog/item/
一款支持TM2的处理器在TCC激活的情况下发生的变化。当温度触及设计上限时,首先是PROCHOT#
信号变为低电平,接着主频下降至低点预设值。电压在保持一段时间后会以0.0025v为步进下降,到达预
设低点。温度下降一段时间后PROCHOT#变为高电平,首先是电压重新上升到正常值,接着主频会恢复
到正常水平。 VT是Virtualization Technology(虚拟化技术)的缩写,它能够可以让一个CPU工作起来
就像多个CPU并行运行,从而使得在一部内同时运行多个操作系统成为可能,它的出现能够使用户在他们
的个人上建立多套虚拟的运行环境以便能够在同一台个人上运行不同的操作系统。VT还能够允许IT技术
管理员下载系统补丁或者升级个人的一部分的同时,用户能够在另一个虚拟环境中运行他们的应用程序。
根据Intel的资料,Intel虚拟技术的实现需要同时具有处理器、、BIOS、VMM的支持,这些特定的平台必
须全部到位,同时性能方面要视不同的硬件和平台而定。 Intel Execute Disable Bit(简称“XD”)中文译作
“英特尔防病毒攻击内存保护机制”,开启该功能后,可以防止病毒、蠕虫、木马等程序利用溢出、无限扩
大等手法去破坏系统内存,抑制病毒的复制和传播,避免速度变慢、死机等故障的出现。其工作原理是:
处理器在内存中划分出几块区域,部分区域可执行应用程序代码,而另一些区域则不允许。要实现处理器
的“Execute Disable Bit”功能,还需要操作系统的配合才行。现在Windows XP SP2、Windows Server 2003
SP1、Linux 9.2及Red Hat Enterprise Linux 3 Update 3等均支持这一功能。 在去年7月27日,英
特尔正式发布Core微架构的桌面平台处理器Conroe系列,发布之日一共推出有五款处理器,即Core 2
Extreme X6800、Core 2 Duo E6700、Core 2 Duo E6600、Core 2 Duo E6400和Core 2 Duo E6300。然
而即便是最低档的E6300,其价格也要183美元(当时约1450元人民币)。显然光有好的性能还不足以
抢占更多市场份额,价格是另一个主要原因。 最初的Conroe市场定位较为尴尬,其狭窄的市场空间
造成了产品叫好不叫座境况。英特尔要想彻底击垮AMD,单单靠中高端Conroe产品是不可能的,最完美
的做法就是尽快将Conroe系列细分。基于此原因,英特尔随后推出了很多款Core架构的桌面平台处理器,
涵盖高中低端市场。 英特尔的桌面处理器产品线大致上可以按照核心数量、前端总线频率、二级缓存、
核心频率四大主要特征进行区分。在加入新一批酷睿2处理器之后,整个桌面处理器产品线中,处于最顶
端的产品当然是拥有四个物理核心,1333MHz FSB,8MB L2缓存和3GHz核心频率的Core 2 Extreme
QX6850,它也是目前整个桌面处理器市场最先进和最高端的产品。 主流市场Core 2 Duo(C2D)系
列,包括E6000系列(E6850、E6750、、、E6550、E6540、、、和)、E4000系列(E4500、E4400、,
第四季度将会推出E4600),红色字体的型号表示将被淘汰,下同。 入门级市场Pentium E2000(PDC,
Pentium Dual-Core)系列,虽然打着Pentium的旗号,但采用的Core微架构,现有E2140和E2160两
款,第四季度将会发布E2180。 高端市场Core 2 Quad(C2Q)系列,这是四核心的处理器,现有
Q6700和Q6600两款产品。 至尊版的Core 2 Extreme(C2E)系列,现有QX6850、QX6800、和四
款产品。 另外在低端市场还有采用Conroe-L核心的Celeron 400系列,有440、430和420三款产品。
E6000系列是英特尔主流市场的王牌,目前这个系列一共有十个型号的处理器有售。FSB从最初的
1066MHz全面提升到1333MHz,原来1066MHz的六款产品将陆续会停产。 在今年4月,英特尔对
其全系列产品线进行了大幅的价格调整,并在调价的前一天发布了Core 2 Duo E6300/E6400的升级版
Core 2 Duo E6320/E6420。其采用4MB L2 Cahce的增强设计,相比起原有的优势在于缓存翻倍,但价格
则与E6300/E6400完全保持一致。早期的E6300/E6400均是通过屏蔽的方式把B2 Stepping的L2 Cahce
实现为2MB,而E6320/E6420则是把被屏蔽的2MB缓存释放,使得产品的缓存规格与配置与较为高端的
E6600/6700保持一致,有利于产品线的进一步延伸。 同样是在英特尔调价的日子,7月22日,英特
尔推出了六款的Core 2处理器,其中有四款Core 2 Duo处理器,即Core 2 Duo
E6850/E6750/E6550/E6540。E6x50系列+“3”系列芯片组,让英特尔平台正式进入1333MHz FSB时代,
能与未来DDR3内存更好的配合,提升系统整体带宽。1333MHz FSB的Core 2采用了最新的G0步进,
据了解,这一版本相比之前的B2并没有提供什么技术上的革新,不过很多玩家发现,新的G0步进在超频
方面的表现很不错,并且功耗相比之前又有进一步的降低。E6540除不支持TXT和vPro技术外与E6550
相同。 英特尔的这次处理器命名方式很有意思,启用E6x50的命名模式,这一方面为了区分同老处理
器之间的差别,同时也可以让用户支持处理器之间的实际性能差异,譬如E6750的工作频率同E6700一
样,均为2.66GHz,但由于E6750采用1333MHz的总线,因此在数据吞吐量上是占有优势的,因此可以
理解为E6750的效率更高;而E6550的实际工作频率为2.33GHz,而E6600的工作频率为2.4GHz,因
此用户也可以由命名知道,E6550的效率要比E6600低一些 在E6x50处理器中,加入了新的Intel Trust
Execution Technology(简称Intel TXT)技术,配合新一代的Microsoft Vista操作系统,能够提供更强大
的数据安全与保护解决方案。由于TXT是处理器、芯片组及I/O系统所提供的硬件功能,因此这一功能甚
至可以凌驾于所有软件甚至是操作系统之上。 在Pentium D以及Pentium 4处理器慢慢淡出市场
后,英特尔用什么来巩固中低档市场呢?此前基于Core架构最低端的处理器就是Core 2 Duo E6300,但
是其超过160美元的还是会让很多人望而生畏。英特尔自然知道这个问题,早就想好了应对的办法,在今
年1月,英特尔推出了代号为Allendale的E4000系列的首款产品Core 2 Duo E4300,矛头直指1000元
左右的处理器市场。 为了进一步拉开产品之间的距离,英特尔让这种新一代的处理器将提供800MHz
的系统总线,而不是原本Core 2 Duo E6xxx那样的1066MHz的总线上,E4300始频率为1.8GHz,稍低
于E6300,不过9倍频设计更受超频爱好者欢迎,二级缓存为2MB,E4000系列处理器在功能方面还删
减了虚拟技术(Intel VT)和商业用博锐技术(Intel VPro),虽然如此,对于64位操作系统支持、ED Bit防病
毒技术、EIST节能技术,还有以家庭娱乐为主题的欢悦技术(Viiv)都一一保留,因此功能方面的差异没有
太大影响。 E4300是首款采用原生2M二级缓存设计的Intel Core 2 Duo处理器,后期的E6300和
E6400也是采用这种设计,此举将降低CPU的制作成本。 在4月,英特尔又推出了2.0GHz的E4400,
并计划在Q3和Q4分别推出2.2GHz和2.4GHz的E4500、E4600。 2007年6月3日英特尔发
布双核心处理器Pentium Dual-Core E2000系列以及单核心的Celeron 400系列,旧有NetBurst微架构向
Core微架构的过渡已进入尾声。 英特尔显然没有因为Core 2 Duo系列的成功而轻易放弃“Pentium”
这块金字招牌。不过其与先前的双核心产品Pentium D却有着天壤之别。“Pentium Dual-Core”形象地向我
们传达出它是一款基于Core微架构设计的双核心处理器,而“E2000”则又很容易地使我们将其同“Core 2
Duo”中的“E6000”以及“E4000”联系起来。 就现阶段而言,价格偏高也许是Core 2 Duo系列的缺
点,虽然千元以下有PDC E2000系列支撑,但在500元以下市场,Core微架构处理器还是一片空白。英
特尔自然不甘心放过这一巨大市场,Core微架构处理器将无处不在。于是Conroe-L以“单核心Core 2”为
卖点切入低端级处理器市场,高效能功耗比和低价格无疑将成为英特尔的杀手锏。 2007年6月3日,
基于Core微架构的Conroe-L单核心微处理器“Celeron 400”系列正式发布,截止至2007年第三季度,存
在了长达7年之久的单核心Pentium 4系列将正式退出主流零售市场。 Celeron 420、Celeron 430和
Celeron 440成为率先问世的Conroe-L核心处理器。 Conroe-L将采用与Conroe一样的LGA775,单
核心设计,前端总线800MHz,二级缓存512KBB,支持EDB(XD)防毒技术、EM64T技术等,但不支持
虚拟化(VT)技术和EIST(增强SpeedStep)省电技术。 Conroe-L和Conroe最大不同之处在于采用的是
单核心的架构,而这也意味着与Conroe相比,Conroe-L其中一个核心将被屏蔽。由于Core架构采用了
共享缓存的技术,当被关闭了其中一个核心,相应的缓存也会被关闭,而性能损失随之增大。但由于它有
了Conroe核心灵魂附身,所以它的性能依然不弱。 相比Cedar Mill核心Celeron D 3xx的533MHz
FSB,Celeron 400系列的800MHz FSB能让性能有较大提升,而且Celeron 400系列的TDP耗能仅为
35w,较之Cedar Mill核心Celeron D 3xx的65w降低了46%。 Core 2 Extreme(C2E)系列主要
是针对发烧级和高端应用推出的。在第一批的Conroe中,就有Core 2 Extreme X6800,也是当时桌面处
理器中性能之王。和Core 2 Duo相比,X6800仅仅是频率上的提升,最好的消息应该是Extreme系列没
有锁倍频,可以往上调(其它系列只能往下调倍频),更利于超频。当然X6800的TDP为75W,比Core
2 Duo的65W要高。 在2006年11月,英特尔发布了四核心的Core2 Extreme QX6700,处理器内
部将两颗DIE封装在一起,每两个核心共享4M L2缓存,通过一条的FSB与内存沟通。两个酷睿2核心
整合在一起就很快地设计出新的四核产品。对于来说,这样的好处是可以让四核很快地面世,而它的并行
处理能力提高幅度也是令人满意的。但问题是如果核心A需要调用核心B L2缓存内的信息则需要通过FSB
的中转,无形当中影响了处理器的速度。 在发布四核心的Core 2 Extreme QX6700后不久,英特
尔推出价格更低的Core 2 Quad Q6600四核产品,也是第一款上市的Core 2 Quad系列处理器,Core 2
Quad系列将和双核心的Core 2 Duo系列一起构成目前Intel在桌面市场的主打产品。 Core 2 Quad
系列在架构上和Core 2 Extreme四核心版本相同,1个封装当中包含了2个Core 2 Duo核心。Q6600的
工作频率从QX6700的2.66GHz下降到2.4GHz,同时TDP功耗也从130W下降到105W,FSB还是跑
1066 MHz,二级缓存8MB(每2核心共享4MB)。后期改良了工艺的G0制程Core 2 Quad Q6600处理
器TDP降低到了95W。 在7月22日,英特尔发布了新的Core 2 Quad Q6700处理器,频率为2.66MHz,
其它规格不变。目前Q6700的采购价为$530,Q6600的采购价为$266(和C2D E6850一样),很好地
填补了C2D和C2E间的空白。 根据Intel的计划,新一代的45nm Penryn处理器将在2007年第三季
度面世,而在此之前,Intel将通过1333MHz FSB的Core 2 Duo 6X50系列处理器来保持效能优势和巩固
市场份额。 为了与上一代1066MHz FSB的产品进行区分,1333MHz FSB版本处理器代号中第三个
数字由“0”改为“5”。首批的1333MHz FSB的6X50处理器包括四核的QX6850(主频3.0GHz),双核的
E6850、E6750、E6550(主频分别为3.00GHz、2.66GHz和2.33GHz)四款,除了拥有“传统”的虚拟机
技术(VT)、增强型节能技术(EIST)及EDB防病毒技术等功能外,它还首次加入商业运用的Intel Trust
Execution Technology(简称Intel TXT),提供进一步的数据保全方案。Intel在稍后还会推出E6540,它可
以看作是E6550不支持TXT和vPro技术的简化版。 其实6X50并不是Intel首款1333MHz FSB的产
品,早在Conroe发布后不久的2006年年底Intel就在Xeon 5000系列上率先引入了1333MHz FSB规格。
而最新的6X50系列+“3”系主板芯片组,则让英特尔桌面平台正式进入1333MHz FSB时代。1333MHz
规格的带宽高达10.7GB/s,比1066MHz FSB的8.5GB/s提升了26%,能与未来DDR3内存更好地配合,
籍此Intel可以继续保持在桌面平台效能和技术的双重领先。 新一代的6X50处理器在前端总线提升到
1333MHz,新的G0步进也更加省电,同时新品发布后价格更低,它相比旧的6X00系列处理器更加具有
吸引力,新装机的用户显然会更加偏向于购买6X50。不过对于老用户来说,目前手中的6X00系列是否有
必要升级到6X50呢?下面我们来看看1333MHz FSB vs 1066MHz FSB的结果,选择的处理器为同主频
的E6750和E6700。 可以看出,1333MHz FSB的E6750相比1066 MHz FSB的E6700效能有提升,
不过提升的幅度很有限,最多也不过5%,平均来说效能的提升也大概只有2%左右。 即使是对于四核
心处理器来说,1333MHz FSB带来的性能提升依旧较为有限,而且我们还要考虑到QX6850在频率要比
QX6800高出了70MHz,考虑到这一点,1333MHz FSB带来的性能提升更加不值一提了。 结论:购
买新电脑,首选1333MHz FSB的型号,但目前正在实用1066MHz FSB产品的用户则没有太大的必要急
于升级。 英特尔在4月推出的酷睿2新品Core 2 Duo E6420、E6320,是E6300和E6400的升
级版,二级缓存从2MB扩展到了4MB。 从技术角度来说E6320和E6420并没有什么全新的特性。
它们仍然采用Conroe核心,拥有4MB二级缓存,主频分别为1.86GHz和2.13GHz,拥有1066MHz FSB。
除了二级缓存,它们与E6300和E6400并无差别,既然它们的定价一致,那么E6300和E6400将逐渐被
淘汰出市场。 二级缓存的增加,显然会带来效能上的提升,不过具体的效能提升究竟有多大呢? 从
我们的测试结果来看,二级缓存对系统性能的提升是显而易见的。总的来说,E6320相对E6300效能提升
的幅度不到3%,而一些应用对二级缓存的大小不是太敏感,比如图形处理,同时我们注意到Vista内建
“Windows Experience Index Base Score” 公用程序测试中两者的得分是一样的,也就是说对于Vista的运
行来说,两者并不会有多大的区别。 虽然效能提升的幅度并不是非常高,不过4M二级缓存的E6X20
仍然是值得赞叹的,它们在性能提升的同时,价格还和旧型号的产品保持一致,对于这样的免费升级,消
费者没有理由去拒绝。 Intel给E2000系列处理器冠上了“Pentium”的前缀,而不肯将它们归类到
Conroe“扣肉”家族中,不过毕竟它们还是基于Core微架构的。对于不少消费者来说,正统的“扣肉”还是太
贵了,而Pentium E2000系列的出现无疑是一大福音。 Pentium E2000系列与Core 2 Duo E4000系
列同为800MHz FSB,频率上也大体相同,只是二级缓存由2MB进一步缩减到1MB。不少用户都对一再“阉
割”的Pentium E2000系列极为不屑,那么,这1M的二级缓存究竟会损失多少性能呢? 从上面的测
试结果来看,Pentiume E2160和Core 2 Duo E4300的性能差距大概在5%左右,在视频渲染、图片处理
等应用中两者的性能差距并不大。考虑到两者间200多元的差价,对于对价格敏感的消费者来说,Pentium
E2000系列无疑是高性价比的选择Core 2 Duo E4000系列处理器作为入门级双核处理器,只保留了2MB
的L2缓存,FSB也只有800MHz,在规格上显然不如E6000系列吸引人,不过凭借着更具吸引力的价格
和不错的超频能力,E4300还是成为最受欢迎的Core 2 Duo处理器。 在E4300之后,Intel又推出了
E4400和E4500,它的主频提升到了2.0GHz和2.2GHz,但L2缓存仍是2MB,FSB也没有变,仍为
800MHz。E4400/E4500和E6X20同时推出,不过大家的眼光都被E6x20的4MB的L2缓存吸引了,而
对前者关注甚少。 其实在Intel的计划中,E6300和E4300都会在07年第三季度淡出市场,取代它们
的正是E6320和E4400/E4500。由于Intel将E4500定位在Core 2 Duo桌面处理器的底端,它千颗批发
单价要比E6320便宜30多美元,而在国内零售市场上,两者的盒装版本差价为300多元人民币(10月
27日,市场E4500盒装报价999元,E6320盒装报价1310元)。E4300和E6300同为2MB的L2缓存,
但是主频上低了60MHz,FSB也低了266MHz,因此在性能上大概落后5%,而E4500在主频上则要比
E6320高340MHz,FSB低了266MHz,L2缓存少了2MB。从Intel的定位来看,800MHz FSB和2MB L2
缓存将使E4500在性能落后于E6320,那么事实上是否如此呢? 事实上,测试结果会令Intel感到比
较尴尬,E6320在大部分的测试中相对E4500处于劣势。很显然,1066MHz FSB和4M二级缓存并不能
弥补在主频上340MHz的差距,无论在视频渲染、图片处理还是高清视频播放乃至整体性能上,E6320全
面落后。 不过,对于消费者来说,这并不是什么坏事。由于E4500比E6320便宜大约300元,我们
建议用户选择前者,即使它的FSB不是那么高,二级缓存也不是那么大.