最新消息: USBMI致力于为网友们分享Windows、安卓、IOS等主流手机系统相关的资讯以及评测、同时提供相关教程、应用、软件下载等服务。

【精品】第二代智能很强势 Sandy Bridge架构CPU评测

IT圈 admin 36浏览 0评论

2024年3月6日发(作者:度山雁)

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

第二代智能很强势SandyBridge架构CPU评测

前言

SandyBridge架构处理器的性能到底如何?今天通过笔者的这篇较为全面的测试,来一起判定下它们到底给不给力吧。在测试前或许很多朋友对架构这个词感觉比较陌生,架构其实是一个非常抽象的词汇.简单的说可以认为是组成处理器的结构模式,每次新的架构出来都会给处理器带来不小的性能提升,Intel的架构作用尤其明显。

Intel新酷睿处理器编年史

Intel的处理器发布都是有一定的规律可循的,就如同之前摩尔定律和时钟年定律一样,新酷睿处理器的发布也有其一定的规律性可看……

2008年11月酷睿i7900系列发布,45纳米工艺、基于Nehalem架构、代号Bloomfield、4个处理器核心,内部整合内存控制器、

2009年9月酷睿i7800系列和酷睿i5500系列发布,45纳米工艺、基于Nelalem架构、代号Lynfield、4个处理器核心,内部整合内存控制器和PCI-E1。0控制器,第一次加入Turboboost技术。

2010年1月酷睿i5600系列和酷睿i3500系列发布,32纳米工艺、基于Nehalem架构、代号Clarkdale、2个处理器核心,内部整合内存控制器和PCI—E1。0控制器,第一次首次在内部集成显示核心.

2010年8月酷睿i7980X高端处理器发布,32纳米工艺、基于Westmere架构、代号Gulftown、6个处理器核心,是目前Intel民用级别最高端产品,内部整合内存控制器和PCI—E1.0控制器。

1 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

2011年1月酷睿i72000系列和酷睿i52000系列发布,32纳米工艺、基于SandyBridge架构、代号不详,4个处理器核心,内部整合内存控制器和PCI-E2。0控制器,集成高性能核芯显卡并加入Turboboost2.0技术以及最新的多媒体指令集AVX。

……

看过上面的内容后,我们会发现其实蛮有趣的。从第一款45纳米技术新酷睿产品的发布,到现在SandyBridge架构酷睿i7和i5的发布时间恰好一年半,首先是工艺的提升紧接着就是架构的改变,这个似乎是Intel不变的规律,不同的是这次的架构新技术很多,几乎彻底改变了以往架构中许多重要环节。如此来计算的话,我们大致可以认为在2011年9月Intel很可能会发布它的酷睿i32000系列和基于SandyBridge架构的奔腾和赛扬系列。

SandyBridge简介及主要特性

在看评测之前我们先来了解下什么SandyBridge?它都有那些值得我们关注的地方?

09年(TICK时间),Intel处理器制程将会迈入32nm时代,而之后到了2010年的TOCK时间,Intel将会推出代号为SandyBridge的处理器,该处理器采用32nm制程.SandyBridge(之前称作Gesher)是Nehalem的继任者,也是其工艺升级版,从45nm进化到ridge将有八核心版本,二级缓存仍为512KB,但三级缓存将扩容至16MB.而SandyBridge最主要特点则是加入了gameinstrutionAVX(AdvancedVectorsExtensions)技术,也就是之前的VSSE。intel宣称,使用AVX技术进行矩阵计算的时候将比SSE技术快90%.其重要性堪比1999年PentiumIII引入SSE。2 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

SandyBridge最大的亮点是将引入“AVX”指令集,简称“AVX"(之前称作VSSE),其重要性堪比1999年PentiumIII引入SSE.

这颗处理器采用Intel第二代32nmHKMG工艺制造,目前为B2步进(工程样品),LGA1155封装接口,原始主频2.50GHz,外频100MHz(Nehalem/Westmere都是133MHz),倍频25x,一级缓存8路关联256KB,二级缓存8路关联4×256KB,三级缓存12路关联6MB(小于Nehalem),整合Intel第六代图形核心,支持超线程技术和AES—NI、AVX指令集,其中AES—NI新增七条指令,可加速数据加密和解密,AVX(高级矢量扩展)则针对密集型浮点运算,并协助一般用途和工程应用的加速。

主要技术特性

1、更宽的矢量运算:从128—bit增至256—bit,并保持向下兼容性

2、增强的数据重排:单个操作可同时处理8个32—bit数据

3、支持三操作数和四操作数,非破坏性句法

4、支持弹性的访存地址不对齐

2 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

5、可扩展的新操作码(VEX)

高性能核芯显卡技术解析

Intel的集成显卡似乎总是个笑话,但这次确实不一样了。SNB的CPU性能相比现在提升了10—30%,进化到第六代的GPU图形性能则会轻松翻好几番。

Westmere虽然也自带了图形核心,但与CPU是双内核封装,只是通过45nm工艺、更多着色硬件、更高频率提升了性能,SandyBridge则将CPU、GPU封装在同一内核中,全部采用32nm工艺,特别是显著提高了IPC(指令/时钟).3 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

SandyBridgeGPU有自己的电源岛和时钟域,也支持TurboBoost技术,可以独立加速或降频,并共享三级缓存。显卡驱动会控制访问三级缓存的权限,甚至可以限制GPU使用多少缓存。将图形数据放在缓存里就不用绕道去遥远而“缓慢”的内存了,这对提升性能、降低功耗都大有裨益。

不过这么做并没有说起来这么简单。NVIDIAGF100核心费了九牛二虎之力,SandyBridge其实也差不多,同样进行了全新设计。顺便提一下Intel的独立显卡工程Larrabee。它的重点是广泛使用全面可编程硬件(除了纹理硬件),SandyBridge则是全面使用固定功能硬件,功能特性和硬件单元相对应,这样的好处是性能、功耗、核心面积都大大优化,损失则是缺乏弹性。显然,Intel世界的中心仍旧是CPU,不能让GPU过分强大,这和NVIDIA的理念正好相反。

3 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

可编程着色硬件被称为EU,包含着色器、核心、执行单元等,可以从多个线程双发射时取指令。内部ISA映射和绝大多数DX10API指令一一对应,架构很像CISC,结果就是有效扩大了EU的宽度,IPC也显著提升。

抽象数学运算由EU内的硬件负责,性能得以同步提高。Intel表示,正弦(sine)、余弦(cosine)操作的速度比现在的HDGraphics提升了几个数量级。

Intel此前的图形架构中,寄存器文件都是即时重新分配的。如果一个线程需要的寄存器较少,剩余寄存器jiuihui分配给其他线程。这样虽能节省核心面积,但也会限制性能,很多时候线程可能会面临没有寄存器可用的尴尬.在芯片组集成时代,每个线程平均64个寄存器,WestmereHDGraphics提高到平均80个,SNB则每个线程固定为120个。

所有这些改进加起来,SandyBridge里每个EU的指令吞吐量都比现在的HDGraphics增加了一倍。

SandyBridge集成的GPU图形核心分为两大版本,分别拥有6个、12个EU。首批发布的移动版全部是12个EU,桌面版则根据型号不同而有两种配置,可能是高端12个、低端6个。得益于每个EU吞吐量翻番、运行频率更高、共享三级缓存等特点,即使只有六个的时候性能也会相当令人满意.

Turboboost2。0技术解析4 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

在去年的新酷睿系列处理器的Lynnfield架构里英特尔首次引入了智能动态加速技术“TurboBoost"(睿频),并将这个技术应用在其高端i7系列和中端i5系列芯片中。

智能动态加速技术“TurboBoost能够根据工作负载,自动以适当速度开启全部核心,或者关闭部分限制核心、提高剩余核心的速度,比如一颗热设计功耗(TDP)为95W的四核心处理器,可能会三个核心完全关闭,最后一个大幅提速,一直达到95WTDP的限制。

为了安全考虑英特尔在现有处理器中都是假设一旦开启动态加速,就会达到TDP限制,但事实上并非如此,处理器不会立即变得很热,而是有一段时间发热量距离TDP还差很多。

SandyBridge利用这一点特性,允许单元控制单元(PCU)在短时间内将活跃核心加速到TDP以上,然后慢慢降下来。PCU会在空闲时跟踪散热剩余空间,在系统负载加大时予以利用.处理器空闲的时间越长,能够超越TDP的时间就越长,但最长不超过25秒钟.不过在稳定性方面,PCU不会允许超过任何限制.

之前我们也已经说过了,SandyBridgeGPU图形核心也可以独立动态加速,最高可达惊人的1。35GHz。如果软件需要更多CPU资源,那么CPU就会加速、GPU同时减速,反之亦然.

安全性方面用户也不必过多的担心,因为英特尔依然会在最可靠的安全范围内提供给用户芯片性能上的提升,这个提升仍然是有限度的,只不过从之前的TDP转换到了时间上而已。

具体TurboBoost2。0较之一代有如何的性能提升在之后的测试环节中笔者会给出答案。

AVX新媒体指令集技术解析

AVX指令集是SandyBridge和Larrabee架构新指令集。AVX指令集让Intel的微架构也进入了全速发展的时期,在IDF峰会上Intel公司就发布了2010年的RoadMap。2010年Intel也将发布全新的处理器4 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

微架构SandyBridge,其中全新增加的指令集也将带来CPU性能的提升。Intel公司将为SandyBridge带来全新的指令扩展集IntelAdvancedVectorExtensions(IntelAVX)。AVX是在之前的128bit扩展到了256bit的SIMD(SingleInstruction,MultipleData)。而SandyBridge的SIMD演算单元扩展到256bits的同时数据传输也获得了提升,所以从理论上看CPU内核浮点运算性能提升到了2倍。5 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

一、AVX革新的指令格式

AVX的256bitsSIMD扩展支持是其最具革新的设计部分,同时也代表了指令编码格式的变更.头部增加prefix让扩展成为可能,而增强的寄存器也使指令头部分不断增加prefix成为了可能。这就似乎是由一个房子出来,站到了院子里一般,摆在他面前的是更宽广的世界。

二、AVX最新的编码系统

针对AVX的最新的命令编码系统,Intel也给出了更加详细的介绍,其中包括了大幅度扩充指令集的可能性。比如SandyBridge所带来的融合了乘法的双指令支持。从而可以更加容易地实现512bits和1024bits的扩展。而在2008年末到2009年推出的meniikoaCPU“Larrabee(LARAB)”处理器,就会采用AVX指令集。从地位上来看AVX也开始了Intel处理器指令集的新篇章。

基于这些IntelAVX带来的前景似乎非常明朗,下面我们来看看AVX的未来剑指何方.

AVX的未来指令格式

支持16路SIMD指令

VEX是AVX的编码系统简称。由于VEX的支持AVX的长指令可以变得更短,而VEX的payload也有着1字节和2字节两种,VEXprefix为1字节payload的C5和2字节的C1,以及1字节的payload等情况,同样的指令和之前的指令格式比较beru的1字节分指令相比也更短。Intel的BobValentine先生在IDF峰会上曾经介绍过AVX带来的蓝图。

VEX编码格式的另外一个重要点就是有着强大的指令集扩展支持,而对于同样命令长度的指令也更加容易地实现,这样就使不断增长的命令兼容变得更加容易。5 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

其中5字节版的payload,也专门有着指令扩展的3比特空间,而3bits也以为着1000条新指令的支持,全新的ficha和新的寄存器以及vector也都可以更加容易地增加。

除了VEX指令格式外还有着1,024bits的SIMD的支持.同时多重prefix的支持和之前的beru比较,全部的指令在格式上都更小,之前的1字节C5通过C4,也可以决定opcode的长度.而从硬件上来看的话,指令的puridekodo实现也更加容易。

VEX解决x86CPU瓶颈

AVX的VEX的编码系统,从某一侧面上也反应了Intel处理器今后的进化趋势,因为它解决了x86系列CPU在decoding上的不足.CoreMA有着4条命令的执行通道,不过frontend却存在着不足,首先L1缓存fetch端口也有着16字节的长度.而fetch的命令次数也被得到了限制。首先IA—32/Intel64命令的puridekodo也有着先天的瓶颈,而操作数和地址长度的指令prefix“LCP(LengthChangingPrefixes),使得puridekodo变得更慢,所以必须要改变长标注的算法。

fetch&puridekodo的最优化设计

CoreMA在puridekodo&decoding方面的不足,从根本上来看是IA—32/Intel64指令集架构本身的问题.IA-32/Intel64架构为了增强长命令而增设的缓存,使命令fetch拜年的更长,并且更加复杂的命令格式也由此产生。RISC(ReducedInstructionSetComputer)的命令格式也决定了其长度,decoding虽然容易,但x86系CPU也就要以牺牲资源为代价,同时也带来了电力的额外消耗。

实际上最新的Nehalem也有着类似CoreMA的不足,从某种程度上来看也延续了其不足,如果明确了这一问题的话,那么Nehalem就必须要改进,其中16bytesfetch和puridekodo等方面的改进就势在必行了。而改进所需要的庞大晶体管增加,也会带来功耗的增加.

6 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

Nehalem的fetch&decoding

Nehalem的设计其实存在着疑问,不过从VEX格式来分析的话其意图就非常明确了。Intel在完善了CPU的puridekodo&decoding硬件设计的同时,必须要改进指令格式本身。fetch的指令变短的同时,指令的标注却更加复杂了,而解决的唯一办法就是改进指令格式。

在充分考虑硬件方面设计后,intel做出了VEX格式开始的决策。IDF上Valentine先生也对VEX格式进行了详细的说明。他是CoreMA的frontend的fetch开发以及decoding的高级架构师,同时也是IA—32/Intel64指令编码器的设计专家.

从整体来看AVX指令的话,可以看出intel公司都CPU开发的全部脉络,Intel公司在对比beru的话,产生改进Drastic的指令集的微架构的想法就变得顺理成章了,如果分析原因的话,那就是微架构本身的改进了。全新的CPU必然要有更好的性能表现,想要提高CPU的性能,那么指令集是最行之有效的手段.

AVX扩展指令包含了SSE指令,这也有助于像AVX时代的过度。日前的SSEVEX格式也并不需要绝对的转换过程。Intel公司的BennyEitan先生也提到,出于整体的考虑,Intel公司对于AVX普及的进行并不会泰国迅速,并且也不会立刻停止SSE时代.SandyBridge也增强了解码器的支持,和之前的IA—32/Intel64prefix相比,decoding也有了全新的VEX格式的支持。其中VEX指令对于decoding的命令数的支持上更加强劲,同时VEX在执行效率上也更加出色.不过这些和SandyBridge真正到来的时候可能还存在差异.

物理寄存器改进技术解析

类似于AMD的推土机、山猫,IntelSandyBridge也使用了物理寄存器文件。Core2、Nehalem架构中,每个微指令需要的每个操作数都有一份拷贝,这就意味着乱序执行硬件(调度器/重排序缓存/关联队列)必7 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

须要非常大,以便容纳微指令和相关数据。CoreDuo时代是80-bit,加入SSE指令集后增至128—bit,现在又有了AVX指令集,按照趋势会翻番至256-bit.

RPF在寄存器文件中存储微指令操作数,而微指令在乱序执行引擎中只会携带指向操作数的指针,而非数据本身。这就大大降低了乱序执行硬件的功耗(转移大量数据很费电的),同时也减小了流水线的核心面积,数据流窗口也增大了三分之一.8 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

核心面积的精简正是AVX指令(SNB最主要革新之一)集得以实现并保证良好性能的关键所在。以最小的核心面积代价,Intel将所有SIMD单元都转向了256-bit.

AVX支持256-bit操作数,相当消耗晶体管与核心面积,而RPF的使用加大了乱序执行缓冲,能够很好地满足更高吞吐量的浮点引擎.

Nehalem架构中有三个执行端口和三个执行单元堆栈:

SandyBridge允许256-bitAVX指令借用128-bit的整数SIMD数据路径,这就使用最小的核心面积实现了双倍的浮点标准128—bitSSE操作不会因为256—bit扩展而增加功耗.

AMD推土机架构对AVX的支持则有所不同,使用了两个128—bitSSE路径来合并成256—bitAVX操作,即使八核心(四模块)推土机的256-bitAVX吞吐量也要比四核心SNB少一半,不过实际影响完全取决于应用程序如何利用AVX。SandyBridge的峰值浮点性能翻了一番,这就对载入和存储单元提出了更高要求。Nehalem/Westmere架构中有三个载入和存储端口:载入、存储地址、存储数据。

SandyBridge架构中载入和存储地址端口是对称的,都可以执行载入或者存储地址,载入带宽因此翻倍。SandyBridge的整数执行也有了改进,只是比较有限。ADC指令吞吐量翻番,乘法运算可加速25%。

环形总线与三级缓存技术解析

不得不说,SandyBridge在三级缓存访问方式上的改进是具有很大意义的,在新的技术下CPU核心和GPU核心可以完美的共享高速三级缓存,这些改变或许要得益于SandyBridge的环形总线.

Nehalem/Westmere每个核心都与三级缓存单独相连,都需要大约1000条连线,而这种做法的缺点是如果频繁访问三级缓存,效果可能不会太好。

吞吐量,每个时钟可以进行两个256-bitAVX操作。另外执行硬件和路径的上位128—bit是受电源栅极(PowerGate)控制的,7 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

SandyBridge又整合了GPU图形核心、视频转码引擎,并共享三级缓存.Intel并没有沿用此前的做法,再增加2000条集成图形核心、媒体引擎、系统助手(SystemAgent)都在这条线上拥有自己的接入点,形象地说就是个“站台”.

这条环形总线由四条独立的环组成,分别是数据环(DT)、请求环(QT)、响应环(RSP)、侦听环(SNP)。每条环的每个站台在每个时钟周期内都能接受32字节数据,而且环的访问总会自动选择最短的路径,以缩短延迟.随着核心数量、缓存容量的增多,缓存带宽也随时同步增加,因而能够很好地扩展到更多核心、更大服务器集群。

连线,而是像服务器版的Nehalem—EX、Westmere-EX那样,引入了环形总线(RingBus),每个核心、每一块三级缓存(LLC)、 这样,SandyBridge每个核心的三级缓存带宽都是96GB/s,堪比高端Westmere,而四核心系统更是能达到384GB/s,因为每个核心都在环上有一个接入点。

三级缓存的延迟也从大约36个周期减少到26—31个周期。此前预览的时候我们就已经感觉到了这一点,现在终于有了确切的数字。三级缓存现在被划分成多个区块,分别对应一个CPU核心,都在环形总线上有自己的接入点和完整缓存管线。每个核心都可以访问全部三级缓存,只是延迟不同。此前三级缓存只有一条缓存管线,所有核心的请求都必须通过它,现在很大程度上分而治之了.

和以前不同的是,三级缓存的频率现在也和核心频率同步,因而速度更快,不过缺点是三级缓存也会随着核心而降频,所以如果CPU降频的时候GPU又正好需要访问三级缓存,速度就慢下来了。

媒体引擎与系统助手技术解析

SandyBridge架构之媒体引擎

除了GPU图形核心,SandyBridge中还有一个媒体处理器,专门负责视频解码、编码。值得注意的是这个并不是整合在核芯显卡内部,而是专门独立出来的一个重要部分。

在未来的相当长时间里高清播放和视频转码会成为日常使用到的步骤,虽然信息量的不断扩大数字信息的庞大已经令人吃惊。包括新兴媒体蓝光和其他1080P格式高清视频的逐步普及,如何高效完成视频解码和转码是一个迫在眉睫的问题。

8 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

Intel在SandyBridge架构中首次引入媒体引擎处理器,新的硬件加速解码引擎中,整个视频管线都通过固定功能单元进行解码,和现在正好相反.Intel据此宣称,SandyBridge在播放视频的时候功耗可降低一半。

9 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

视频编码引擎则是全新的。具体细节没有公布,但是Intel在IDF大会现场拿出了一段3分钟长的1080p30Mbps高清视频,将其转换成640×360iPhone格式,结果整个过程耗时仅仅14秒钟,转换速度高达400FPS左右,而这只花费了大约3平方毫米的核心面积。

Intel与软件产业合作密切,相信这种视频转码技术会很快得到广泛支持。媒体引擎成为SandyBridge中独立存在的一部分,相比更多的是在考虑未来的规划设计蓝图。

系统助手

SandyBridge架构中除了整合显示核心之外还整合很多其他功能,这些功能大部分源于之前主板的北桥芯片。经过环形总线、三级缓存的变化,非核心(Uncore)概念还在,但是Intel改称之为系统助手,基本就相当于曾经的北桥芯片。

在系统助手里集成了PCI—E控制器,可提供16条PCI—E2.0信道,支持单条PCI—Ex16或者两条PCI—Ex8插槽;重新设计的双通道DDR3内存控制器,内存延迟也恢复了正常水平(Westmere将内存控制器移出CPU、放到了GPU上);此外还有DMI总线接口、显示引擎、电源控制单元(PCU)。系统助手的频率要低于其他部分,有自己独立的电源层。

抢先曝光SandyBridge命名以及型号参数

SandyBridge命名

SandyBridge家族仍然沿用Corei7/i5/i3的品牌+子系列命名方式,编号上则采用四位数字,其中第一位均为“2”,代表第二代Coreix系列,最后末尾往往还有一个代表不同含义的字母:K代表不锁定倍频,都是高端产品;S代表性能优化,原始频率比没有字母后缀的低很多,但是单核心加速最高频率基本相同,另外热设计功耗都是65W;T代表功耗优化,热设计功耗只有45W或35W,但是频率也是最低的。

9 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

明年第一季度的首批SandyBridge桌面处理器共有13款型号,规格差异和现在一样错综复杂,想分清楚确实非常困难: -Corei73款;Corei57款、Corei33款;—K系列2款、S系列3款、T系列3款、无后缀5款;—四核心八线程/三级缓存8MB3款、四核心四线程/三级缓存6MB6款、双核心四线程/三级缓存3MB4款;—TurboBoost动态加速支持10款、不支持3款;—95W5款、65W5款、45W1款、35W2款.10 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

另外它们还将全部整合图形核心,默认频率有850MHz、650MHz两种,动态加速频率则有1350MHz、1250MHz、1100MHz三种。

具体型号参数

型号

Corei7—2600

Corei7-2600K

Corei7-2600S

Corei5—2500K

Corei5-2500

Corei5—2400

Corei5-2500S

Corei5—2400S

Corei5—2500T

Corei5-2390T

Corei3—2120

Corei3-2100

Corei3-2100T

主频 TB加速 三级缓存 核心/线程 核芯显卡频率 TDP

3。4GHz 3.8GHz 8MB 4/8 850/1350MHz 95W

3。4GHz 3.8GHz 8MB 4/8 850/1350MHz 95W

2。8GHz 3.8GHz 8MB 4/8 850/1100MHz 65W

3.3GHz 3.7GHz 6MB 4/4 850/1100MHz 95W

3.3GHz 3.7GHz 6MB 4/4 850/1100MHz 95W

3.1GHz 3。4GHz 6MB 4/4 850/1100MHz 95W

2。7GHz 3。7GHz 6MB 4/4 850/1100MHz 65W

2。5GHz 3。3GHz 6MB 4/4 850/1100MHz 65W

2。3GHz 3。3GHz 6MB 4/4 650/1250MHz 45W

2.7GHz 3。5GHz 3MB 2/4 650/1100MHz 35W

3.3GHz N/A 3MB 2/4 850/1100MHz 65W

3。1GHz N/A 3MB 2/4 850/1100MHz 65W

2。5GHz N/A 3MB 2/4 650/1100MHz 35W

中端霸主

酷睿i52500K美图曝光

SandyBridge处理器就要和大家见面了,在做评测之前先给大家放些新处理器的美图让大家鉴赏一番。

10 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

酷睿i52500K和它的新年衣服

11 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

酷睿i52500K处理器

酷睿i52500K处理器

11 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

酷睿i52500K处理器

酷睿i52500K处理器

高端新储君酷睿i72600K美图曝光

12 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

酷睿i72600K的新衣服

酷睿i72600K处理器

13 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

酷睿i72600K处理器

酷睿i72600K处理器

14 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

酷睿i72600K处理器

酷睿i72600K处理器

SandyBridge座驾P67/H67介绍

15 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

从LGA1156时代开始,Intel的芯片组由之前的MCH+ICH双芯片架构转变为PCH单芯片架构,新一代SandyBridge的支持进行了改进.架构处理器的座驾6系列(P67/H67/H61)也延续了这样的设计,并在5系列芯片组的基础上针对USB3。0和SATA6Gbps16 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

6系列中最高端的P67芯片组

在架构方面P67/H67和前代5系列芯片组并无太大区别,分别针对高性能独显用户(P67)和主流高清、游戏用户(H67),虽然新一代SandyBridge架构处理器全面整合了高清显示核心,但是如果搭配P67主板的话整合显示核心会被屏蔽。P67和H67芯片组首次提供了2个原生持。

LGA1155接口

SATA6Gbps接口,并且至此后RAID0,1,5,10。稍后随低端平台推出的H61芯片组则不提供原生SATA6Gbps和RAID支 无论是P67还是H67外形尺寸没有变化,可以沿用上一代Intel的风扇,不过在接口上并不能向下兼容,原来LGA1156接口处理器不能在新的主板上使用,这点老用户升级时要格外注意。

16 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

17 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

6系列主板采用的LGA1155接口

17 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

可以使用

SandyBridge座驾最强的两大杀招

18 / 102

LGA1156过时了,不过散热器依然

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

相比5系列芯片组,P67和H67除了提供了原生SATA6Gbps支持,还改善了对USB3。0的支持,之前5系列芯片组的扩展带宽为PCI—E1。0规范,每条通道带宽为250Mb/s,而USB3.0则需要PCI-E2。0的500Mb/s带宽才能完全发挥效能,因此在6系列主板芯片组上PCI—E升级到了2。0,足够的带宽可以让厂商提供给用户更多的USB3。0接口。

0接口成为6系列主板的主流配置18 / 102

5系列芯片组与6系列芯片组规格对多颗USB3.0主控提供更多USB3。

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

Intel首次提供原生SATA6Gbps接口

许多人会觉得6系列芯片组有点缺乏新意,不过实际情况是Intel将更多功能集成于新一代SandyBridge架构处理器中,芯片组在整个架构中将会慢慢变为处理器的附属,而主板厂商方面也因为这样拥有了更大的发挥空间,例如蓝牙、遥控、无线等模块会让用户有更多的选择,无论追求性价比还是高性能或是扩展能力的用户都能找到自己需要的产品。

关于如何选择6系列芯片组产品,您可以参考另外一篇文章“SandyBridge座驾6系芯片组如何选”。

SandyBridge座驾也分三六九等

Intel下一代SandyBridge整合架构发布在即,更成熟的32nm整合架构将带来更好高的响应速度和更强大的图形性能,新平台蓄势待发,与处理器配套的6系列芯片组主板已经提前通过各种渠道流入市场,规格相差无几,价格却相差成百上千,我们如何做出正确的选择呢?

19 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

小眼20 / 102

面临选择,搞不清楚状况只能大眼瞪

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

“知己知彼,百战不殆”,虽然不可能比您更了解自己,但是对于产品相信我更加略懂一点点,了解选项,是正确做出选择的必要条件,下面我们就先来了解一下不同的6系列芯片组之间存在着哪些不同.

6系列芯片组与5系列芯片组规格对比

从上面的表格可以看出6系列芯片组除了统一更换LGA1156接口之外,和5系列相比最大的升级在于原生SATA6Gbps和PCI—E带宽方面的区别,首先面对高端和主流用户的P67/H67提供了对SATA6Gbps的支持(面向入门级用户的H61未提供该支持),第二,为了更好的支持USB3.0,P67/H67/H61将芯片组的PCI—E升级至第二代(带宽由2。5GT/s提高至5GT/s)。

下面我们根据规格,来大体分析一下几款芯片组的定位:

P67高端玩家、狂热DIY发烧友

H67主流用户、中端玩家

H61主流用户、入门级用户、高性价比追求者。

基准测试部分

火眼金睛CPU—Z1.56测试

首先先用CPU—Z来辨认一下处理器的真实ID身份,以便于我们之后的测试具有意义。

i52500K

20 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

点击放大图

正如你所期望的CPU-Z中一切都比较顺利,名称为IntelCorei52500K、代号SandyBridge、32纳米工艺、四核四线程、1/4。2、EM64T、VT-X、AES以及AVX。

i72600K

一级缓存256K、二级缓存1MB、三级缓存高达6MB。核心速度3.3GHz、倍频33、支持指令集:MMX、SSE/1/2/3/3s/4。21 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

(点击放大图)

CPU-Z成功的把芯片身份辨认出来,点击上图可以看到名称为IntelCorei72600K、代号SandyBridge、32纳米工艺、四核八线程、一级缓存256K、二级缓存1MB、三级缓存高达8MB.核心速度3。4GHz、倍频34、支持指令集:MMX、SSE/1/2/3/3s/4.1/4.2、EM64T、VT-X、AES以及AVX.

22 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

23 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

从两张图片对比中我们可以认为这两款芯片是同一个系列的两款不同产品,主要区别在线程数量、三级缓存大小和主频上,其实0。1GHz主频在同一架构下完全可以忽略不计,那么我们完全可以认为酷睿i72600K就是酷睿i52500K的一个升级版。

综合性能测试3DMarkVantage

3DmarkVantage是一款测试CPU和GPU综合性能的软件,我们对两款处理器分别进行容易和普通两个模式下的测试,最终得分越高性能越优越。

i52500K

默认“P”设置下酷睿i52500K的CPU得分为17445分、GPU得分为2034分,最低设置下分数的变化主要体现在GPU下了一跳。

i72600K

方面,CPU的得分基本不变维持在17148分,而GPU的得分受设置影响很大11783分大有追赶CPU的势头,估计也把CPU23 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

24 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

酷睿i72600K处理器因为和酷睿i52500K采用同一个GPU核心,只是在Turboboost2。0方面对显卡的优化程度更大而已,所以在Vantage中GPU方面的得分提升幅度并不是很大,不过在CPU的得分上却十足的出了次彩。CPU测试得分直接跨过了20000分大关直接向25000分逼近,相信如果稍微在超频上给点力的话,突破25000分大关不是很难.

酷睿i3530

为了给大家一个直观上的对比,笔者特意在这个环境加入了酷睿i3530,这样新老一代整合处理器性能对比起来,大家会更有一个比较深刻的印象.

24 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

25 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

25 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

一目了然,SandyBridge处理器在综合性能上要比上一代处理器有质上的飞跃,特别是其GPU的得分可以说颠覆了集显软弱无能的概念,对于入门级玩家而言可以省去独显的钱来提升电脑其他配件的性能。

另外值得大家注意的就是酷睿i72600K轻松飙过了20000分大关,得分直逼25000分,相信稍加超频的话很容易达到,总而言之SandyBridge处理器的确如之前Intel所说,是一个跨时代的开始。26 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

单核运算能力测试Superπ

Superπ主要是真的CPU单核心运算能力进行测试,我依然才有常规的1M为单位分别对两款处理器的单核心能力进行对比测试.

i52500K

酷睿i52500K在superπ100万计算中的得分为9。973,相比前一代的酷睿i5750的13。249性能提升幅度很大,这和3.3GHz的高主频不无关系,其次更加优异的架构也让它在复杂计算中游刃有余。

i72600K

26 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

27 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

酷睿i72600K也不负众望在单核1M运算性能测试中突破了10秒大关,高速三级缓存以及更高的主频在这里起到了关键的作用。

多核渲染能力测试CinbenchR11。528 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

CinbenchR11.5是一款测试CPU多核渲染和单核渲染的必备工具,它对于CPU的要求非常苛刻,也是CPU基准测试中必不可少的一个环节。

i52500K和i72600K

上面的数据表是先进主流处理器在CinbenchR11。5中性能表现的排名情况,经过对SandyBridge两款新品处理器的苛刻测试,排名重新有了定位。酷睿i72600K性能仅次于三款服务器专用处理器的性能排名第四,而酷睿i52500K竟然略微超Fusion平台处理器是不是也会有更好的表现……

科学运算性能测试ScienceMark2。0

过了AMD最新6核处理器1090T,以微弱的优势排名第七。新四核对阵目前AMD顶级六核性能上一点也不示弱,不知道和 ScienceMark2。0软件主要针对处理器集成的内存控制器以及缓存做测试用的,它可以直观的用数据来表达出测试结果。 i52500K和i72600K

28 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

29 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

这一项测试主要是针对内存控制器和缓存性能的综合测试,图中的各项数据均较之前面有很大突破,特别值得一提的是在MemoryBenchmark内存测试环节的得分已经非常不错,看来在SandyBridge架构中对于内存控制和缓存控制均有较大的优化,因为这一项性能一般都是隐性的,一般很少有人用数据来测试这方面的表现,GPU和CPU运算能力关注较多。

家用测试部分

和时间赛跑WinRAR1。30解压缩测试30 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

WinRAR是我们平时经常用到的一款非常不错的解压缩软件,不论在办公还是家用都有它的身影出现。测试中我们将采用10秒为压缩单位时间,分别对两款处理器的解压缩能力进行测试对比.

i52500K

(点击放大图)

酷睿i52500K在解压和压缩测试中的得分结果分别为2676和2579,解压一个300MB文件用时为15秒,这个成绩已经非常理想。

i72600K

30 / 102

2024年3月6日发(作者:度山雁)

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

第二代智能很强势SandyBridge架构CPU评测

前言

SandyBridge架构处理器的性能到底如何?今天通过笔者的这篇较为全面的测试,来一起判定下它们到底给不给力吧。在测试前或许很多朋友对架构这个词感觉比较陌生,架构其实是一个非常抽象的词汇.简单的说可以认为是组成处理器的结构模式,每次新的架构出来都会给处理器带来不小的性能提升,Intel的架构作用尤其明显。

Intel新酷睿处理器编年史

Intel的处理器发布都是有一定的规律可循的,就如同之前摩尔定律和时钟年定律一样,新酷睿处理器的发布也有其一定的规律性可看……

2008年11月酷睿i7900系列发布,45纳米工艺、基于Nehalem架构、代号Bloomfield、4个处理器核心,内部整合内存控制器、

2009年9月酷睿i7800系列和酷睿i5500系列发布,45纳米工艺、基于Nelalem架构、代号Lynfield、4个处理器核心,内部整合内存控制器和PCI-E1。0控制器,第一次加入Turboboost技术。

2010年1月酷睿i5600系列和酷睿i3500系列发布,32纳米工艺、基于Nehalem架构、代号Clarkdale、2个处理器核心,内部整合内存控制器和PCI—E1。0控制器,第一次首次在内部集成显示核心.

2010年8月酷睿i7980X高端处理器发布,32纳米工艺、基于Westmere架构、代号Gulftown、6个处理器核心,是目前Intel民用级别最高端产品,内部整合内存控制器和PCI—E1.0控制器。

1 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

2011年1月酷睿i72000系列和酷睿i52000系列发布,32纳米工艺、基于SandyBridge架构、代号不详,4个处理器核心,内部整合内存控制器和PCI-E2。0控制器,集成高性能核芯显卡并加入Turboboost2.0技术以及最新的多媒体指令集AVX。

……

看过上面的内容后,我们会发现其实蛮有趣的。从第一款45纳米技术新酷睿产品的发布,到现在SandyBridge架构酷睿i7和i5的发布时间恰好一年半,首先是工艺的提升紧接着就是架构的改变,这个似乎是Intel不变的规律,不同的是这次的架构新技术很多,几乎彻底改变了以往架构中许多重要环节。如此来计算的话,我们大致可以认为在2011年9月Intel很可能会发布它的酷睿i32000系列和基于SandyBridge架构的奔腾和赛扬系列。

SandyBridge简介及主要特性

在看评测之前我们先来了解下什么SandyBridge?它都有那些值得我们关注的地方?

09年(TICK时间),Intel处理器制程将会迈入32nm时代,而之后到了2010年的TOCK时间,Intel将会推出代号为SandyBridge的处理器,该处理器采用32nm制程.SandyBridge(之前称作Gesher)是Nehalem的继任者,也是其工艺升级版,从45nm进化到ridge将有八核心版本,二级缓存仍为512KB,但三级缓存将扩容至16MB.而SandyBridge最主要特点则是加入了gameinstrutionAVX(AdvancedVectorsExtensions)技术,也就是之前的VSSE。intel宣称,使用AVX技术进行矩阵计算的时候将比SSE技术快90%.其重要性堪比1999年PentiumIII引入SSE。2 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

SandyBridge最大的亮点是将引入“AVX”指令集,简称“AVX"(之前称作VSSE),其重要性堪比1999年PentiumIII引入SSE.

这颗处理器采用Intel第二代32nmHKMG工艺制造,目前为B2步进(工程样品),LGA1155封装接口,原始主频2.50GHz,外频100MHz(Nehalem/Westmere都是133MHz),倍频25x,一级缓存8路关联256KB,二级缓存8路关联4×256KB,三级缓存12路关联6MB(小于Nehalem),整合Intel第六代图形核心,支持超线程技术和AES—NI、AVX指令集,其中AES—NI新增七条指令,可加速数据加密和解密,AVX(高级矢量扩展)则针对密集型浮点运算,并协助一般用途和工程应用的加速。

主要技术特性

1、更宽的矢量运算:从128—bit增至256—bit,并保持向下兼容性

2、增强的数据重排:单个操作可同时处理8个32—bit数据

3、支持三操作数和四操作数,非破坏性句法

4、支持弹性的访存地址不对齐

2 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

5、可扩展的新操作码(VEX)

高性能核芯显卡技术解析

Intel的集成显卡似乎总是个笑话,但这次确实不一样了。SNB的CPU性能相比现在提升了10—30%,进化到第六代的GPU图形性能则会轻松翻好几番。

Westmere虽然也自带了图形核心,但与CPU是双内核封装,只是通过45nm工艺、更多着色硬件、更高频率提升了性能,SandyBridge则将CPU、GPU封装在同一内核中,全部采用32nm工艺,特别是显著提高了IPC(指令/时钟).3 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

SandyBridgeGPU有自己的电源岛和时钟域,也支持TurboBoost技术,可以独立加速或降频,并共享三级缓存。显卡驱动会控制访问三级缓存的权限,甚至可以限制GPU使用多少缓存。将图形数据放在缓存里就不用绕道去遥远而“缓慢”的内存了,这对提升性能、降低功耗都大有裨益。

不过这么做并没有说起来这么简单。NVIDIAGF100核心费了九牛二虎之力,SandyBridge其实也差不多,同样进行了全新设计。顺便提一下Intel的独立显卡工程Larrabee。它的重点是广泛使用全面可编程硬件(除了纹理硬件),SandyBridge则是全面使用固定功能硬件,功能特性和硬件单元相对应,这样的好处是性能、功耗、核心面积都大大优化,损失则是缺乏弹性。显然,Intel世界的中心仍旧是CPU,不能让GPU过分强大,这和NVIDIA的理念正好相反。

3 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

可编程着色硬件被称为EU,包含着色器、核心、执行单元等,可以从多个线程双发射时取指令。内部ISA映射和绝大多数DX10API指令一一对应,架构很像CISC,结果就是有效扩大了EU的宽度,IPC也显著提升。

抽象数学运算由EU内的硬件负责,性能得以同步提高。Intel表示,正弦(sine)、余弦(cosine)操作的速度比现在的HDGraphics提升了几个数量级。

Intel此前的图形架构中,寄存器文件都是即时重新分配的。如果一个线程需要的寄存器较少,剩余寄存器jiuihui分配给其他线程。这样虽能节省核心面积,但也会限制性能,很多时候线程可能会面临没有寄存器可用的尴尬.在芯片组集成时代,每个线程平均64个寄存器,WestmereHDGraphics提高到平均80个,SNB则每个线程固定为120个。

所有这些改进加起来,SandyBridge里每个EU的指令吞吐量都比现在的HDGraphics增加了一倍。

SandyBridge集成的GPU图形核心分为两大版本,分别拥有6个、12个EU。首批发布的移动版全部是12个EU,桌面版则根据型号不同而有两种配置,可能是高端12个、低端6个。得益于每个EU吞吐量翻番、运行频率更高、共享三级缓存等特点,即使只有六个的时候性能也会相当令人满意.

Turboboost2。0技术解析4 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

在去年的新酷睿系列处理器的Lynnfield架构里英特尔首次引入了智能动态加速技术“TurboBoost"(睿频),并将这个技术应用在其高端i7系列和中端i5系列芯片中。

智能动态加速技术“TurboBoost能够根据工作负载,自动以适当速度开启全部核心,或者关闭部分限制核心、提高剩余核心的速度,比如一颗热设计功耗(TDP)为95W的四核心处理器,可能会三个核心完全关闭,最后一个大幅提速,一直达到95WTDP的限制。

为了安全考虑英特尔在现有处理器中都是假设一旦开启动态加速,就会达到TDP限制,但事实上并非如此,处理器不会立即变得很热,而是有一段时间发热量距离TDP还差很多。

SandyBridge利用这一点特性,允许单元控制单元(PCU)在短时间内将活跃核心加速到TDP以上,然后慢慢降下来。PCU会在空闲时跟踪散热剩余空间,在系统负载加大时予以利用.处理器空闲的时间越长,能够超越TDP的时间就越长,但最长不超过25秒钟.不过在稳定性方面,PCU不会允许超过任何限制.

之前我们也已经说过了,SandyBridgeGPU图形核心也可以独立动态加速,最高可达惊人的1。35GHz。如果软件需要更多CPU资源,那么CPU就会加速、GPU同时减速,反之亦然.

安全性方面用户也不必过多的担心,因为英特尔依然会在最可靠的安全范围内提供给用户芯片性能上的提升,这个提升仍然是有限度的,只不过从之前的TDP转换到了时间上而已。

具体TurboBoost2。0较之一代有如何的性能提升在之后的测试环节中笔者会给出答案。

AVX新媒体指令集技术解析

AVX指令集是SandyBridge和Larrabee架构新指令集。AVX指令集让Intel的微架构也进入了全速发展的时期,在IDF峰会上Intel公司就发布了2010年的RoadMap。2010年Intel也将发布全新的处理器4 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

微架构SandyBridge,其中全新增加的指令集也将带来CPU性能的提升。Intel公司将为SandyBridge带来全新的指令扩展集IntelAdvancedVectorExtensions(IntelAVX)。AVX是在之前的128bit扩展到了256bit的SIMD(SingleInstruction,MultipleData)。而SandyBridge的SIMD演算单元扩展到256bits的同时数据传输也获得了提升,所以从理论上看CPU内核浮点运算性能提升到了2倍。5 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

一、AVX革新的指令格式

AVX的256bitsSIMD扩展支持是其最具革新的设计部分,同时也代表了指令编码格式的变更.头部增加prefix让扩展成为可能,而增强的寄存器也使指令头部分不断增加prefix成为了可能。这就似乎是由一个房子出来,站到了院子里一般,摆在他面前的是更宽广的世界。

二、AVX最新的编码系统

针对AVX的最新的命令编码系统,Intel也给出了更加详细的介绍,其中包括了大幅度扩充指令集的可能性。比如SandyBridge所带来的融合了乘法的双指令支持。从而可以更加容易地实现512bits和1024bits的扩展。而在2008年末到2009年推出的meniikoaCPU“Larrabee(LARAB)”处理器,就会采用AVX指令集。从地位上来看AVX也开始了Intel处理器指令集的新篇章。

基于这些IntelAVX带来的前景似乎非常明朗,下面我们来看看AVX的未来剑指何方.

AVX的未来指令格式

支持16路SIMD指令

VEX是AVX的编码系统简称。由于VEX的支持AVX的长指令可以变得更短,而VEX的payload也有着1字节和2字节两种,VEXprefix为1字节payload的C5和2字节的C1,以及1字节的payload等情况,同样的指令和之前的指令格式比较beru的1字节分指令相比也更短。Intel的BobValentine先生在IDF峰会上曾经介绍过AVX带来的蓝图。

VEX编码格式的另外一个重要点就是有着强大的指令集扩展支持,而对于同样命令长度的指令也更加容易地实现,这样就使不断增长的命令兼容变得更加容易。5 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

其中5字节版的payload,也专门有着指令扩展的3比特空间,而3bits也以为着1000条新指令的支持,全新的ficha和新的寄存器以及vector也都可以更加容易地增加。

除了VEX指令格式外还有着1,024bits的SIMD的支持.同时多重prefix的支持和之前的beru比较,全部的指令在格式上都更小,之前的1字节C5通过C4,也可以决定opcode的长度.而从硬件上来看的话,指令的puridekodo实现也更加容易。

VEX解决x86CPU瓶颈

AVX的VEX的编码系统,从某一侧面上也反应了Intel处理器今后的进化趋势,因为它解决了x86系列CPU在decoding上的不足.CoreMA有着4条命令的执行通道,不过frontend却存在着不足,首先L1缓存fetch端口也有着16字节的长度.而fetch的命令次数也被得到了限制。首先IA—32/Intel64命令的puridekodo也有着先天的瓶颈,而操作数和地址长度的指令prefix“LCP(LengthChangingPrefixes),使得puridekodo变得更慢,所以必须要改变长标注的算法。

fetch&puridekodo的最优化设计

CoreMA在puridekodo&decoding方面的不足,从根本上来看是IA—32/Intel64指令集架构本身的问题.IA-32/Intel64架构为了增强长命令而增设的缓存,使命令fetch拜年的更长,并且更加复杂的命令格式也由此产生。RISC(ReducedInstructionSetComputer)的命令格式也决定了其长度,decoding虽然容易,但x86系CPU也就要以牺牲资源为代价,同时也带来了电力的额外消耗。

实际上最新的Nehalem也有着类似CoreMA的不足,从某种程度上来看也延续了其不足,如果明确了这一问题的话,那么Nehalem就必须要改进,其中16bytesfetch和puridekodo等方面的改进就势在必行了。而改进所需要的庞大晶体管增加,也会带来功耗的增加.

6 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

Nehalem的fetch&decoding

Nehalem的设计其实存在着疑问,不过从VEX格式来分析的话其意图就非常明确了。Intel在完善了CPU的puridekodo&decoding硬件设计的同时,必须要改进指令格式本身。fetch的指令变短的同时,指令的标注却更加复杂了,而解决的唯一办法就是改进指令格式。

在充分考虑硬件方面设计后,intel做出了VEX格式开始的决策。IDF上Valentine先生也对VEX格式进行了详细的说明。他是CoreMA的frontend的fetch开发以及decoding的高级架构师,同时也是IA—32/Intel64指令编码器的设计专家.

从整体来看AVX指令的话,可以看出intel公司都CPU开发的全部脉络,Intel公司在对比beru的话,产生改进Drastic的指令集的微架构的想法就变得顺理成章了,如果分析原因的话,那就是微架构本身的改进了。全新的CPU必然要有更好的性能表现,想要提高CPU的性能,那么指令集是最行之有效的手段.

AVX扩展指令包含了SSE指令,这也有助于像AVX时代的过度。日前的SSEVEX格式也并不需要绝对的转换过程。Intel公司的BennyEitan先生也提到,出于整体的考虑,Intel公司对于AVX普及的进行并不会泰国迅速,并且也不会立刻停止SSE时代.SandyBridge也增强了解码器的支持,和之前的IA—32/Intel64prefix相比,decoding也有了全新的VEX格式的支持。其中VEX指令对于decoding的命令数的支持上更加强劲,同时VEX在执行效率上也更加出色.不过这些和SandyBridge真正到来的时候可能还存在差异.

物理寄存器改进技术解析

类似于AMD的推土机、山猫,IntelSandyBridge也使用了物理寄存器文件。Core2、Nehalem架构中,每个微指令需要的每个操作数都有一份拷贝,这就意味着乱序执行硬件(调度器/重排序缓存/关联队列)必7 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

须要非常大,以便容纳微指令和相关数据。CoreDuo时代是80-bit,加入SSE指令集后增至128—bit,现在又有了AVX指令集,按照趋势会翻番至256-bit.

RPF在寄存器文件中存储微指令操作数,而微指令在乱序执行引擎中只会携带指向操作数的指针,而非数据本身。这就大大降低了乱序执行硬件的功耗(转移大量数据很费电的),同时也减小了流水线的核心面积,数据流窗口也增大了三分之一.8 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

核心面积的精简正是AVX指令(SNB最主要革新之一)集得以实现并保证良好性能的关键所在。以最小的核心面积代价,Intel将所有SIMD单元都转向了256-bit.

AVX支持256-bit操作数,相当消耗晶体管与核心面积,而RPF的使用加大了乱序执行缓冲,能够很好地满足更高吞吐量的浮点引擎.

Nehalem架构中有三个执行端口和三个执行单元堆栈:

SandyBridge允许256-bitAVX指令借用128-bit的整数SIMD数据路径,这就使用最小的核心面积实现了双倍的浮点标准128—bitSSE操作不会因为256—bit扩展而增加功耗.

AMD推土机架构对AVX的支持则有所不同,使用了两个128—bitSSE路径来合并成256—bitAVX操作,即使八核心(四模块)推土机的256-bitAVX吞吐量也要比四核心SNB少一半,不过实际影响完全取决于应用程序如何利用AVX。SandyBridge的峰值浮点性能翻了一番,这就对载入和存储单元提出了更高要求。Nehalem/Westmere架构中有三个载入和存储端口:载入、存储地址、存储数据。

SandyBridge架构中载入和存储地址端口是对称的,都可以执行载入或者存储地址,载入带宽因此翻倍。SandyBridge的整数执行也有了改进,只是比较有限。ADC指令吞吐量翻番,乘法运算可加速25%。

环形总线与三级缓存技术解析

不得不说,SandyBridge在三级缓存访问方式上的改进是具有很大意义的,在新的技术下CPU核心和GPU核心可以完美的共享高速三级缓存,这些改变或许要得益于SandyBridge的环形总线.

Nehalem/Westmere每个核心都与三级缓存单独相连,都需要大约1000条连线,而这种做法的缺点是如果频繁访问三级缓存,效果可能不会太好。

吞吐量,每个时钟可以进行两个256-bitAVX操作。另外执行硬件和路径的上位128—bit是受电源栅极(PowerGate)控制的,7 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

SandyBridge又整合了GPU图形核心、视频转码引擎,并共享三级缓存.Intel并没有沿用此前的做法,再增加2000条集成图形核心、媒体引擎、系统助手(SystemAgent)都在这条线上拥有自己的接入点,形象地说就是个“站台”.

这条环形总线由四条独立的环组成,分别是数据环(DT)、请求环(QT)、响应环(RSP)、侦听环(SNP)。每条环的每个站台在每个时钟周期内都能接受32字节数据,而且环的访问总会自动选择最短的路径,以缩短延迟.随着核心数量、缓存容量的增多,缓存带宽也随时同步增加,因而能够很好地扩展到更多核心、更大服务器集群。

连线,而是像服务器版的Nehalem—EX、Westmere-EX那样,引入了环形总线(RingBus),每个核心、每一块三级缓存(LLC)、 这样,SandyBridge每个核心的三级缓存带宽都是96GB/s,堪比高端Westmere,而四核心系统更是能达到384GB/s,因为每个核心都在环上有一个接入点。

三级缓存的延迟也从大约36个周期减少到26—31个周期。此前预览的时候我们就已经感觉到了这一点,现在终于有了确切的数字。三级缓存现在被划分成多个区块,分别对应一个CPU核心,都在环形总线上有自己的接入点和完整缓存管线。每个核心都可以访问全部三级缓存,只是延迟不同。此前三级缓存只有一条缓存管线,所有核心的请求都必须通过它,现在很大程度上分而治之了.

和以前不同的是,三级缓存的频率现在也和核心频率同步,因而速度更快,不过缺点是三级缓存也会随着核心而降频,所以如果CPU降频的时候GPU又正好需要访问三级缓存,速度就慢下来了。

媒体引擎与系统助手技术解析

SandyBridge架构之媒体引擎

除了GPU图形核心,SandyBridge中还有一个媒体处理器,专门负责视频解码、编码。值得注意的是这个并不是整合在核芯显卡内部,而是专门独立出来的一个重要部分。

在未来的相当长时间里高清播放和视频转码会成为日常使用到的步骤,虽然信息量的不断扩大数字信息的庞大已经令人吃惊。包括新兴媒体蓝光和其他1080P格式高清视频的逐步普及,如何高效完成视频解码和转码是一个迫在眉睫的问题。

8 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

Intel在SandyBridge架构中首次引入媒体引擎处理器,新的硬件加速解码引擎中,整个视频管线都通过固定功能单元进行解码,和现在正好相反.Intel据此宣称,SandyBridge在播放视频的时候功耗可降低一半。

9 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

视频编码引擎则是全新的。具体细节没有公布,但是Intel在IDF大会现场拿出了一段3分钟长的1080p30Mbps高清视频,将其转换成640×360iPhone格式,结果整个过程耗时仅仅14秒钟,转换速度高达400FPS左右,而这只花费了大约3平方毫米的核心面积。

Intel与软件产业合作密切,相信这种视频转码技术会很快得到广泛支持。媒体引擎成为SandyBridge中独立存在的一部分,相比更多的是在考虑未来的规划设计蓝图。

系统助手

SandyBridge架构中除了整合显示核心之外还整合很多其他功能,这些功能大部分源于之前主板的北桥芯片。经过环形总线、三级缓存的变化,非核心(Uncore)概念还在,但是Intel改称之为系统助手,基本就相当于曾经的北桥芯片。

在系统助手里集成了PCI—E控制器,可提供16条PCI—E2.0信道,支持单条PCI—Ex16或者两条PCI—Ex8插槽;重新设计的双通道DDR3内存控制器,内存延迟也恢复了正常水平(Westmere将内存控制器移出CPU、放到了GPU上);此外还有DMI总线接口、显示引擎、电源控制单元(PCU)。系统助手的频率要低于其他部分,有自己独立的电源层。

抢先曝光SandyBridge命名以及型号参数

SandyBridge命名

SandyBridge家族仍然沿用Corei7/i5/i3的品牌+子系列命名方式,编号上则采用四位数字,其中第一位均为“2”,代表第二代Coreix系列,最后末尾往往还有一个代表不同含义的字母:K代表不锁定倍频,都是高端产品;S代表性能优化,原始频率比没有字母后缀的低很多,但是单核心加速最高频率基本相同,另外热设计功耗都是65W;T代表功耗优化,热设计功耗只有45W或35W,但是频率也是最低的。

9 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

明年第一季度的首批SandyBridge桌面处理器共有13款型号,规格差异和现在一样错综复杂,想分清楚确实非常困难: -Corei73款;Corei57款、Corei33款;—K系列2款、S系列3款、T系列3款、无后缀5款;—四核心八线程/三级缓存8MB3款、四核心四线程/三级缓存6MB6款、双核心四线程/三级缓存3MB4款;—TurboBoost动态加速支持10款、不支持3款;—95W5款、65W5款、45W1款、35W2款.10 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

另外它们还将全部整合图形核心,默认频率有850MHz、650MHz两种,动态加速频率则有1350MHz、1250MHz、1100MHz三种。

具体型号参数

型号

Corei7—2600

Corei7-2600K

Corei7-2600S

Corei5—2500K

Corei5-2500

Corei5—2400

Corei5-2500S

Corei5—2400S

Corei5—2500T

Corei5-2390T

Corei3—2120

Corei3-2100

Corei3-2100T

主频 TB加速 三级缓存 核心/线程 核芯显卡频率 TDP

3。4GHz 3.8GHz 8MB 4/8 850/1350MHz 95W

3。4GHz 3.8GHz 8MB 4/8 850/1350MHz 95W

2。8GHz 3.8GHz 8MB 4/8 850/1100MHz 65W

3.3GHz 3.7GHz 6MB 4/4 850/1100MHz 95W

3.3GHz 3.7GHz 6MB 4/4 850/1100MHz 95W

3.1GHz 3。4GHz 6MB 4/4 850/1100MHz 95W

2。7GHz 3。7GHz 6MB 4/4 850/1100MHz 65W

2。5GHz 3。3GHz 6MB 4/4 850/1100MHz 65W

2。3GHz 3。3GHz 6MB 4/4 650/1250MHz 45W

2.7GHz 3。5GHz 3MB 2/4 650/1100MHz 35W

3.3GHz N/A 3MB 2/4 850/1100MHz 65W

3。1GHz N/A 3MB 2/4 850/1100MHz 65W

2。5GHz N/A 3MB 2/4 650/1100MHz 35W

中端霸主

酷睿i52500K美图曝光

SandyBridge处理器就要和大家见面了,在做评测之前先给大家放些新处理器的美图让大家鉴赏一番。

10 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

酷睿i52500K和它的新年衣服

11 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

酷睿i52500K处理器

酷睿i52500K处理器

11 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

酷睿i52500K处理器

酷睿i52500K处理器

高端新储君酷睿i72600K美图曝光

12 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

酷睿i72600K的新衣服

酷睿i72600K处理器

13 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

酷睿i72600K处理器

酷睿i72600K处理器

14 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

酷睿i72600K处理器

酷睿i72600K处理器

SandyBridge座驾P67/H67介绍

15 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

从LGA1156时代开始,Intel的芯片组由之前的MCH+ICH双芯片架构转变为PCH单芯片架构,新一代SandyBridge的支持进行了改进.架构处理器的座驾6系列(P67/H67/H61)也延续了这样的设计,并在5系列芯片组的基础上针对USB3。0和SATA6Gbps16 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

6系列中最高端的P67芯片组

在架构方面P67/H67和前代5系列芯片组并无太大区别,分别针对高性能独显用户(P67)和主流高清、游戏用户(H67),虽然新一代SandyBridge架构处理器全面整合了高清显示核心,但是如果搭配P67主板的话整合显示核心会被屏蔽。P67和H67芯片组首次提供了2个原生持。

LGA1155接口

SATA6Gbps接口,并且至此后RAID0,1,5,10。稍后随低端平台推出的H61芯片组则不提供原生SATA6Gbps和RAID支 无论是P67还是H67外形尺寸没有变化,可以沿用上一代Intel的风扇,不过在接口上并不能向下兼容,原来LGA1156接口处理器不能在新的主板上使用,这点老用户升级时要格外注意。

16 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

17 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

6系列主板采用的LGA1155接口

17 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

可以使用

SandyBridge座驾最强的两大杀招

18 / 102

LGA1156过时了,不过散热器依然

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

相比5系列芯片组,P67和H67除了提供了原生SATA6Gbps支持,还改善了对USB3。0的支持,之前5系列芯片组的扩展带宽为PCI—E1。0规范,每条通道带宽为250Mb/s,而USB3.0则需要PCI-E2。0的500Mb/s带宽才能完全发挥效能,因此在6系列主板芯片组上PCI—E升级到了2。0,足够的带宽可以让厂商提供给用户更多的USB3。0接口。

0接口成为6系列主板的主流配置18 / 102

5系列芯片组与6系列芯片组规格对多颗USB3.0主控提供更多USB3。

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

Intel首次提供原生SATA6Gbps接口

许多人会觉得6系列芯片组有点缺乏新意,不过实际情况是Intel将更多功能集成于新一代SandyBridge架构处理器中,芯片组在整个架构中将会慢慢变为处理器的附属,而主板厂商方面也因为这样拥有了更大的发挥空间,例如蓝牙、遥控、无线等模块会让用户有更多的选择,无论追求性价比还是高性能或是扩展能力的用户都能找到自己需要的产品。

关于如何选择6系列芯片组产品,您可以参考另外一篇文章“SandyBridge座驾6系芯片组如何选”。

SandyBridge座驾也分三六九等

Intel下一代SandyBridge整合架构发布在即,更成熟的32nm整合架构将带来更好高的响应速度和更强大的图形性能,新平台蓄势待发,与处理器配套的6系列芯片组主板已经提前通过各种渠道流入市场,规格相差无几,价格却相差成百上千,我们如何做出正确的选择呢?

19 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

小眼20 / 102

面临选择,搞不清楚状况只能大眼瞪

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

“知己知彼,百战不殆”,虽然不可能比您更了解自己,但是对于产品相信我更加略懂一点点,了解选项,是正确做出选择的必要条件,下面我们就先来了解一下不同的6系列芯片组之间存在着哪些不同.

6系列芯片组与5系列芯片组规格对比

从上面的表格可以看出6系列芯片组除了统一更换LGA1156接口之外,和5系列相比最大的升级在于原生SATA6Gbps和PCI—E带宽方面的区别,首先面对高端和主流用户的P67/H67提供了对SATA6Gbps的支持(面向入门级用户的H61未提供该支持),第二,为了更好的支持USB3.0,P67/H67/H61将芯片组的PCI—E升级至第二代(带宽由2。5GT/s提高至5GT/s)。

下面我们根据规格,来大体分析一下几款芯片组的定位:

P67高端玩家、狂热DIY发烧友

H67主流用户、中端玩家

H61主流用户、入门级用户、高性价比追求者。

基准测试部分

火眼金睛CPU—Z1.56测试

首先先用CPU—Z来辨认一下处理器的真实ID身份,以便于我们之后的测试具有意义。

i52500K

20 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

点击放大图

正如你所期望的CPU-Z中一切都比较顺利,名称为IntelCorei52500K、代号SandyBridge、32纳米工艺、四核四线程、1/4。2、EM64T、VT-X、AES以及AVX。

i72600K

一级缓存256K、二级缓存1MB、三级缓存高达6MB。核心速度3.3GHz、倍频33、支持指令集:MMX、SSE/1/2/3/3s/4。21 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

(点击放大图)

CPU-Z成功的把芯片身份辨认出来,点击上图可以看到名称为IntelCorei72600K、代号SandyBridge、32纳米工艺、四核八线程、一级缓存256K、二级缓存1MB、三级缓存高达8MB.核心速度3。4GHz、倍频34、支持指令集:MMX、SSE/1/2/3/3s/4.1/4.2、EM64T、VT-X、AES以及AVX.

22 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

23 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

从两张图片对比中我们可以认为这两款芯片是同一个系列的两款不同产品,主要区别在线程数量、三级缓存大小和主频上,其实0。1GHz主频在同一架构下完全可以忽略不计,那么我们完全可以认为酷睿i72600K就是酷睿i52500K的一个升级版。

综合性能测试3DMarkVantage

3DmarkVantage是一款测试CPU和GPU综合性能的软件,我们对两款处理器分别进行容易和普通两个模式下的测试,最终得分越高性能越优越。

i52500K

默认“P”设置下酷睿i52500K的CPU得分为17445分、GPU得分为2034分,最低设置下分数的变化主要体现在GPU下了一跳。

i72600K

方面,CPU的得分基本不变维持在17148分,而GPU的得分受设置影响很大11783分大有追赶CPU的势头,估计也把CPU23 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

24 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

酷睿i72600K处理器因为和酷睿i52500K采用同一个GPU核心,只是在Turboboost2。0方面对显卡的优化程度更大而已,所以在Vantage中GPU方面的得分提升幅度并不是很大,不过在CPU的得分上却十足的出了次彩。CPU测试得分直接跨过了20000分大关直接向25000分逼近,相信如果稍微在超频上给点力的话,突破25000分大关不是很难.

酷睿i3530

为了给大家一个直观上的对比,笔者特意在这个环境加入了酷睿i3530,这样新老一代整合处理器性能对比起来,大家会更有一个比较深刻的印象.

24 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

25 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

25 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

一目了然,SandyBridge处理器在综合性能上要比上一代处理器有质上的飞跃,特别是其GPU的得分可以说颠覆了集显软弱无能的概念,对于入门级玩家而言可以省去独显的钱来提升电脑其他配件的性能。

另外值得大家注意的就是酷睿i72600K轻松飙过了20000分大关,得分直逼25000分,相信稍加超频的话很容易达到,总而言之SandyBridge处理器的确如之前Intel所说,是一个跨时代的开始。26 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

单核运算能力测试Superπ

Superπ主要是真的CPU单核心运算能力进行测试,我依然才有常规的1M为单位分别对两款处理器的单核心能力进行对比测试.

i52500K

酷睿i52500K在superπ100万计算中的得分为9。973,相比前一代的酷睿i5750的13。249性能提升幅度很大,这和3.3GHz的高主频不无关系,其次更加优异的架构也让它在复杂计算中游刃有余。

i72600K

26 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

27 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

酷睿i72600K也不负众望在单核1M运算性能测试中突破了10秒大关,高速三级缓存以及更高的主频在这里起到了关键的作用。

多核渲染能力测试CinbenchR11。528 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

CinbenchR11.5是一款测试CPU多核渲染和单核渲染的必备工具,它对于CPU的要求非常苛刻,也是CPU基准测试中必不可少的一个环节。

i52500K和i72600K

上面的数据表是先进主流处理器在CinbenchR11。5中性能表现的排名情况,经过对SandyBridge两款新品处理器的苛刻测试,排名重新有了定位。酷睿i72600K性能仅次于三款服务器专用处理器的性能排名第四,而酷睿i52500K竟然略微超Fusion平台处理器是不是也会有更好的表现……

科学运算性能测试ScienceMark2。0

过了AMD最新6核处理器1090T,以微弱的优势排名第七。新四核对阵目前AMD顶级六核性能上一点也不示弱,不知道和 ScienceMark2。0软件主要针对处理器集成的内存控制器以及缓存做测试用的,它可以直观的用数据来表达出测试结果。 i52500K和i72600K

28 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

29 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

这一项测试主要是针对内存控制器和缓存性能的综合测试,图中的各项数据均较之前面有很大突破,特别值得一提的是在MemoryBenchmark内存测试环节的得分已经非常不错,看来在SandyBridge架构中对于内存控制和缓存控制均有较大的优化,因为这一项性能一般都是隐性的,一般很少有人用数据来测试这方面的表现,GPU和CPU运算能力关注较多。

家用测试部分

和时间赛跑WinRAR1。30解压缩测试30 / 102

资料内容仅供您学习参考,如有不当之处,请联系改正或者删除

WinRAR是我们平时经常用到的一款非常不错的解压缩软件,不论在办公还是家用都有它的身影出现。测试中我们将采用10秒为压缩单位时间,分别对两款处理器的解压缩能力进行测试对比.

i52500K

(点击放大图)

酷睿i52500K在解压和压缩测试中的得分结果分别为2676和2579,解压一个300MB文件用时为15秒,这个成绩已经非常理想。

i72600K

30 / 102

发布评论

评论列表 (0)

  1. 暂无评论