2024年4月28日发(作者:宗欣欣)
你真的了解CPU和内存吗?
CPU主频也叫时钟频率,单位是MHz,用来表示CPU的运算速度。CPU的工作频率(主频)
包括两部分:外频与倍频,两者的乘积就是主频。倍频的全称为倍频系数。CPU的主频与外
频之间存在着一个比值关系,这个比值就是倍频系数,简称倍频。倍频可以从1.5一直到
23以至更高,以0.5为一个间隔单位。外频与倍频相乘就是主频,所以其中任何一项提高
都可以使CPU的主频上升。由于主频并不直接代表运算速度,所以在一定情况下,很可能会
出现主频较高的CPU实际运算速度较低的现象。因此主频仅仅是CPU性能表现的一个方面,
而不代表CPU的整体性能.
大家知道,计算机系统的时钟速度是以频率来衡量的。晶体振荡器控制着时钟速度,在石英
晶片上加上电压,其就以正弦波的形式震动起来,这一震动可以通过晶片的形变和大小记录
下来。晶体的震动以正弦调和变化的电流的形式表现出来,这一变化的电流就是时钟信号。
而内存本身并不具备晶体振荡器,因此内存工作时的时钟信号是由主板芯片组的北桥或直接
由主板的时钟发生器提供的,也就是说内存无法决定自身的工作频率,其实际工作频率是由
主板来决定的。
再说说为什么会有前端总线一说吧,总线是将信息以一个或多个源部件传送到一个或多个目
的部件的一组传输线。通俗的说,就是多个部件间的公共连线,用于在各个部件之间传输信
息。人们常常以MHz表示的速度来描述总线频率。总线的种类很多,前端总线的英文名字是
Front Side Bus,通常用FSB表示,是将CPU连接到北桥芯片的总线。计算机的前端总线频
率是由CPU和北桥芯片共同决定的。
北桥芯片负责联系内存、显卡等数据吞吐量最大的部件,并和南桥芯片连接。CPU就是通过
前端总线(FSB)连接到北桥芯片,进而通过北桥芯片和内存、显卡交换数据。前端总线是
CPU和外界交换数据的最主要通道,因此前端总线的数据传输能力对计算机整体性能作用很
大,如果没足够快的前端总线,再强的CPU也不能明显提高计算机整体速度。数据传输最大
带宽取决于所有同时传输的数据的宽度和传输频率,即数据带宽=(总线频率×数据位宽)
÷8。目前PC机上所能达到的前端总线频率有266MHz、333MHz、400MHz、533MHz、800MHz
几种,前端总线频率越大,代表着CPU与北桥芯片之间的数据传输能力越大,更能充分发挥
出CPU的功能。现在的CPU技术发展很快,运算速度提高很快,而足够大的前端总线可以保
障有足够的数据供给给CPU,较低的前端总线将无法供给足够的数据给CPU,这样就限制了
CPU性能得发挥,成为系统瓶颈。
外频与前端总线频率的区别:前端总线的速度指的是CPU和北桥芯片间总线的速度,更实质
性的表示了CPU和外界数据传输的速度。而外频的概念是建立在数字脉冲信号震荡速度基础
之上的,也就是说,100MHz外频特指数字脉冲信号在每秒钟震荡一万万次,它更多的影响
了PCI及其他总线的频率。之所以前端总线与外频这两个概念容易混淆,主要的原因是在以
前的很长一段时间里(主要是在Pentium 4出现之前和刚出现Pentium 4时),前端总线频
率与外频是相同的,因此往往直接称前端总线为外频,最终造成这样的误会。随着计算机技
术的发展,人们发现前端总线频率需要高于外频,因此采用了QDR(Quad Date Rate)技术,
或者其他类似的技术实现这个目的。这些技术的原理类似于AGP的2X或者4X,它们使得前
端总线的频率成为外频的2倍、4倍甚至更高,从此之后前端总线和外频的区别才开始被人
们重视起来。
再说说AMD和INTER的区别吧AMD与Intel目前最大的区别就是指令集的区别,双核的概念
AMD早就应用了,只不过不如现在的双芯处理器那么的成熟。这也就是为什么英特尔用G代
表,而AMD用XXXX+来代表编号,英特尔高频低能,AMD低频高能,所以为什么一般同档次
的产品AMD的主频比英特尔的低,其实并不低,只是表现方法不同罢了。例如AMD的2500+
就相当于英特尔的2.5G。
CPU的处理性能不应该单去看主频,而INTEL正是基于相当相当一部分人对CPU的不了解,
采用了加长管线的做法来提高频率,从而误导了相当一部分的人盲目购买。CPU的处理能力
简单地说可以看成:实际处理能力=主频*执行效率,就拿P4E来说他的主频快是建立在使用
了更长的管线基础之上的,而主频只与每级管线的执行速度有关与执行效率无关,加长管线
的好处在与每级管线的执行速度较快,但是管线越长(级数越多)执行效率越低下,AMD的
PR值可能会搞得大家一头雾水,但是却客观划分了与其对手想对应的处理器的能力。为什
么实际频率只有1.8G的AMD 2500+处理器运行速度比实际频率2.4G的P4-2.4B还快?为什
么采用0.13微米制程的Tulatin核心的处理器最高只能做到1.4G,反而采用0.18微米制
程的Willamette核心的处理器却能轻松做到2G?下面我们就来分析一下到底是什么原因导
致以上两种“怪圈”的存在。
每块CPU中都有“执行管道流水线”的存在(以下简称“管线”),管线对于CPU的关系就
类似汽车组装线与汽车之间的关系。CPU的管线并不是物理意义上供数据输入输出的的管路
或通道,它是为了执行指令而归纳出的“下一步需要做的事情”。每一个指令的执行都必须
经过相同的步骤,我们把这样的步骤称作“级”。管线中的“级”的任务包括分支下一步要
执行的指令、分支数据的运算结果、分支结果的存储位置、执行运算等等„„ 最基础的CPU
管线可以被分为5级: 1、取指令 2、译解指令 3、演算出操作数 4、执行指令 5、存储到
高速缓存 你可能会发现以上所说的5级的每一级的描述都非常的概括,同时如果增加一些
特殊的级的话,管线将会有所延长: 1、取指令1 2、取指令2 3、译解指令1 4、译解指
令2 5、演算出操作数 6、分派操作 7、确定时 8、执行指令 9、存储到高速缓存1 10、存
储到高速缓存2 无论是最基本的管线还是延长后的管线都是必须完成同样的任务:接受指
令,输出运算结果。两者之间的不同是:前者只有5级,其每一级要比后者10级中的每一
级处理更多的工作。如果除此以外的其它细节都完全相同的话,那么你一定希望采用第一种
情况的“5级”管线,原因很简单:数据填充5级要比填充10级容易的多。而且如果处理
器的管线不是始终充满数据的话,那么将会损失宝贵的执行效率——这将意味着CPU的执行
效率会在某种程度上大打折扣。
那么CPU管线的长短有什么不同呢?——其关键在于管线长度并不是简单的重复,可以说它
把原来的每一级的工作细化,从而让每一级的工作更加简单,因此在“10级”模式下完成
每一级工作的时间要明显的快于“5级”模式。最慢的(也是最复杂)的“级”结构决定了
整个管线中的每个“级”的速度——请牢牢记住这一点! 我们假设上述第一种管线模式每
一级需要1个时钟周期来执行,最慢可以在1ns内完成的话,那么基于这种管线结构的处理
器的主频可以达到1GHz(1/1ns = 1GHz)。现在的情况是CPU内的管线级数越来越多,为
此必须明显的缩短时钟周期来提供等于或者高于较短管线处理器的性能。好在,较长管线中
每个时钟周期内所做的工作减少了,因此即使处理器频率提升了,但每个时钟周期缩短了,
每个“级”所用的时间也就相应的减少了,从而可以让CPU运行在更高的频率上了。
如果采用上述的第二种管线模式,可以把处理器主频提升到2GHz,那么我们应该可以得到
相当于原来的处理器2倍的性能——如果管线一直保持满载的话。但事实并非如此,任何
CPU内部的管线在预读取的时候总会有出错的情况存在,一旦出错了就必须把这条指令从第
一级管线开始重新执行,稍微计算一下就可以得出结论:如果一块拥有5级管线的CPU在执
2024年4月28日发(作者:宗欣欣)
你真的了解CPU和内存吗?
CPU主频也叫时钟频率,单位是MHz,用来表示CPU的运算速度。CPU的工作频率(主频)
包括两部分:外频与倍频,两者的乘积就是主频。倍频的全称为倍频系数。CPU的主频与外
频之间存在着一个比值关系,这个比值就是倍频系数,简称倍频。倍频可以从1.5一直到
23以至更高,以0.5为一个间隔单位。外频与倍频相乘就是主频,所以其中任何一项提高
都可以使CPU的主频上升。由于主频并不直接代表运算速度,所以在一定情况下,很可能会
出现主频较高的CPU实际运算速度较低的现象。因此主频仅仅是CPU性能表现的一个方面,
而不代表CPU的整体性能.
大家知道,计算机系统的时钟速度是以频率来衡量的。晶体振荡器控制着时钟速度,在石英
晶片上加上电压,其就以正弦波的形式震动起来,这一震动可以通过晶片的形变和大小记录
下来。晶体的震动以正弦调和变化的电流的形式表现出来,这一变化的电流就是时钟信号。
而内存本身并不具备晶体振荡器,因此内存工作时的时钟信号是由主板芯片组的北桥或直接
由主板的时钟发生器提供的,也就是说内存无法决定自身的工作频率,其实际工作频率是由
主板来决定的。
再说说为什么会有前端总线一说吧,总线是将信息以一个或多个源部件传送到一个或多个目
的部件的一组传输线。通俗的说,就是多个部件间的公共连线,用于在各个部件之间传输信
息。人们常常以MHz表示的速度来描述总线频率。总线的种类很多,前端总线的英文名字是
Front Side Bus,通常用FSB表示,是将CPU连接到北桥芯片的总线。计算机的前端总线频
率是由CPU和北桥芯片共同决定的。
北桥芯片负责联系内存、显卡等数据吞吐量最大的部件,并和南桥芯片连接。CPU就是通过
前端总线(FSB)连接到北桥芯片,进而通过北桥芯片和内存、显卡交换数据。前端总线是
CPU和外界交换数据的最主要通道,因此前端总线的数据传输能力对计算机整体性能作用很
大,如果没足够快的前端总线,再强的CPU也不能明显提高计算机整体速度。数据传输最大
带宽取决于所有同时传输的数据的宽度和传输频率,即数据带宽=(总线频率×数据位宽)
÷8。目前PC机上所能达到的前端总线频率有266MHz、333MHz、400MHz、533MHz、800MHz
几种,前端总线频率越大,代表着CPU与北桥芯片之间的数据传输能力越大,更能充分发挥
出CPU的功能。现在的CPU技术发展很快,运算速度提高很快,而足够大的前端总线可以保
障有足够的数据供给给CPU,较低的前端总线将无法供给足够的数据给CPU,这样就限制了
CPU性能得发挥,成为系统瓶颈。
外频与前端总线频率的区别:前端总线的速度指的是CPU和北桥芯片间总线的速度,更实质
性的表示了CPU和外界数据传输的速度。而外频的概念是建立在数字脉冲信号震荡速度基础
之上的,也就是说,100MHz外频特指数字脉冲信号在每秒钟震荡一万万次,它更多的影响
了PCI及其他总线的频率。之所以前端总线与外频这两个概念容易混淆,主要的原因是在以
前的很长一段时间里(主要是在Pentium 4出现之前和刚出现Pentium 4时),前端总线频
率与外频是相同的,因此往往直接称前端总线为外频,最终造成这样的误会。随着计算机技
术的发展,人们发现前端总线频率需要高于外频,因此采用了QDR(Quad Date Rate)技术,
或者其他类似的技术实现这个目的。这些技术的原理类似于AGP的2X或者4X,它们使得前
端总线的频率成为外频的2倍、4倍甚至更高,从此之后前端总线和外频的区别才开始被人
们重视起来。
再说说AMD和INTER的区别吧AMD与Intel目前最大的区别就是指令集的区别,双核的概念
AMD早就应用了,只不过不如现在的双芯处理器那么的成熟。这也就是为什么英特尔用G代
表,而AMD用XXXX+来代表编号,英特尔高频低能,AMD低频高能,所以为什么一般同档次
的产品AMD的主频比英特尔的低,其实并不低,只是表现方法不同罢了。例如AMD的2500+
就相当于英特尔的2.5G。
CPU的处理性能不应该单去看主频,而INTEL正是基于相当相当一部分人对CPU的不了解,
采用了加长管线的做法来提高频率,从而误导了相当一部分的人盲目购买。CPU的处理能力
简单地说可以看成:实际处理能力=主频*执行效率,就拿P4E来说他的主频快是建立在使用
了更长的管线基础之上的,而主频只与每级管线的执行速度有关与执行效率无关,加长管线
的好处在与每级管线的执行速度较快,但是管线越长(级数越多)执行效率越低下,AMD的
PR值可能会搞得大家一头雾水,但是却客观划分了与其对手想对应的处理器的能力。为什
么实际频率只有1.8G的AMD 2500+处理器运行速度比实际频率2.4G的P4-2.4B还快?为什
么采用0.13微米制程的Tulatin核心的处理器最高只能做到1.4G,反而采用0.18微米制
程的Willamette核心的处理器却能轻松做到2G?下面我们就来分析一下到底是什么原因导
致以上两种“怪圈”的存在。
每块CPU中都有“执行管道流水线”的存在(以下简称“管线”),管线对于CPU的关系就
类似汽车组装线与汽车之间的关系。CPU的管线并不是物理意义上供数据输入输出的的管路
或通道,它是为了执行指令而归纳出的“下一步需要做的事情”。每一个指令的执行都必须
经过相同的步骤,我们把这样的步骤称作“级”。管线中的“级”的任务包括分支下一步要
执行的指令、分支数据的运算结果、分支结果的存储位置、执行运算等等„„ 最基础的CPU
管线可以被分为5级: 1、取指令 2、译解指令 3、演算出操作数 4、执行指令 5、存储到
高速缓存 你可能会发现以上所说的5级的每一级的描述都非常的概括,同时如果增加一些
特殊的级的话,管线将会有所延长: 1、取指令1 2、取指令2 3、译解指令1 4、译解指
令2 5、演算出操作数 6、分派操作 7、确定时 8、执行指令 9、存储到高速缓存1 10、存
储到高速缓存2 无论是最基本的管线还是延长后的管线都是必须完成同样的任务:接受指
令,输出运算结果。两者之间的不同是:前者只有5级,其每一级要比后者10级中的每一
级处理更多的工作。如果除此以外的其它细节都完全相同的话,那么你一定希望采用第一种
情况的“5级”管线,原因很简单:数据填充5级要比填充10级容易的多。而且如果处理
器的管线不是始终充满数据的话,那么将会损失宝贵的执行效率——这将意味着CPU的执行
效率会在某种程度上大打折扣。
那么CPU管线的长短有什么不同呢?——其关键在于管线长度并不是简单的重复,可以说它
把原来的每一级的工作细化,从而让每一级的工作更加简单,因此在“10级”模式下完成
每一级工作的时间要明显的快于“5级”模式。最慢的(也是最复杂)的“级”结构决定了
整个管线中的每个“级”的速度——请牢牢记住这一点! 我们假设上述第一种管线模式每
一级需要1个时钟周期来执行,最慢可以在1ns内完成的话,那么基于这种管线结构的处理
器的主频可以达到1GHz(1/1ns = 1GHz)。现在的情况是CPU内的管线级数越来越多,为
此必须明显的缩短时钟周期来提供等于或者高于较短管线处理器的性能。好在,较长管线中
每个时钟周期内所做的工作减少了,因此即使处理器频率提升了,但每个时钟周期缩短了,
每个“级”所用的时间也就相应的减少了,从而可以让CPU运行在更高的频率上了。
如果采用上述的第二种管线模式,可以把处理器主频提升到2GHz,那么我们应该可以得到
相当于原来的处理器2倍的性能——如果管线一直保持满载的话。但事实并非如此,任何
CPU内部的管线在预读取的时候总会有出错的情况存在,一旦出错了就必须把这条指令从第
一级管线开始重新执行,稍微计算一下就可以得出结论:如果一块拥有5级管线的CPU在执