2024年4月4日发(作者:鲜于鸿轩)
第一章 AMD的时间架构
1969年5月1日,公司成立。
1970年,Am2501开发完成。
1972年9月,开始生产晶圆,同年发行股票。
1973年1月,第一个生产基地落成在马来西亚。
1975年,AM9102进入RAM市场。
1976年,与Intel公司签署专利相互授权协议。
1977年,与西门子公司创建AMC公司。
1978年,一个组装生产基地的落成在马尼拉。同年AMD公司年营业额达1亿美元。
1979年,股票在纽约上市,奥斯丁生产基地落成。
1981年,AMD制造的芯片被用于建造航天飞机,同年决定与Intel公司扩大合作。
1982年,新式生产线(MMP)开始投入使用。
1983年,新加坡分公司成立,同年推出.1000质量标准。
1984年,曼谷生产基地建设并扩建奥斯丁工厂。
1985年,被列入财富500强。同年启动自由芯片计划。
1986年10月,AMD公司首次裁员。
1987年,索尼公司合作生产CMOS芯片,4月向INTEL提起诉讼,这场官司持续5
年,以AMD胜诉告终。
1988年10月,SDC基地开始动工。
1990年5月,Rich Previte成为公司的总裁兼首席执行官。
1991年3月,生产AM386 CPU。
1992年2月,AMD对Intel法律诉讼结束,AMD胜诉,获得生产386处理器的资
格。
1993年4月,开始生产闪存,同月,推出AM486
1994年1月,AMD与康柏公司合作,并供应AM485型 CPU。
1995年,Fab 25建成。
1996年,AMD收购NexGen。
1997年,AMD-K6出品。
1998年,K7处理器发布。
1999年,Athlon(速龙)处理器问世。
2000年,AMD在第一季度的销售额首次超过了10亿美元,打破了公司的销售记录,
同年Fab 30开始投入生产。
2001年,AMD推出面向服务器和工作站的AMD Athlon MP双处理器。
2002年,AMD收购Alchemy Semiconductor。
2003年,AMD推出面向服务器Opteron(皓龙)处理器,同年9月,推出第一款
桌面级的64位微处理器。
2005年,AMD叫阵英特尔要求在新加坡举办双核比试,AMD以Socket 939登报
围剿英特尔发出双核决斗挑战。
2006年,AMD发布了Socket AM2,以取代Socket 754和Socket 939。
2006年7月24日,AMD收购ATi。
2007年9月10日,K10处理器发布。
2008年10月8日,AMD宣布分拆成两家公司,一家专注于处理器设计,另一家负
责生产。
2010年,AMD(ATI)独立显示核心出货量取代NVIDIA成为世界第一。
2011年1月,AMD推出Fusion系列Bobcat APU芯片,是一颗芯片包含CPU(中
央处理器)及GPU(图像处理器)的组合,第一轮会有共4颗型号的芯片,GPU部份也
能真正支持1080p高清播放(硬件解码)。
2011年3月6日迪拜新进技术投资公司(ATIC)以4.25亿美元收购了 AMD 拥有
的格罗方德半导体股份有限公司余下的 8.8% 的股份,成为一家独立的芯片制造商,使
ATIC成为唯一持股者。
2011年9月30日,Bulldozer(推土机)产品以全新架构问世,并采用全新插槽
AM3+。该架构其实自2003年就已经有研发计划,唯因为经费不足,搁置到2011年发
布。
2012年,Plidiver(打桩机)架构自改良推土机架构而生。
2013年,AMD再次更换产品标识。
2013年5月22日,AMD正式宣布次世代主机“Xbox One”采用APU作为该主
机的单芯片解决方案。
2013年6月, Richland APU正式推出。
2014年1月,Kaveri APU正式推出。
第二章 AMD历史进程
AMD创办于1969年,当时公司的规模很小,但是从那时起到现在,AMD一直在
不断地发展,目前已经成为一家年收入高达24亿美元的跨国公司。下面将介绍决定
AMD发展方向的重要事件、推动AMD向前发展的主要力量,并按时间顺序回顾AMD
各年大事。
1969-74 - 寻找机会
在公司刚成立时,所有员工只能在创始人之一的JohnCarey的起居室中办公,但不
久他们便迁往美国加州圣克拉拉,租用一家地毯店铺后面的两个房间作为办公地点。到当
年9月份,AMD已经筹得所需的资金,可以开始生产,并迁往加州森尼韦尔的901
Thompson Place,这是AMD的第一个永久性办公地点。
在创办初期,AMD的主要业务是为其它公司重新设计产品,提高它们的速度和效率,
并以"第二供应商"的方式向市场提供这些产品。
1969年5月1日--AMD公司以10万美元的启动资金正式成立。
1969年9月--AMD公司迁往位于901 Thompson Place,Sunnyvale 的新总部。
1969年11月--Fab 1产出第一个优良芯片--Am9300,这是一款4位MSI移位寄
存器。
1970年5月--AMD成立一周年。这时AMD已经拥有54名员工和18种产品,但
是还没有销售额。
1970--推出一个自行开发的产品--Am2501。
1972年11月--开始在新落成的902 Thompson Place 厂房中生产晶圆。
1972年9月--AMD上市,以每股15美元的价格发行了52.5万股。
1973年1月--AMD在马来西亚槟榔屿设立了第一个海外生产基地,以进行大批量
生产。
1974--AMD以2650万美元的销售额结束第五个财年。
1974-79 - 定义未来
AMD在第二个五年的发展让全世界体会到了它最持久的优点--坚忍不拔。尽管美国
经济在1974到75年之间经历了一场严重的衰退,AMD公司的销售额也受到了一定的
影响,但是仍然在此期间增长到了1.68亿美元,这意味着平均年综合增长率超过60%。
1974--位于森尼韦尔的915 DeGuigne建成。
1975--AMD通过AM9102进入RAM市场。
1975--AMD的产品线加入8080A标准处理器和AM2900系列。
1976--AMD和Intel签署专利相互授权协议。
1977--西门子和AMD创建Advanced Micro Computers (AMC) 公司。
1978--AMD在马尼拉设立一个组装生产基地。
1978--AMD的销售额达到了一个重要的里程碑:年度总营业额达到1亿美元。
1978--奥斯丁生产基地开始动工。
1979--奥斯丁生产基地投入使用。
1979--AMD在纽约股票交易所上市。
1980 - 1983 - 寻求卓越
在20世纪80年代早期,两个著名的标志代表了AMD的处境。第一个是所谓的"芦
笋时代",它代表了该公司力求增加它向市场提供的专利产品数量的决心。与这种高利润
的农作物一样,专利产品的开发需要相当长的时间,但是最终会给前期投资带来满意的回
报。第二个标志是一个巨大的海浪。AMD将它作为"追赶潮流"招募活动的核心标志,并
用这股浪潮表示集成电路领域的一种不可阻挡的力量。
AMD的研发投资一直领先于业内其他厂商。在1981财年结束时,该公司的销售额
比1979财年增长了一倍以上。在此期间,AMD扩建了它的厂房和生产基地,并着重在
得克萨斯州建造新的生产设施。AMD在圣安东尼奥建起了新的生产基地,并扩建了奥斯
丁的厂房。AMD迅速地成为了全球半导体市场中的一个重要竞争者。
1981--AMD的芯片被用于建造哥伦比亚号航天飞机。
1981--圣安东尼奥生产基地建成。
1981--AMD和Intel决定延续并扩大他们原先的专利相互授权协议。
1982--奥斯丁的第一条只需4名员工的生产线(MMP)开始投入使用。
1982--AMD和Intel签署围绕iAPX86微处理器和周边设备的技术交换协议。
1983--AMD推出当时业内最高的质量标准.1000。
1984-1989 - 经受严峻考验
在1986年,变革大潮开始席卷整个行业。日本半导体厂商逐渐在内存市场中占据了
主导地位,而这个市场一直是AMD业务的主要支柱。同时,一场严重的经济衰退冲击了
整个计算机市场,限制了人们对于各种芯片的需求。AMD和半导体行业的其他公司都致
力于在日益艰难的市场环境中寻找新的竞争手段。
到了1989,Jerry Sanders开始考虑改革:改组整个公司,以求在新的市场中赢得
竞争优势。AMD开始通过设立亚微米研发中心,加强自己的亚微米制造能力。
1984--曼谷生产基地开始动工。
1984--奥斯丁的第二个厂房开始动工。
1985--AMD首次进入财富500强。
1985--位于奥斯丁的Fabs 14 和15投入使用。
1985--AMD启动自由芯片计划。
1986--AMD推出29300系列32位芯片。
1986--AMD推出业界第一款1M比特的EPROM。
1986年10月--由于长时间的经济衰退,AMD宣布了10多年来的首次裁员计划。
1987--AMD与sony公司共同设立了一家CMOS技术公司。
1987年4月--AMD向Intel公司提起法律诉讼。
1987年4月--AMD和 Monolithic Memories公司达成并购协议。
1988年10月--SDC开始动工。
1989年9月4日- 展开变革
AMD在这段时期的发展主要是通过提供越来越具竞争力的产品,不断地开发出对于
大批量生产至关重要的制造和处理技术,以及加强与战略性合作伙伴的合作关系而实现的。
在这段时期,与基础设施、软件、技术和OEM合作伙伴的合作关系非常重要,它使得
AMD能够带领整个行业向创新的平台和产品发展,在市场中再次引入竞争。
1995--富士-AMD半导体有限公司(FASL)的联合生产基地开始动工。
1995--Fab 25建成。
1996--AMD收购NexGen。
1996--AMD在德累斯顿动工修建Fab 30。
1997--AMD推出AMD-K6处理器。
1998--AMD在微处理器论坛上发布AMD速龙处理器(以前的代号为K7)。
1999--AMD推出AMD速龙处理器,它是业界第一款支持Microsoft Windows计
算的第七代处理器。
2000--AMD在第一季度的销售额首次超过了10亿美元,打破了公司的销售记录。
2000--AMD的Dresden Fab 30开始首次供货。
2001--AMD推出AMD 速龙 XP处理器。
2001--AMD推出面向服务器和工作站的AMD 速龙 MP 双处理器。
2002--AMD 和UMC宣布建立全面的伙伴关系,共同拥有和管理一个位于新加坡的
300-mm晶圆制造中心,并合作开发先进的处理技术设备。
2002--AMD收购Alchemy Semiconductor,建立个人连接解决方案业务部门。
2002--Hector Ruiz接替Jerry Sanders,担任AMD的首席执行官。
2002--AMD推出第一款基于MirrorBit(TM) 架构的闪存设备。
2003-AMD 推出面向服务器和工作站的AMD Opteron(TM)(皓龙) 处理器。
2003-AMD 推出面向台式电脑 和笔记簿电脑的AMD 速龙(TM) 64处理器。
2003-AMD推出 AMD 速龙(TM) 64 FX处理器. 使基于AMD 速龙(TM) 64 FX处理
器的系统能提供影院级计算性能。
2006至今--融聚与分拆
2006年7月24日AMD正式宣布54亿美元并购ATI,新公司将以AMD的名义运
作。
AMD2006年10月25日宣布完成对加拿大ATI公司价值约54亿美元的并购案。
根据双方交易条款,AMD以42亿美元现金和5700万股AMD普通股收购截止
2006年7月21日发行的ATI公司全部的普通股,通过此次并购, AMD在处理器领域
的领先技术将与ATI公司在图形处理、芯片组和消费电子领域的优势完美结合,AMD将
于2007年推出以客户为导向的技术平台,满足客户开发差异化解决方案的需求。
AMD同时将继续开发业界最好的处理器产品,让客户可以根据自身需求选择最佳的
技术组合;从2008年起,AMD将超越现有的技术布局,改造处理器技术,推出整合处
理器和绘图处理器的芯片平台。
2008年10月8日, AMD闪电宣布分拆其制造业务,与阿布扎比一家简称ATIC的
高科技投资公司合资成立名为Foundry的新制造公司,引起全球IT界的轰动。根据协议,
AMD将把德国德累斯顿的两家生产工厂以及相关的资产及知识产权全盘转入合资公司。
AMD将拥有合资公司44.4%股份,ATIC则持有其余股份。至此,AMD彻底转型为一家
芯片设计公司。
第三章 详介AMD发展历程 以下资料截止至2009年
作为排位在INTEL公司之后世界第二大CPU制造商的AMD,在X86时代,一直都
能够紧跟着INTEL的步伐,产品的技术与推出时间和INTEL相比并没有什么明显的差别,
以致与在那个时候,我们就知道有286、386和486,可是并没有详细地去分是INTEL
还是AMD,或者是CYRIX的。我们应该感激AMD这位一直以来都在不断努力,力图超
越自己和CPU巨人INTEL的急先锋。正因为有了AMD和其他公司在不断地给予INTEL
强有力的挑战,CPU才会如此快速地降低价格,而且CPU的发展也一日千里。
介绍AMD公司的产品,就要从他们从X86的“阴影”里面脱离出来的第一款产品:
K5说起。
由于INTEL在486之后就再也没有出过以阿拉伯数字命名的CPU,而是推出了一个
拉丁文的Pentium,AMD也被迫着改换门庭,另起炉灶,推出了自己设计并且生产的
K5CPU。
K5系列CPU的频率一共有六种:75/90/100/120/133/166,内部总线的频率和
Pentium差不多,都是60或者66MHz,至于倍频则全部都是1.5,核心电压都是3.3v。
作为一款与Pentium竞争的产品,AMD的确做得非常出色,虽然再浮点运算方面比起
INTEL的来说是略逊一筹,但是再整数运算方面却一点也不会比INTEL差,由于K5系列
CPU都内置了24KB的一级缓存,比Pentium内置的16KB多出了一半,因此在整数运
算和系统整体性能方面甚至要比同样时钟频率INTEL要高。 K6: 在INTEL发
表了新一代的P6结构CPU:Pentium Pro以及多能奔腾MMX之后,市场上继续出现
一款能够与两者相抗衡的产品。
在这个时候,AMD推出了自己研制的新产品棗K6。
K6这款CPU的设计指标是相当高的,从一开始,AMD就想利用K6的优秀性能将
Pentium比下去,K6具有MMX技术、更多的片上高级缓存(32K指令、32K数据)与
K5相比,可以平行地处理更多的指令,并运行在更高的时钟频率上。在整数运算方面,
AMD无疑是做得非常成功得,基于AMD的K6/233在Windows95的商业测试中性能
已相当接近PentiumII/233,但仍有几个百分点的落后。由于K6具有更大的L1缓存,
所以随着频率的增长,它能获得比Pentium MMX更显著的性能提升。K6稍微落后的地
方是在运行需要使用到MMX或FP(浮点指令)的应用程序方面,比起同样频率的
Pentium MMX,甚至没有MMX的奔腾都要差许多,这样就使K6在某些3D游戏方面
的表现远不如INTEL的出色了。另外,AMD的MMX单元一次只能处理一条指令,而
Intel的MMX单元能够处理两条指令。因此K6 在执行MMX指令和浮点指令时性能要
差一些。AMD没有象Intel那样为这些功能投入资源。浮点和MMX 性能主要取决于两
点:处理周期和吞吐量。处理周期是指从一个指令开始到完成所用的时间。这个性能描述
了处理器完成一个操作所需的时间。吞吐量指的是一定时间内可以开始进行处理的指令数
量;在一个管线化的乘法单元或浮点单元中,两个或多个操作可以并行执行,这增加了吞
吐量,但同时也延长了处理周期。所有Intel的CPU都具有完全管线化的MMX和浮点
单元,所以在每个时钟周期内都可以开始一个新的操作,虽然每个操作的结果可能在几个
时钟周期后才能出来。但执行一个长的顺序计算操作时(这种操作是典型的多媒体应用中
常用的),吞吐量比处理周期更重要。 AMD的K6在处理某些MMX操作的时候具有
比Intel的CPU更短的处理周期,但单个操作的吞吐量是一样的,而且较短的处理周期并
不能弥补K6不能同时处理两个MMX指令的不足。虽然Intel的MMX CPU可以同时处
理两个MMX指令,但它的MMX单元只含有一个乘法单元和一个移位单元,所以它不
能同时进行这些关键操作。而且同时只能有一个MMX指令操作内存和整数寄存器在浮点
处理方面起作用,因此K6在某些操作上的处理周期仍比Intel的短,但它每两个时钟周
期才能开始一个操作,而Intel的芯片可以每个周期开始一个。最终的结果是对于许多浮
点操作来说,AMD的芯片的吞吐量只能达到Intel芯片的一半。这种弱点在ZD 3D
WinMark 97 测试中充分的暴露了出来,这个测试综合了浮点运算,包括Pro/Engineer,
AutoCAD和一些PhotoShop 测试。在这些测试中,K6/233要比Pentium II/233 慢,
有时甚至比Pentium MMX/233慢。在3D WinMark 测试中,如果使用 软件模拟方式
来完成所有3-D任务,K6/233的性能只有Pentium II/233的三分之二,使用一个好的
3-D图形卡,这种差距缩小到18%,仍然相当可观。与Pentium MMX/233 比较,
K6/233在软件模拟方式下慢18%,使用好的图形卡也慢7%。 但是作为AMD对
INTEL的沉重一击,K6的确是光荣地完成了任务,市场在占有率因为这样而上升到了历
史的最高点。由于在一段时间里INTEL出现了放弃低端市场的念头,因此AMD的名声
可谓到达了颠峰!
K6系列CPU一共有五种频率,分别是:166/200/233/266/300,五种型号都采用
了66外频,但是后来推出的233/266/300已经可以通过升级主板的BIOS而支持100
外频,是CPU的性能得到了一个飞跃。在倍频方面,K6系列是从2.5~4.5不等,核心电
压则是有2.9,3.2,22三种,特别值得一提的是他们的一级缓存都提高到了64KB,比
MMX足足多了一倍,这也是K6的整数性能为什么要比MMX好的缘故了。
正所谓山雨欲来风满楼,AMD公司连续推出的好几款CPU的性能与INTEL公司的
都十分接近,这表明AMD已经有足够的实力来研制比INTEL更加先进,而且性能价格
比更加高的产品了,不出所料。
1998年中,AMD最新K6-2处理器正式推出。这是首款采用3DNow!技术的微软
视窗操作系统兼容型X86微处理器,内置3DNow!指令及超标量MMX功能,可以产生
栩栩如生的影象和图形效果、大屏幕的影音效果,并为用户带来更精彩的因特网经历。
K6-2从诞生的那一天起,就凭借其最新的技术得到了包括微软在内的各独立软/硬件供应
商的支持。这款K6-2是AMD公司自推出K6CPU后又推出的一款采用最新3DNow技
术的CPU,它采用了全新的硅晶体制造技术(学名叫CS44E IC,并用C4倒装),将硅晶
精度提高到了0.25微米,硬是将原来K6晶体面积(Die size)的168mm2降到了现在
的68mm2,同时晶体数量也增加了50万个(成为930万个),其余结构基本同K6相同,
L1 CACHE仍是64KB,但它的面积也比以前的小了,仅有原来的1/2大。此外它的工作
电压也从2.9/3.2伏降到了2.2伏,据推测,它的耗电量有可能还不到10瓦。并采用最
先进的3DNow技术。当前,随着新一代CPU运算速度的提升,以及许多新的显示芯片
纷纷内建了3D图形加速功能,毫无疑问,3D图形加速技术已成为98年的新主流。可是
谁才真正是3D运算的核心呢,看来CPU与显示卡厂商还有的比拼。
尽管Intel宣布了MMX指令集能够加速多媒体的应用,尤其是影像处理方面,不过
直到MMX一代为止,这还仅限于2D方面,3D的许多图形函数库的运作是不可能靠这
区区57组MMX指令集就可以实现了的,而且它还需要浮点运算指令的配合,更要花上
数百千行的程式执行码才能尽其职能。但事实上应用MMX加速的效应虽然也有,但极为
有限,偏偏MMX的规划又跟浮点运算的区域重叠,造成了MMX与FPU指令过于频繁
的切换,反而把MMX加速所节省下来的时间给抵消掉了!AMD在K6获得MMX指令
集支持后,就看到了这个问题的弊端。于是在它K6获得成功之后,AMD就提出了自己
的AMD 3D技术结构。一个3D影像实体的产生,依先后次序分为四个阶段:第一,是
应用软件或游戏软件提供3D环境的素材(类似于基本数据的传送),此部分着重浮点运
算;第二,是通过空间几何学,画出物品的框架与轮廓,此阶段仍然要靠浮点运算;第三,
进行视野修正(三角形修正法),依视角作形体的修正;最后再进行实体着色,画出真正
的3D立体实体。AMD的3D技术,就是针对第一阶段、第二阶段、第三阶段的重点部
分做加强支持,事实上这三部分也是比较依赖CPU的部分;至于第四阶段因为要涉及到
具体的着色、合成等运算,AMD就将其就完全交给3D加速卡去全权负责,因为各个显
卡厂商都有自己影像合成、着色方面的的独门秘诀,AMD想挤进去还做不到呢!这也比
较合理一些,业有所长,术有专攻嘛。怎么样,看了AMD的3D技术有何想法?别着急,
K6 3D从880万颗晶体加到了930万颗,它可是还增加了不少新功能啊。其中包括增加
Superscalar MMX Unit,现在K6 3D在一个时钟内可以执行解码/执行两条MMX指令。
而且不受指令配对的限制。(P55C/Pentium II中有个限制:不能在同时钟下执行两个
MMX乘法指令)增加24组专门为3D加速的新指令(AMD 3D指令集),它可以一道
指令执行多个浮点运算。针对此24组指令,它还可以加快3D影像处理、声音合成等的
执行速度,当然它的3D指令要配合3D加速卡才行。而且它不会再象MMX那样使用重
复的浮点运算的区域,造成指令的重叠了。100MHz的外部总线频率,它可以大幅度提
高CPU与L2 CACHE和DRAM之间的交换速度,进而提升整个系统的性能。
说到了K6-2,自然要向大家介绍一些有关3DNow!技术的知识: AMD为确保
系统发挥更高的三维图形性能而对x86处理器结构作了改进,3DNow!技术便是这个研发
过程的第一项成果。这项新技术可提高三维图形、多媒体、以及浮点运算密集的个人电脑
应用程序的运算能力,使“逼真的运算平台”成为现实。3DNow!是一组共21条新指令,
可采用单指令多数据(SIMD)及其它加强的性能以缓解主处理器与三维图形加速卡之间在
三维图形通道上所形成的传输瓶颈。3DNow!技术可加强三维图形通道前端的物理及几何
运算功能,使三维图形加速器可以全面发挥其性能。 由于K6-2处理器备有SIMD式的指
令以及双寄存器执行通道,因此可以在每一时钟周期内执行四个浮点运算。K6-2/333的
浮点性能最高可达1.333 Gflops,较Pentium Ⅱ 333及Pentium Ⅱ 400的浮点性能优
胜很多(这两款Pentium的最高浮点性能分别只有0.333 Gflop及0.4 Gflop)。AMD-K-
2-300可发挥1.2Gflop的最高浮点性能,若与最高性能只有0.3 Gflop的Pentium Ⅱ
300比较,K6-2-300的三维处理性能要高3倍。在3DNow!技术的支持之下,供应商可
开发性能更强劲的软硬件应用方案,Windows兼容型个人电脑可以发挥更卓越的三维图
形性能及更逼真的视觉效果。3DNow!若与各大三维图形加速器配合使用,可发挥各种不
同的优点,其中包括以更高的帧速率播放高清晰度画面、建造更接近真实世界的物理模型、
更逼真的三维图形及影像、以及可与影院媲美的影音效果。在制定3DNow!技术标准及整
个计划执行的过程中,Microsoft、应用程序开发商、图形供应商、以及x86处理器供应
商均提供意见,整个计划获得业界广泛支持。3DNow!技术可与现在的x86软件兼容,经
过优化,适用于3DNow!技术的应用程序可以与现时所有的操作系统配合运行。
由此可见,AMD公司的产品是首次在整数性能以及浮点运算性能上同时超越INTEL,
这是何等令人兴奋的消息,也正是因为K6-2的推出,让INTEL感觉到了危机感,不但
CPU的价格一路下降,而且本已经打算停止生产的赛扬系列CPU又推出了最新版本棗内
置128KB一级缓存的赛扬A。让我们广大的电脑爱好者欣喜若狂!
再说回去K6-2,它的频率目前也是有五种:266/300/333/350/400,核心电压都是
2.2伏特,所以发热量比较低,一级缓存比起K6没有丝毫的改变,同样是64KB,不过在
这五种型号里面,我们应该注意一下K6-2-400,可以这样说,它是目前CPU市场上性
能价格比最高的产品,为什么?且听我慢慢道来: K6-2自从上市以来一直被超频爱
好者所“不齿”,就是因为它的超频性能不好,但是K6-2-400的发布却是值得我们骄傲
的,我拿到一块K6-2 400的样品之后马上对其进行测试,使我惊奇的发现,这颗小小的
芯片竟有如此潜能,一举甩掉了K6-2不好超频的历史,足以与和PII争个你死我活。
当Intel Celeron 300A 以其最优的性价比赢得市场后,K6-2的日子越来越不好过了,
具有重大意义的K6-2 400也就在这个时候横空出世,如果你说AMD K6-2的优势何在?
可能就是它的低价格和接近PII的高性能。可自从Intel Celeron 300A 处理器的产生,改
变了INTEL一贯的高价格,并且赛扬的价格比K6-2还要低,这时K6-2的价格可没有任
何优势可言,但同频率的赛扬在综合性能和K6-2还有一点差距,这对K6-2来说可能是
个好消息。但别望了,赛扬的超级超频能力可以说有此疯狂的地步。Intel Celeron 266
可以超到450MHz,Intel Celeron 300可以超到500MHz,这不能不说对K6-2是个压
力。为此,K6-2自从K6-2 350后,就开始注重芯片潜在的能力的研制和开发。在今天
他推出的K6-2 400就能说明这一点。K6-2 350可以上400MHz,甚至有人超到
450MHz,而更让我们惊奇的是K6-2 400可以超到500MHz(准确地说是504MHz),
我甚至向更高的550MHz冲剌,可是失败了,开机能自检为550MHz,但一会就当机了。
对于超频的方法在往后再慢慢阐述,我要声明的是,K6-2 400超到500后系统非常稳定,
能完整地通过全面测试,至少我是这样。 经过详细测试,赛扬300A已被锁死在
100x4.5上,而Celeron 333Mhz 已被锁死在100 x5之上。而且测试之后还可以看出
K6-2 和Celeron 只差 0.97%,可以忽略不计,要知道因为PII的L2快取是主频的一半,
在500MHz时即为250MHz,而此时的K6-2 500MHz的L2快取还是100MHz,所以
K6的分数低一点也是有原因的,至于3D图形性能实在太令我吃惊了,K6-2的性能居然
超过了对手33%,性能的巨大提升不能不说明了AMD的实力,尤其是K6-2的3D
NOW!K6-2 400的性能表现非常出色,它能更好地实现性能和价格两者的关系,这使
我们在选购电脑时又多了一种选择,并且延长了S7主板的寿命。
K7 是AMD公司刚刚推出不久的全新CPUMD目前采用3D NOW!指令集的
K6-2处理器,广受好评。而新一代功能强大的K7继续采用3D NOW!指令集。
AMDK7采用200MHz的外频!而Inter公司明年有可能只会推出133MHz外频的处理
器。AMD甚至表示,2000年时,将会推出基于1000MHz外频的产品。而且在K7的设
计之中,AMD放弃了一直都沿用的Socket 7结构,转向将采用卡匣式结构,这样看起
来,AMD K7更像是PII了。据AMD所公布的资料显示,K7第一个版本采用的是0.25
微米的制造技术,而后将采用0.18微米新工艺。K7加强了整数、浮点运算和多媒体运算
的能力,具有每次可发出九条指令的超阶层微架构、超阶层管线的浮点运算单元。K7并
没有采用INTEL的GTL+系统总线协议,它使用的是Digital公司的Alpha系统总线协议
EV6。EV6系统总线有许多的优点,首先它有许多比GTL+更为优秀的构造,例如点对点
布局。其次它可以支持200mhz的外频,也就是说我们一年以后见到的K7有可能工作在
200mhz的外频下,K7将是第一个真正支持RDRAM或DDR SDRAM的CPU,其中
RDRAM可以提供1.6GB/S的数据传输。K7没有把Cache内建在处理器里。但是,K7
具有64位可编程控制的后置式L2 cache界面,可支持512KB~8MB的二级缓存。
现在我们就来看看K7的结构到底是怎么样的: ·3个并行的X86指令解码
器; ·9个为高频率优化的超标量微结构; ·动态推测时序,乱序执
行; ·2048个入口分支预测表和12个入口返回堆栈; ·3个超标量乱序整数管
道,每个包含: 整数执行单元 地址产生单元 ·3个超标量乱序多媒体管
道; ·64K指令一级CACHE+64K数据一级CACHE,每两路相关; ·2个通用
64位数据CACHE装载/存储端口; ·高速64位后方2级CACHE控制器: 支
持512K到8MB二级CACHE 可编程接口速度 ·高速64位系统接口:
200MHz系统总线。 接下来我们就看看K7各种详细的性能指标: 一、K7
采用的系统总线: AMD的K7处理器并没有采用和Intel的GTL+相同的系统
总线协议,它使用的是Digital公司的Alpha系统总线协议EV6。顺便说一下,Alpha处
理器是一种用于服务器系统的纯64位处理器,其性能优于现在用于PC系统的处理器。K7
使用的EV6系统总线有许多的优点,首先,它有许多比GTL+更为优秀的构造,例如它使
用点对点布局。其次它可以支持200MHz的外频,也就是说我们一年以后见到的K7有
可能是工作在200MHz的外频下,K7 CPU将成为第一个从高带宽内存如Direct
RDRAM和DDR SDRAM中受益的CPU。Intel的GTL+结构在100MHz总线下的尖峰
带宽只有800MB/s;在133MHz时只有1066MB/s。Direct RDRAM和DDR SDRAM在
100MHz总线下能提供1.6GB/s的带宽,这种带宽正好配合K7的200MHz EV6总线。到
K7发布的时候,我想大家手上的SDRAM都得扔掉了(到那时SDRAM也已经落伍了),
因为能和200MHz外频相配的内存只有Direct RDRAM和DDR SDRAM。没办法,如果
你是一个狂热的电脑爱好者,手头又有足够的银子的话,就可以去买了,当然花这些钱还是
值得,这对于计算机的性能会有较大的提高。
二、K7中的Cache: AMD将在1999年底推出内建L2 Cache的
“Sharptooth棗钢牙”(K6-3)处理器,不过新一代的K7没有将L2 Cache建在处理
器内 ,但是,K7内置的tag RAM足以支持和Intel的PentiumⅡ处理器一样的512KB
的L2 Cache,同时AMD还考虑生产像Intel的P6 CPU一样的外置的tag RAM,来支
持不少于2MB~8MB的具有64位可编程控制的后置L2 Cache。虽然K7将不会把L2
Cache内建在处理器里,但是L2 Cache的速度将占CPU主频的1/3至全速,并且L2
Cache将使用SRAM或者DDR SRAM以保证其速度。K7将拥有不少于128KB的L1
Cache,其中,64KB将作为数据缓存,剩下的64KB将作为指令缓存。要知道Pentium
Ⅱ只提供了仅有32KB容量的L1 Cache。有传言说Katmai可能会有不少于64KB的L1
Cache,但这也仅是K7的L1 Cache容量的一半。拥有大量的L1 Cache对高速的处理
器来说是必须的,没有足够的缓存是导致处理器性能提高的一大瓶颈。灵活的L2 Cache
设计,使得AMD可以像Intel一样,通过L2 Cache的大小和速度来决定CPU的用途,
工作站或是服务器。K7将和Intel的Deschutes内核一样有64GB的寻址空间,但Slot
1只有4GB的寻址空间,而Slot A可以有64GB,故而K7的缓存空间也能达到64GB。
因此,我认为使用加大缓存容量和DDR SDRAM作为L2 Cache的K7一定能够提供非
常优秀的性能。 三. K7微结构优点: K7有三条并行的x86指令译码器,
用于将X86指令翻译成定长的微指令,每条微指令可以执行1到2个操作。K7有两种不
同的译码流水线做这个工作,直接路径译码器快速地译码通用指令,而辅助路径译码器在
微代码ROM中检索复杂的X86指令。K7有72个指令控制单元指令,控制单元分配微
指令到乱序整数管道和乱序多媒体管道中去。乱序整数管道可以支持15个微指令,最大
可同时进行30个操作,它的工作是分配3个独立的操作到3个并行的整数执行单元中去,
每个执行单元都带有一个地址发生单元。地址发生单元能够通过优化L1和L2缓存数据
的存取来保证最快的操作速度。 总之:K7的推出,所造成的最大的挑战是Intel即
将发布的Coppermine棗带有同步L2缓存的0.18um工艺的Katmai。Coppermine的
结构仍将与Katmai类似,因此Coppermine只有通过更高的主频来还击K7。这将是
Intel公司1999年7月以前的主要任务。也许KNI与3D Now!的对抗将使得一切都不同。
很明显,AMD不仅仅是发布一种新的CPU,而是一个正面进攻计划,对Intel的逐步进
攻,直到K7的最后攻击。这就是为什么引入像Slot A这样的新的平台。K7卓越的设计
将会吸引众多人的注意。Intel将不得不面临一场艰苦的战役。只有一个全新设计的CPU
才有机会击败K7,因此他们只能比计划大大提前地推出Willamette,总而言之CPU发
展下去将是好戏连场,绝对不容错过呢! ====================
======
在个人电脑20多年的发展历史上,AMD在与Intel的竞争中似乎从来没有像现在这
样占据优势,这一切似乎都要归功于它推出的x86-64系列64位CPU。我们知道,x86
结构在公元1981年随着IBM PC-XT个人电脑的中央处理器——Intel的8086进入了人
类的世界,这颗在当时拥有优秀性能和低廉价格的处理器,是一颗真正16位的微型处理
器(8086有16位的寄存器、运算单元和16位的输入输出总线,它的孪生兄弟8088与
8086内核完全相同,但是为了兼容性采用了8位的输入输出)。随后发布的80286也是
一颗16位的x86结构处理器,采用16位的x86指令系统(IS,Instrction Set),但拥
有更为先进的保护模式指令集。很快,PC的发展就使Intel觉得有必要推出基于32位
x86指令集的CPU——80386。80386是一个里程碑,是个人电脑称霸天下的重量级武
器,这个处理器的技术和市场策略简直无懈可击,一时间各家各户的兼容处理器,包括TI、
Cyrix、IBM和AMD一拥而上,想在PC普及已经汹涌澎湃不可遏制的大潮中分得一杯
羹。然而胜者终究是Intel,为了表明自己伟大的胜利,Intel把基于32位x86指令系统
的个人电脑,叫做英特尔体系32(IA-32,Intel Architecture-32)。从此以后的10多年
间,80486、80586(Pentium,这个词是“第五代”的意思)、80686(Pentium2)、
Pentium3直到Pentium4,Intel一直牢牢占据着个人电脑发展路程上的核心地位。32
位的x86架构也经历了10多年的风雨,过去20年中,X86以无可比拟的性能价格比优
势成为计算平台的标准。以每年超过1亿台的装机量,90%以上的市场占有率被用户广泛
认可。同时开放平台的良性竞争环境推动X86派的技术发展远远超过RISC体系。X86产
品已经从最初的PC机走入了工作站、服务器领域,大有取RISC而代之,统一计算天下
的态势。在这个过程中阻碍X86进入高端企业市场的,就是X86仍然基于32位技术。
对于高端的企业级服务器与工作站应用无能为力。伴随着企业计算应用的发展64位应用
将越来越广泛,令X86向64位扩展势在必行,也成为统一64位计算标准的希望。与此
同时,个人、商务和移动计算领域,32位计算也渐渐开始显得力不从心,不管出于技术
还是竞争需要,32位的时代,已经渐渐开始过去了。 在x86从32位向64位的扩张过
程中,Intel和AMD第一次在指令系统这样的根本方面产生了重大区别。我们知道,从
80386开始,指令系统的决定权一直在Intel手中,AMD只能生产所谓的“兼容”处理
器,也就是说标准是Intel定的,AMD只是靠着与INtel的交叉授权,依靠自己的勤奋努
力,在处理器市场上占有一席之地。在企业市场上,传统上是RISC厂商和UNIX的天下,
Intel想要打进去,并获得与在个人电脑上同样的成功,简直是它梦寐以求的事情。因为
AMD64位处理器的名气实在太大,所以大家似乎都觉得AMD是64位计算的领跑者,
其实客观来讲,Intel进军64位处理器比AMD还要早一些,只不过它的策略有所不同。
Intel并不认为个人和移动领域需要64位的体系结构,同时,觉得把x86扩展到64位来
与64位厂商的RISC系统拼在声势上要弱一些。而且,INtel想要在64位企业计算领域
一支独秀,也不想把AMD这些尾巴牵扯进来,形成32位市场上这种尾大不掉的局面,
因此,Intel单独发布了专为64位市场而定做的IA-64架构,以及相关的64位指令规格,
就是大名鼎鼎的EPIC(Explicitly Parallel Instruction Computing,显式并行指令计算),
并发布了名为Itantium(安腾)的企业级64位处理器。安腾确实是高性能的处理器,但
是它的IA-64并不兼容x86-32指令集,也就是说个人电脑的应用程序并不能在安腾上运
行,这样,大众实际上是被Intel划到了64位的界外。 要不是有这样的大好机会,AMD
想跳出来自己研发处理器架构并与Intel分庭抗礼,是非常需要勇气的。但是机会终究还
是出现了,AMD决定自行研发自己的64位处理器架构,并命名为x86-64。从这个名字
我们就能看出,AMD的64位指令系统是从x86扩充而来的,并且,AMD让新的64位
处理器兼容以往的32位指令集,也就是说,AMD的新处理器,不但是一颗64位处理器,
同时也是32位的。在AMD64结构中,出现了一个新的所谓“长模式(Long Mode)”,
作用是设置CPU按照64位方式运行。长模式的命名也许是参照了众人熟悉的“实模式”
和“32位模式”。长模式不仅指具有64位性能,而且寄存器还可以扩展为64位并加入
了新的寄存器。长模式是通过控制位来激活的,该控制位称为LMA(Long Mode Active)。
当LMA未被激活时,处理器运行在标准的x86模式下,可以运行的是16位或 32位的
OS和应用,而当LMA被激活后,64位扩展方式就可以执行了,这时就是新的64位
CPU。长模式还被划分为两种子模式,即“64位模式”和“兼容模式”。这两种子模式由
CS(Code Segment)寄存器中的D位和L位控制。“兼容模式”表示可以在64位模式下
运行16位或32位程序,这类似于386处理器中的虚拟86模式,旧的x86模式(32位
或16位)被称为“法定模式(Legal Mode)”。当进入64位长模式时 (LMA=1, CS.L=1
and CS.D=0),操作数的标准大小还是32 位,寻址却是64 位了。长模式的性能可以综
合概括为:虚拟的64位寻址,寄存器扩展到64位、附加的8个寄存器(R8-R15)、附加
的8个SIMD寄存器(XMM8-XMM15)、64位指令指针、Flat寻址模式。其中,附加的
新的SIMD寄存器使多媒体寄存器总数达到16个,弥补了x86结构中的薄弱环节。为了
使增加的寄存器更具有逻辑性,AMD采取的是一种对16位和32位寄存器的顺延方式。
这种方式提高了时钟速度使CPU性能更优。 相比于32位处理器,64位处理器的核心是
经过改进的,两者的异同主要有以下几点:一级缓存维持原有的128KB,其中64KB为
指令缓存,64KB为数据缓存。根据AMD64处理器的架构,二级缓存的寻址能力允许二
级缓存的容量在1MB到8MB之间。但尽管Athlon已经可以支持8MB的二级缓存,但
事实上AMD从来没有这样做。服务器市场是AMD64处理器的一个主攻目标,所以大于
1MB的二级缓存是十分有必要的。另外AMD未来还将会使用三级缓存。AMD64处理
器的管线长度比Athlon增加了两级,这使得它可以运行在更高的频率上。AMD64处理
器在分支预测单元上作了改进。AMD64处理器支持更大的翻译后备缓冲区
(Translational Lookaside Buffers,TLB)。以下分别做一个简单总结。 AMD 64位处理
器架构设计的首要目标是提供新一代的性能。体现这种设计思路最明显的例子就是
Opteron处理器改变了上一代处理器的流水线设计。流水线前端指令获取与解码逻辑标
识被精减,提供从解码器到执行管道调度程序间更大的指令打包程度。为适应这一改变,
设计中重新定义了管道分级以保持高度的频率可测量性,结果比第七代微架构多出两个管
道分级,最终产品拥有12级整数运算流水线和17级浮点运算流水线。在延长流水线得
到频率提升的同时,考虑到处理器架构的扩展性,Opteron处理器最初将采用0.13微米
的SOI(Silicon on Insulator,绝缘硅)工艺进行生产。随着低于0.10微米工艺的采用,
频率也会实现相应的提升。最终决定Opteron性能提升的关键因素是Opteron微架构比
以前的微架构具有更高的IPC(每时钟执行指令数)值。 同时,AMD的64位处理器还
集成了内存控制器,这在传统上是由北桥完成的,也就是说传统上北桥是处理器和内存之
间的“中转站”,北桥通过内存总线驱动内存读写,再通过处理器总线也就是前测总线
(FSB,Front Side Bus)将数据转发给CPU。这种机制在增强处理器兼容性和降低设计
难度的同时必然带来了效率低和带宽限制。在处理器微架构性能提升方面,如何在降低访
问延迟的同时提供给处理器内核足够的内存带宽,成为性能提升的最大瓶颈之一。在
AMD的新处理器中驱动内存的工作直接由处理器接管了,也就是说,这种处理器不再有
传统上的前测总线的概念,当然也就没有因此而来的带宽限制。Opteron微架构集成了
一个双通道的DDR控制器,该控制器拥有能够支持多达8个DDR DIMM(每通道4个)
的128位接口。内存控制器最初的设计是使用非缓冲或注册型(registered) DIMM来支
持PC1600、PC2100和PC2700 DDR内存。以PC2700为例,这种条件下处理器的有
效带宽可高达5.3GB/s。这一直接连接方式能够显著降低处理器的内存延迟,并且随着处
理器频率的提升内存延迟会进一步降低。此外,还能使硬件与软件预取具有更高的带宽利
用率,从而达到进一步降低处理器有效内存延迟的目标。集成在Opteron处理器内的内
存控制器在多处理器系统中有更加惊人的表现。运用并行连接方式的多处理器,每个都拥
有自己的有效内存带宽,随着处理器数目的递增,使系统性能具有良好的扩展性。在一个
4路处理器的多处理系统中,系统能够支持多达32个DIMM,在使用PC2700内存时可
以提供高达21.3GB/s的系统有效带宽,真是惊人!! 与此同时,还有AMD大名鼎鼎的
HyperTransport(超传输)技术,HyperTranport技术为嵌入式应用提供了高性能的数
据传输方案。通过HyperTransport技术,电脑内部芯片(网络和通讯设备之间的通讯)传
输带宽最多可以达到现有技术标准的40倍。而且HyperTransport的特别设计还可应用
于0.13微米级芯片技术。HyperTransport的目的并不是取代其它的I/O技术,它只是
提供了一种高标准基础上的端到端内部连接标准以满足内存以及I/O原件的数据传输需要,
并且可以用于连接传统的低速I/O设备和最新的高速I/O媒介。与把内存控制器集成到处
理器内部来提升内存带宽的方法一样,HyperTransport互连控制器也被集成到Opteron
处理器内部,在处理器和I/O子系统之间提供了拓展性极强的数据连接带宽。在
Opteron处理器内部的数据通道为双向16位的通讯,可以达到1600MT/s(每秒百万次
传送)的工作效率,可提供双向为6.4GB/s的带宽。在Socket 754/940时代,AMD 64
位系列处理器支持的HyperTransport频率仅仅为800MHz,而在最新的Socket 939系
列处理器上,支持的HyperTransport频率已经达到1000MHz,这也就是为什么高端的
Socket 939处理器比同频同规格的Socket 940处理器性能要有一定程度提高的原因。
在这种全新的架构中,HyperTransport总线的频率通常为传统内存总线频率的数倍,所
以能够提供的带宽也就非常高。这样以来,Athlon 64处理器在内存带宽方面就摆脱了天
生的缺憾,从而能够有利于进一步的提高整体系统的性能。HyperTransport频率从最低
的600MHz到最高的1000MHz,能够提供最高到8GB/s的带宽。
针对大工作负荷的TLB子系统与增强型分支预测功能,Opteron微架构的TLB和前
几代AMD处理器微架构相比,除了具有更大的TLB入口规模,及随之带来的更少的延迟
之外,还带有无须软件干预的多进程过滤器来共享TLB。Opteron处理器的分支预测功
能的增强使性能得到很大的提升,在较大的工作负荷下性能提升尤其明显。它主要是通过
把全局历史计数器中的双峰计数器的数量增至16K(这等同于第七代微架构的4倍)得以
实现。 在对32位x86-32指令集的增强方面,Opteron处理器微架构能支持全部32位
x86标准架构的增强指令,包括Intel MMX和AMD的专业3DNow! 技术(整合了增强
型3DNow!技术和SSE)。另外,AMD Opteron处理器还引入了对SSE2指令的支持。
然而AMD新一代处理器的研发过程并不顺利,处理器的一再延期推出不但使芯片组供应
商陷入了进退两难的境地,同时也引发了媒体的种种猜测——难道AMD真要倒下去了吗?
随着AthlonXP渐渐走向迟暮,改进的Barton核心在来势汹汹的Pentium4面前颇有螳
臂当车的味道,AMD近几个季度的巨额亏损也暴露了这一问题。AMD自己也清楚新一
代处理器的上市时间是越快越好,只有这样才可能扭转目前的困境,然而作为一款蕴含了
多种创新技术的产品,研发过程中所要面对的难题自然也会更多。Hammer一再延期的
原因不在于32位/64位的指令兼容和效能问题,而是长期阻碍AMD处理器频率提升的
制造工艺问题——主要是绝缘硅(SOI)技术的应用,以至于很长一段时间AMD只能拿出
800MHz的样品用作展示和媒体测试。2003年初与IBM的技术合作解决了AMD在SOI
使用上的燃眉之急,Opteron和Athlon 64处理器的频率也得以提高到较合理的水平。
另一方面,由于新处理器整合了内存控制器,而在研发过程中内存标准进行了多次升级,
并且双通道内存技术成为了主流,因此AMD也不得不临时修改了新处理器的内存控制器
架构,这也给Athlon64的按时上市增加了难度。但不管如何,AMD成动了,它发布的
Opteron处理器(在研发的时候叫做K8,核心代号Hammer大锤)迅速被市场所接受,
在一年之内,AMD推出了三个系列的64位处理器:面向服务器和工作站的Opteron系
列,这个系列的处理器集成双通道DDR控制器,只支持带ECC校验的内存;面向发烧友
和顶级个人电脑的Athlon FX系列(双通道DDR控制器,支持带或者不带ECC校验的
内存)和面向高性能、低价格桌面电脑的Athlon 64系列(单通道DDR控制器,支持不
带ECC校验的内存),并且正在推出面向笔记本市场的Moblie Athlon 64系列,如狼似
虎的抢夺64位计算进入个人电脑领域所产生的丰厚回报。 AMD的64位处理器一共有
三个系列,或者说按照市场需要的不同划分成了三个档次。有趣的是,AMD在64位处
理器的针脚上放弃了自己在Socket462上从一而终的良好生活作风,大玩儿特玩儿Intel
擅长的强制分级游戏,在短短一年的时间里,推出了三种用于64位处理器的针脚规格。
刚发布的时候,对于高端的Opteron是采用Socket940的规格,共有940个针脚,比
Socket462多了一倍也还不止,一般处理器的针脚都排列在四周,中间留下一块空间,
但是我们在Socket940的CPU上看到,由于针脚实在太多,处理器背面已经被密密麻麻
的针脚占满了。对于低端的Athlon 64,最初是采用Socket754的754根针脚,后来又
出现了Socket939的规格,而且这种规格的处理器,不但有Athlon 64,同时还有
Athlon FX,这在客观上为消费者选择AMD的处理器造成了困难。Socket 940的针脚数
量和Socket 939虽然只有一根的区别,但是在针脚位置的安排上却有着比较大的不同,
也就是说Socket 940接口并不是由Socket 939接口在某一个位置增加一根针得来的,
这两种接口没办法做到互相兼容。 从AMD发展的蓝图上我们可以大概这样预测,
Socket940接口会留给Opteron系列(双通道ECC内存),现有的940接口Athlon FX
会慢慢消失,后面发布的Athlon FX系列(双通道普通内存)全会是939接口,而754
接口的处理器都是Athlon 64(单通道普通内存),直到明年初754接口被AMD淘汰掉,
Athlon 64可能也就完成了历史使命。以上的对应关系也有一些例外,现有的Athlon FX
处理器有一些是采用940接口,同时,高频的Athlon 64处理器也有939接口的。 在设
计上Operton是为了服务器和工作站市场的,所以多处理器功能就成为必不可少的要素
了。Operton分为100、200和800三个不同的系列,100系列不能并行处理,200系
列支持一路和两路并行处理,800系列则支持一路、两路、四路和八路并行处理,是
Operton系列中的高端型号。除了并行处理,AMD在高端的Operton系列中还埋伏了
一道伏笔,就是双核心能力,这是专为对付Intel的HyperThreading超线程技术准备的。
Intel目前在其处理器中加入的超线程技术实质也是一种多核心架构理念,主要是希望解
决缓存命中问题,但该技术并没有像先前芯片工程师预想的那么高效。超线程技术原理是
能够在单核心处理器中建立多指令执行单元,如果其中一个执行单元出现缓存命中失败问
题,其他单元也许可以保证正常工作。但在实际使用中发现,经常会出现两个执行单元数
据冲突的现象,所以并没有很大的提高效率。AMD的双核心的设计则不会出现上面的情
况,因为两个处理器各自配备缓存,争夺的焦点主要集中在与主内存的数据交换上。预计
AMD将在2004年底展示其双核心处理器样品。 Athlon FX虽然不能够支持双内核,但
是它按照运算速度的不同,也分为不同的型号,最先推出的为Athlon FX-51,采用SOI
130nm工艺,频率是2.2GHz,然后是Athlon FX-53、Athlon FX-55等,至于三个系
列中的Athlon 64,它的分级方法是按照AMD传统的PR值,从3200+(130nm工艺,
频率2.0GHz)开始,3400+、3500+、3600+、3700+、3800+…………等等。对应于
三种不同接口,AMD在每个系列上都采用了不同的命名方式,真不知道他们在搞什么。
在新的939针的Athlon FX/Athlon 64处理器和将来要发布的940针Operton处理器
中,AMD新增了一个重要的硬件级病毒防护功能,这项功能是Intel、AMD和微软三家
为了应付层出不穷的病毒软件而特别制定的。我们知道,缓冲区溢出是病毒攻击的首要手
段,但是讨厌的是这个手段虽然广为人知,却苦无一劳永逸的解决之道,逼得微软只能越
来越频繁地发布补丁,有了这项技术,这一切都会全面改观了。AMD把这个功能叫做
“Execution Protection”(Intel的叫法略有不同),它是一个被集成在CPU内部的锁定
机构,当操作系统激活这个功能时,CPU缓冲区的数据将会只读,而不能执行,这可以
有效防治病毒的缓冲区溢出攻击。目前的CPU是做不到这一点的,只能任由病毒肆虐。
激活了该功能后,计算机用户对数据安全所花费的心思将会大大减少,病毒库更新将不再
那么频繁,而更新更加频繁的Windows补丁,很大一部分都变得不再必要。操作系统依
靠“吃补丁”生存的习惯也就得以改变。WIndows XP的Service Pack 2支持并实现
AMD 64处理器中的病毒保护功能。这项硬件防病毒功能的具体作用有多大,我们评测室
正在策划一项测试。 至于研发核心,则是一个相当复杂的问题。总体来讲,AMD 64位
处理器在研发计划叫做K8(上一代叫K7),其中Operton第一代核心叫做
SledgeHammer(1MB二级缓存/核心面积193平方毫米),而第二代核心则比较混乱,
100系列单路(不支持并行处理)核心叫做维纳斯(Venus),200系列核心叫做特络伊
(Troy),800系列核心叫做雅典(Athens)。到2005年,AMD将会推出单路丹麦
(Danmark)核心、两路意大利(Italy)核心和八路埃及(Egypt)核心的第三代
Operton,要注意,第三代核心不管能不能并行处理,都是双内核的。真够乱套的。
Athlon FX系列和Opteron有着说不清的血缘关系,先推出的940针和最近推出的939
针的Athlon FX都是SledgeHammer核心(1MB二级缓存/核心面积193平方毫米),
下一代看来发展路线会与Operton分道扬镳,自行推出2005年上半年发布的圣地亚哥
(San Diego),第四代将变成双内核的托莱多(Toledo),2005年内发布。至于Athlon
64系列,第一代核心叫做ClawHammer(1MB二级缓存/核心面积193平方毫米),现
在第二代核心纽卡斯尔(NewCastle)(512KB二级缓存/核心面积144平方毫米)也已
经发布了,至于下一代,按照AMD的规划将采用温彻斯特(Winchester)核心,这是
单内核的,且不能并行处理。 光有CPU是没有意义的,在配套芯片组方面AMD也下了
很大工夫。芯片组对于AMD的Opteron以及Athlon64而言是极为重要的,因为对于
如今的PC架构而言,决定整体性能的关键已经不仅仅是CPU,芯片组同样不可忽视。客
观而言,芯片组的设计难度还是在处理器之下,但是需要考虑的问题很多,而以AMD在
芯片组设计方面显然是没有太多精力。因此AMD很需要VIA、SiS、ALi以及NVIDIA提
供的相关配合,使之能够集中精力,全力以赴地做好AMD64位处理器的研发工作。每当
AMD新推出一款处理器,它首先都会配上相应的芯片组,K6时期的AMD 640芯片组,
Athlon K7时期的AMD 750/760芯片组,Athlon MP时期的AMD 760MP/MPX芯片
组,这些都为AMD处理器站稳脚跟立下了汗马功劳。有趣的是,一旦VIA、SiS、Ali以
及NVIDIA推出更为成熟的芯片组,AMD总是功成身退,更多地扮演技术指引的角色,
同时为第三方芯片组厂商赢得充足的开发时间。 K8芯片组也不例外,AMD 8000芯片组
率先推出,充当Opteron的开道锣手,而紧随其后的VIA、SiS、ALi以及NVIDIA则纷
纷跟进。威盛在AMD发布Athlon 64处理器的同时就发布了K8T400,后来又发布了
K8T800和整合芯片组K8M800,2004年5月,为了更好的支持AMD刚刚发布的
Socket 939接口的处理器,威盛推出了K8T800芯片组的升级版本K8T800 Pro芯片组。
K8T800 Pro相对于K8T800做了两个重要的改进。首先是其AGP和PCI时钟相对于
HyperTransport总线来说是独立的,这意味着AGP总线频率和PCI总线频率都可以自
由调节,对于超频玩家来说是一项很重要的改进,它可以让玩家尽可能的挖掘CPU的超
频潜力,而不会因为系统的其它设备影响超频的结果。K8T800 Pro的第二个重要的改进
是支持1GHz的HyperTransport总线。这意味着北桥芯片同CPU对话的速度比以前更
快。K8T800支持双向16-bit、800MHz HyperTransport总线连接,因此其理论上的峰
值传输带宽为6.4GB/s。K8T800 Pro则支持双向16-bit HT总线连接,这意味着CPU
和北桥之间以1GHz总线连接时的峰值带宽为8GB/s。相对K8T800,K8T800 Pro还有
如下几点的改进:首先是总线接口采用了更灵活的异步方式,而K8T800只支持同步模式;
第二是K8T800 Pro南北之桥间的联系采用了新一代的V-LINK技术,最大速率可以达到
1066MB/s,比之前提高了1倍;另外一点K8T800 Pro支持最新的Socket939接口。
还兼容Socket 754接口以及Socket 940接口,当然最终产品支持哪种接口的处理器是
由主板上提供的CPU插座决定的,尽管这些主板可能都采用K8T800 Pro芯片组。一般
来讲,K8T800 pro会搭配VT8237南桥芯片,此芯片提供AC'97 VERSION2.2的6声
道声卡、两个ATA133 IDE接口、两个SATA150的接口,并为此接口提供了RAID功能、
六个主控(BUS MASTER)PCI接口、八个USB 2.0/1.1接口、通过LPC IT8705F的超
级I/O芯片,提供软驱、红外线、两个串口、并口、游戏/MIDI和硬件监测接口。此外,
还要加上PS/2键盘和鼠标接口。K8T800pro不支持PCI-E,因此威盛还将推出K8T890
芯片,除了支持到1GHz HyperTransport总线之外,还同时支持AGP8X和PCI-
Express 16x,让没有升级到PCI-Express 16x显示卡的用户也可以继续使用目前的
AGP8X显示卡。另外,整合型的K8M890也将同时推出。 nVIDIA作为AMD重要的合
作伙伴,在AMD 64位芯片组方面的动作十分积极,主要也是由于ATi和Intel走的很近。
nForce3系列芯片组成为AMD推荐的64位平台。nVIDIA公司推出了基于Opteron平
台的nForce3 Pro 150以及nForce3 Pro 250芯片组(nForce3 150是第一个单芯片设
计的64位主板芯片组。该产品采用单芯片设计主要是因为对北桥芯片性能影响最大的因
素——内存控制器已经内建在Athlon 64系列CPU中,北桥的概念也因此淡化。此外,
nForce3集成了AGP 8X控制器,USB2.0控制器,提供了两个Fast ATA133控制器并且
提供了对RAID 0模式磁盘阵列的支持以及对PCI 2.3规范的支持。),针对Athlon64处
理器平台NVIDIA还将推出Crush K8系列芯片组,包括nVIDIA Crush K8、nVIDIA
Crush K8S、nVIDIA Crush K8 Pro、nVIDIA Crush K8 3GIO、nVIDIA Crush K8G3等。
其中,Crush 3GIO支持PCI Express X16图形接口。此外它还支持4个PCI Express X1
总线扩展槽,实际上就是一个PCI Express控制器。Crush K8G3则是在Crush 3GIO的
基础上整合了FX5600级别的图形核心,可以提供较为理想的图形性能。 Crush 3GIO和
Crush K8G3都将与Crush K8-04南桥搭配,通过HyperTransport总线连接南北桥。
Crush K8-04南桥可支持4个Serial ATA和4个ATA 133接口,支持NV RAID功能,
直接整合了千兆以太网和无线网络技术,并支持网络防火墙。此外,Crush K8-04支持
24bit/96kHz的7.1声道Azalia声效,提供8个USB 2.0接口。 ATI则是在Intel和
AMD两个平台积极的耕耘,基于AMD64位平台的芯片组规划有集成了Radeon 9600
级别的图形核心的RS480,支持PCI Express,以及没有集成图形内核的RX480,
RX480和RS480都可以同SB400或SB450南桥搭配。新品于2004年第一季度出样,
第二或第三季度开始批量生产。
SiS也已经在AMD 64位平台也推出面向主流高性能平台的SiS755,面向高端高性
能平台的SiS755FX,以及整合图形芯片的SiS760。这三款芯片组都会搭配SiS964南桥、
1GB的MultIO的南北桥总线、支持AGP8X、支持ATA133和SATA150、支持USB2.0、
支持800MHz的HT总线频率、支持单通道内存(960还将支持双通道内存)。由于最重
要的内存控制器集成到了CPU内部,SiS北桥对性能的影响程度减小了,它只需要控制
AGP以及Hyper Transport和妙渠技术(MuTIOL)就可以了。SiS在这方面做了大量的
准备工作,一方面通过妙渠技术(MuTIOL)提升南北桥之间的总线带宽,另一方面则通
过HyperStreaming引擎技术提升数据传输效率。SiS在2004年还将推出的SiS756和
SiS761两款芯片组,均支持Athlon 64处理器,其HyperTransport总线从800MHz提
升到1000MHz,单向传输速率高达2000Mb/s,SiS761更是整合了DX9图形内核。
SiS756是SiS755系列的下一代产品,它的规格同K8T890相当,支持PCI Express X16
图形接口。SiS756搭配的南桥芯片是SiS965和SiS966,配合ASHE技术可获得更高的
磁盘效能,而在其它功能方面SiS756芯片组也丝毫不弱:Serial ATA RAID、PCI
Express X1扩展槽、千兆网络、USB 2.0及IEEE 1394等功能一应俱全。SiS761是
SiS756的整合版本,也是SiS760的升级版本,所整合的图形核心与Prescott平台的
SiS 662相同,均可支持DirectX9 API,至于3D性能还有待验证。 关于SiS还要多说两
句,SiS在传统上是走物美价廉的路线,但是现在看来,它的AMD芯片组可不是省油的
灯,其性能基本上可以跟任何一个强劲的对手包括VIA、nVIDIA、ATi相抗衡,而且感觉
上有点儿青出于蓝胜于蓝的势头。现在,我认为是一些主流主板厂商应该放更多注意力在
SiS身上的最佳时机,按照现有的性能表现,再加上SiS一贯的低价格,我认为完全可能
通过SiS打出一块市场。 64位的操作系统,现在看来也不是问题。运行在PC机上的操
作系统很多,Windows就有好几种,Linux更是不计其数,再加上Solaris、BSD三兄弟
(FreeBSD、OpenBSD、NetBSD)、OS/2、DarWin、QNX、SCO UNIX等等等等,
简直是数不胜数。但是主流的只有Windows和Linux。64位的Linux内核已经发布了,
SuSE和RedHat等Linux大家都已经推出了自己的64位Linux产品,Windows方面,
不少人都认为它在64中毫无建树,在这里必须要为微软正名。微软在2001年就推出了
Windows2000 DataCenter的64位版本,是为Intel安腾服务器推出的IA-64架构的操
作系统,不能运行在个人电脑上,到了2003年,Windows Server 2003推出了四个版
本,分别是专业版、web服务器版、企业版和数据中心版;其中企业版和数据中心版都
有32位和运行于安腾之上的64位两个版本,同时Windows XP也有64位的安腾工作
站版,应该说微软在64位的路上是先行者(正如Intel一样)。实际上,微软的比尔盖茨
是64位计算的忠实拥护者,他说“64位已经来到”可不是一次两次了。当然,微软也看
出来了跟着Intel走比较危险,2003年9月,微软为AMD推出了Windows XP的64
位测试版本,2004年1月,又推出了Windows Server 2003的64位测试版本,当时
微软的说法是2004年中以前推出正式板,现在看来延期了。有人说是年底之前出,危险
的是不管是AMD还是微软都对此事闭口不提,说不出个所以然来。至于这个延期有没有
Intel的关系还不好说,Intel是这样的,它的安腾实在抗不住了,终于发布了兼容x86-
64的核心叫Nocona的64位至强处理器,上演了一场两个64位处理器(至强vs安腾)
同门相残的惨剧。 新至强的指令集和AMD 64几乎是一模一样的,在2004年IDF会议
上发布时叫做IA-32E,也就是此前网上纷纷传言的Yamhill技术。和AMD x86-64一样,
Intel的IA-32E技术是在原有IA32构架基础上以最小的改动实现对64-bit寻址能力的支
持,实际是对原有IA32处理器构架体系的增强设计,同时又兼顾了新构架对原有的IA32
构架下开发的32bit甚至16bit代码的支持。IA-32E通过删除INC/DEC两个指令实现
REX prefix,提供64位模式下新增寄存器的指令编码空间,64位通用寄存器(GPR)以及
SSE/SSE-2/SSE-3寄存器(XMM)都增加8组。另外,新增64位平面寻址模式、中断优
先权控制机制以及RIP-Relative寻址模式,这些也都与AMD x86-64完全相同。IA-32E
提供64位模式和兼容模式,64位模式支持64位的操作系统、应用程序、驱动程序、平
滑虚拟寻址空间(flat virtual address space)和通用寄存器(general-purpose registers,
GPR),兼容模式支持64位的操作系统和驱动程序,应用程序和通用寄存器会支持32位
环境,提供4GB的寻址空间。兼容模式将不支持IA-32架构的虚拟8086模式(Virtual-
8086 Mode)和实模式(Real Mode),许多DOS的设备驱动程序将无法作用。以微软操
作系统为例,Windows Me和以上已经移除实模式程序代码,所以不会受连累,但MS-
DOS、Windows 95/98会受到影响。从上面来说,IA-32E可以兼容于AMD x86-64。
毕竟目前AMD64已经获得了业界的广泛支持,这让Intel采用AMD的x86-64架构变
成了必然的选择。由于英特尔在过去与AMD签署过关于x86指令集交互授权协议,所以
英特尔可以采用AMD x86-64而不必交付权利金。 不过,IA-32E和AMD x86-64依然
有着不同之处,比较明显的差别是:AMD x86-64有3DNow!,Intel没有;Intel拥有
SSE-3,AMD x86-64还没有。不过,这些都是小差距,双方要加入这些功能并不会有什
么困难。微软和英特尔宣称操作系统将可互相兼容并不是没有理由的,这也是软件厂商最
欢迎的结果。这种结果恐怕也是唯一的选择,因为谁都无法承受为Intel和AMD分别编
写程序的代价,微软就表示已经有了两个64位操作系统(真可怜!!),不会再为第三个
64位架构写操作系统,连微软尚且如此,其它软件厂商就更不用提了吧。 64位的操作系
统,需要专门的64位驱动程序,这方面就比较差了,实际上这也是AMD的软肋,它的
影响力不够,大家都抱着观望的态度,跟着它跑的厂商不多,所以为64位操作系统编写
的驱动到现在还是远远不够丰富,当然一些大厂,比如Nvidia和ATi,都已经发布了64
位的驱动程序,要解决这个问题,微软的帮助对于AMD是至关重要的。相信在正式发布
64位Windows的时候,大多数驱动都已经有64位了,这是因为微软为了新操作系统推
出时的竞争力和兼容性,会花很大力气去完善WHQL库的规模。 最后而且是最终能够决
定AMD 64位处理器命运的,就是64位应用程序,我们知道安腾的挫折主要就是因为为
它编写的程序太少,据说到现在只有几百款,而在SUN的Solaris操作系统(也是64位
的)上运行的程序已经上万款了,在个人电脑上这个相应的数字是几百万款。其实,对于
使用者来讲,64位处理器、64位系统、64位驱动程序等等全都是不可见的,可见的只
有利用这些操作环境运行的64位应用软件,没有应用程序,什么都是白搭。对于AMD
64处理器来讲,它有个大的优势在于不但64位性能强劲,32位性能也很强,刚才我们
说过了,它同时也是一颗32位处理器。因此,在现在的阶段,大家都是在32位的应用
环境下使用,其实根本没有发挥它全部的潜力(这也说明了它惊人的实力)。但是这毕竟
不是长久之计,没有64位的应用环境,64位处理器就像离开水的鱼,是没有生存和发展
空间的。 到今天为止,为64位编写的软件数目还很少。这里就要说到这篇东西,本来这
应该是一篇64位处理器的64位表现评测,请注意是64位表现,关于AMD 64的评测
已经实在太多了,但通通都是把它当成32位处理器测的,使用了32位的系统、驱动和
测试软件,测出来的当然是它在32位环境下的性能表现,也就是上面说的寄存器
LMA=0,长模式没激活,所有寄存器工作在32位下,所有64位专用寄存器不可用的情
况下的性能,如果大家看过白皮书,就会发现从内核而言这时的处理器和Athlon XP几
乎是完全一样的(当然多了一些管线、Hyper Transpot、内存直接吞吐等功能)。因此我
从一开始就并不想做这样的测试,但是到最后,也没能做成64位测试,主要是因为64
位的软件太少了,测是软件就更少,游戏几乎没有——但不是完全没有,Unreal
Tourament 2004已经放出了64位demo,是Linux版本,Windows的64位游戏还没
有,很多厂商说正在做,但也有消息说DOOM3将不会推出64位版。至于在64位系统
上运行32位测试软件和32位游戏——因为64位的Windows是向下兼容的,因此可以
将32位软件运行在64位操作系统上——则并没有测试意义,所有的软件在64位环境
下运行,都会面临效率下降的问题,原因很简单,64位系统并不是位32位软件设计的,
与32位系统情况不同(那时处理器运行在32位模式下实际上就是一颗32位CPU),此
时处理器是在长模式下运行的,用兼容32位运行,效率并不高。 总之,32位系统+32
位测试,不是本文的目标,64位系统+32位测试,效率会下降,而且也不是目标,64位
系统+64位测试,目前看来,时机还并未成熟。AMD提供了一些数据,表明在真正64
位模式下处理器速度会大幅上升,这才是64位的应用前景,Intel在2005年之前,还不
会推出64位的桌面处理器,这一段时间对于AMD来讲是比较重要的。在64位的战役
中,AMD已经领先一步,能不能取得最终胜利,就取决于能不能迅速将64位的应用环
境变成熟,一旦成熟,那么江山就是铁打的了。但是,Intel只怕不会乐见其成吧?
2024年4月4日发(作者:鲜于鸿轩)
第一章 AMD的时间架构
1969年5月1日,公司成立。
1970年,Am2501开发完成。
1972年9月,开始生产晶圆,同年发行股票。
1973年1月,第一个生产基地落成在马来西亚。
1975年,AM9102进入RAM市场。
1976年,与Intel公司签署专利相互授权协议。
1977年,与西门子公司创建AMC公司。
1978年,一个组装生产基地的落成在马尼拉。同年AMD公司年营业额达1亿美元。
1979年,股票在纽约上市,奥斯丁生产基地落成。
1981年,AMD制造的芯片被用于建造航天飞机,同年决定与Intel公司扩大合作。
1982年,新式生产线(MMP)开始投入使用。
1983年,新加坡分公司成立,同年推出.1000质量标准。
1984年,曼谷生产基地建设并扩建奥斯丁工厂。
1985年,被列入财富500强。同年启动自由芯片计划。
1986年10月,AMD公司首次裁员。
1987年,索尼公司合作生产CMOS芯片,4月向INTEL提起诉讼,这场官司持续5
年,以AMD胜诉告终。
1988年10月,SDC基地开始动工。
1990年5月,Rich Previte成为公司的总裁兼首席执行官。
1991年3月,生产AM386 CPU。
1992年2月,AMD对Intel法律诉讼结束,AMD胜诉,获得生产386处理器的资
格。
1993年4月,开始生产闪存,同月,推出AM486
1994年1月,AMD与康柏公司合作,并供应AM485型 CPU。
1995年,Fab 25建成。
1996年,AMD收购NexGen。
1997年,AMD-K6出品。
1998年,K7处理器发布。
1999年,Athlon(速龙)处理器问世。
2000年,AMD在第一季度的销售额首次超过了10亿美元,打破了公司的销售记录,
同年Fab 30开始投入生产。
2001年,AMD推出面向服务器和工作站的AMD Athlon MP双处理器。
2002年,AMD收购Alchemy Semiconductor。
2003年,AMD推出面向服务器Opteron(皓龙)处理器,同年9月,推出第一款
桌面级的64位微处理器。
2005年,AMD叫阵英特尔要求在新加坡举办双核比试,AMD以Socket 939登报
围剿英特尔发出双核决斗挑战。
2006年,AMD发布了Socket AM2,以取代Socket 754和Socket 939。
2006年7月24日,AMD收购ATi。
2007年9月10日,K10处理器发布。
2008年10月8日,AMD宣布分拆成两家公司,一家专注于处理器设计,另一家负
责生产。
2010年,AMD(ATI)独立显示核心出货量取代NVIDIA成为世界第一。
2011年1月,AMD推出Fusion系列Bobcat APU芯片,是一颗芯片包含CPU(中
央处理器)及GPU(图像处理器)的组合,第一轮会有共4颗型号的芯片,GPU部份也
能真正支持1080p高清播放(硬件解码)。
2011年3月6日迪拜新进技术投资公司(ATIC)以4.25亿美元收购了 AMD 拥有
的格罗方德半导体股份有限公司余下的 8.8% 的股份,成为一家独立的芯片制造商,使
ATIC成为唯一持股者。
2011年9月30日,Bulldozer(推土机)产品以全新架构问世,并采用全新插槽
AM3+。该架构其实自2003年就已经有研发计划,唯因为经费不足,搁置到2011年发
布。
2012年,Plidiver(打桩机)架构自改良推土机架构而生。
2013年,AMD再次更换产品标识。
2013年5月22日,AMD正式宣布次世代主机“Xbox One”采用APU作为该主
机的单芯片解决方案。
2013年6月, Richland APU正式推出。
2014年1月,Kaveri APU正式推出。
第二章 AMD历史进程
AMD创办于1969年,当时公司的规模很小,但是从那时起到现在,AMD一直在
不断地发展,目前已经成为一家年收入高达24亿美元的跨国公司。下面将介绍决定
AMD发展方向的重要事件、推动AMD向前发展的主要力量,并按时间顺序回顾AMD
各年大事。
1969-74 - 寻找机会
在公司刚成立时,所有员工只能在创始人之一的JohnCarey的起居室中办公,但不
久他们便迁往美国加州圣克拉拉,租用一家地毯店铺后面的两个房间作为办公地点。到当
年9月份,AMD已经筹得所需的资金,可以开始生产,并迁往加州森尼韦尔的901
Thompson Place,这是AMD的第一个永久性办公地点。
在创办初期,AMD的主要业务是为其它公司重新设计产品,提高它们的速度和效率,
并以"第二供应商"的方式向市场提供这些产品。
1969年5月1日--AMD公司以10万美元的启动资金正式成立。
1969年9月--AMD公司迁往位于901 Thompson Place,Sunnyvale 的新总部。
1969年11月--Fab 1产出第一个优良芯片--Am9300,这是一款4位MSI移位寄
存器。
1970年5月--AMD成立一周年。这时AMD已经拥有54名员工和18种产品,但
是还没有销售额。
1970--推出一个自行开发的产品--Am2501。
1972年11月--开始在新落成的902 Thompson Place 厂房中生产晶圆。
1972年9月--AMD上市,以每股15美元的价格发行了52.5万股。
1973年1月--AMD在马来西亚槟榔屿设立了第一个海外生产基地,以进行大批量
生产。
1974--AMD以2650万美元的销售额结束第五个财年。
1974-79 - 定义未来
AMD在第二个五年的发展让全世界体会到了它最持久的优点--坚忍不拔。尽管美国
经济在1974到75年之间经历了一场严重的衰退,AMD公司的销售额也受到了一定的
影响,但是仍然在此期间增长到了1.68亿美元,这意味着平均年综合增长率超过60%。
1974--位于森尼韦尔的915 DeGuigne建成。
1975--AMD通过AM9102进入RAM市场。
1975--AMD的产品线加入8080A标准处理器和AM2900系列。
1976--AMD和Intel签署专利相互授权协议。
1977--西门子和AMD创建Advanced Micro Computers (AMC) 公司。
1978--AMD在马尼拉设立一个组装生产基地。
1978--AMD的销售额达到了一个重要的里程碑:年度总营业额达到1亿美元。
1978--奥斯丁生产基地开始动工。
1979--奥斯丁生产基地投入使用。
1979--AMD在纽约股票交易所上市。
1980 - 1983 - 寻求卓越
在20世纪80年代早期,两个著名的标志代表了AMD的处境。第一个是所谓的"芦
笋时代",它代表了该公司力求增加它向市场提供的专利产品数量的决心。与这种高利润
的农作物一样,专利产品的开发需要相当长的时间,但是最终会给前期投资带来满意的回
报。第二个标志是一个巨大的海浪。AMD将它作为"追赶潮流"招募活动的核心标志,并
用这股浪潮表示集成电路领域的一种不可阻挡的力量。
AMD的研发投资一直领先于业内其他厂商。在1981财年结束时,该公司的销售额
比1979财年增长了一倍以上。在此期间,AMD扩建了它的厂房和生产基地,并着重在
得克萨斯州建造新的生产设施。AMD在圣安东尼奥建起了新的生产基地,并扩建了奥斯
丁的厂房。AMD迅速地成为了全球半导体市场中的一个重要竞争者。
1981--AMD的芯片被用于建造哥伦比亚号航天飞机。
1981--圣安东尼奥生产基地建成。
1981--AMD和Intel决定延续并扩大他们原先的专利相互授权协议。
1982--奥斯丁的第一条只需4名员工的生产线(MMP)开始投入使用。
1982--AMD和Intel签署围绕iAPX86微处理器和周边设备的技术交换协议。
1983--AMD推出当时业内最高的质量标准.1000。
1984-1989 - 经受严峻考验
在1986年,变革大潮开始席卷整个行业。日本半导体厂商逐渐在内存市场中占据了
主导地位,而这个市场一直是AMD业务的主要支柱。同时,一场严重的经济衰退冲击了
整个计算机市场,限制了人们对于各种芯片的需求。AMD和半导体行业的其他公司都致
力于在日益艰难的市场环境中寻找新的竞争手段。
到了1989,Jerry Sanders开始考虑改革:改组整个公司,以求在新的市场中赢得
竞争优势。AMD开始通过设立亚微米研发中心,加强自己的亚微米制造能力。
1984--曼谷生产基地开始动工。
1984--奥斯丁的第二个厂房开始动工。
1985--AMD首次进入财富500强。
1985--位于奥斯丁的Fabs 14 和15投入使用。
1985--AMD启动自由芯片计划。
1986--AMD推出29300系列32位芯片。
1986--AMD推出业界第一款1M比特的EPROM。
1986年10月--由于长时间的经济衰退,AMD宣布了10多年来的首次裁员计划。
1987--AMD与sony公司共同设立了一家CMOS技术公司。
1987年4月--AMD向Intel公司提起法律诉讼。
1987年4月--AMD和 Monolithic Memories公司达成并购协议。
1988年10月--SDC开始动工。
1989年9月4日- 展开变革
AMD在这段时期的发展主要是通过提供越来越具竞争力的产品,不断地开发出对于
大批量生产至关重要的制造和处理技术,以及加强与战略性合作伙伴的合作关系而实现的。
在这段时期,与基础设施、软件、技术和OEM合作伙伴的合作关系非常重要,它使得
AMD能够带领整个行业向创新的平台和产品发展,在市场中再次引入竞争。
1995--富士-AMD半导体有限公司(FASL)的联合生产基地开始动工。
1995--Fab 25建成。
1996--AMD收购NexGen。
1996--AMD在德累斯顿动工修建Fab 30。
1997--AMD推出AMD-K6处理器。
1998--AMD在微处理器论坛上发布AMD速龙处理器(以前的代号为K7)。
1999--AMD推出AMD速龙处理器,它是业界第一款支持Microsoft Windows计
算的第七代处理器。
2000--AMD在第一季度的销售额首次超过了10亿美元,打破了公司的销售记录。
2000--AMD的Dresden Fab 30开始首次供货。
2001--AMD推出AMD 速龙 XP处理器。
2001--AMD推出面向服务器和工作站的AMD 速龙 MP 双处理器。
2002--AMD 和UMC宣布建立全面的伙伴关系,共同拥有和管理一个位于新加坡的
300-mm晶圆制造中心,并合作开发先进的处理技术设备。
2002--AMD收购Alchemy Semiconductor,建立个人连接解决方案业务部门。
2002--Hector Ruiz接替Jerry Sanders,担任AMD的首席执行官。
2002--AMD推出第一款基于MirrorBit(TM) 架构的闪存设备。
2003-AMD 推出面向服务器和工作站的AMD Opteron(TM)(皓龙) 处理器。
2003-AMD 推出面向台式电脑 和笔记簿电脑的AMD 速龙(TM) 64处理器。
2003-AMD推出 AMD 速龙(TM) 64 FX处理器. 使基于AMD 速龙(TM) 64 FX处理
器的系统能提供影院级计算性能。
2006至今--融聚与分拆
2006年7月24日AMD正式宣布54亿美元并购ATI,新公司将以AMD的名义运
作。
AMD2006年10月25日宣布完成对加拿大ATI公司价值约54亿美元的并购案。
根据双方交易条款,AMD以42亿美元现金和5700万股AMD普通股收购截止
2006年7月21日发行的ATI公司全部的普通股,通过此次并购, AMD在处理器领域
的领先技术将与ATI公司在图形处理、芯片组和消费电子领域的优势完美结合,AMD将
于2007年推出以客户为导向的技术平台,满足客户开发差异化解决方案的需求。
AMD同时将继续开发业界最好的处理器产品,让客户可以根据自身需求选择最佳的
技术组合;从2008年起,AMD将超越现有的技术布局,改造处理器技术,推出整合处
理器和绘图处理器的芯片平台。
2008年10月8日, AMD闪电宣布分拆其制造业务,与阿布扎比一家简称ATIC的
高科技投资公司合资成立名为Foundry的新制造公司,引起全球IT界的轰动。根据协议,
AMD将把德国德累斯顿的两家生产工厂以及相关的资产及知识产权全盘转入合资公司。
AMD将拥有合资公司44.4%股份,ATIC则持有其余股份。至此,AMD彻底转型为一家
芯片设计公司。
第三章 详介AMD发展历程 以下资料截止至2009年
作为排位在INTEL公司之后世界第二大CPU制造商的AMD,在X86时代,一直都
能够紧跟着INTEL的步伐,产品的技术与推出时间和INTEL相比并没有什么明显的差别,
以致与在那个时候,我们就知道有286、386和486,可是并没有详细地去分是INTEL
还是AMD,或者是CYRIX的。我们应该感激AMD这位一直以来都在不断努力,力图超
越自己和CPU巨人INTEL的急先锋。正因为有了AMD和其他公司在不断地给予INTEL
强有力的挑战,CPU才会如此快速地降低价格,而且CPU的发展也一日千里。
介绍AMD公司的产品,就要从他们从X86的“阴影”里面脱离出来的第一款产品:
K5说起。
由于INTEL在486之后就再也没有出过以阿拉伯数字命名的CPU,而是推出了一个
拉丁文的Pentium,AMD也被迫着改换门庭,另起炉灶,推出了自己设计并且生产的
K5CPU。
K5系列CPU的频率一共有六种:75/90/100/120/133/166,内部总线的频率和
Pentium差不多,都是60或者66MHz,至于倍频则全部都是1.5,核心电压都是3.3v。
作为一款与Pentium竞争的产品,AMD的确做得非常出色,虽然再浮点运算方面比起
INTEL的来说是略逊一筹,但是再整数运算方面却一点也不会比INTEL差,由于K5系列
CPU都内置了24KB的一级缓存,比Pentium内置的16KB多出了一半,因此在整数运
算和系统整体性能方面甚至要比同样时钟频率INTEL要高。 K6: 在INTEL发
表了新一代的P6结构CPU:Pentium Pro以及多能奔腾MMX之后,市场上继续出现
一款能够与两者相抗衡的产品。
在这个时候,AMD推出了自己研制的新产品棗K6。
K6这款CPU的设计指标是相当高的,从一开始,AMD就想利用K6的优秀性能将
Pentium比下去,K6具有MMX技术、更多的片上高级缓存(32K指令、32K数据)与
K5相比,可以平行地处理更多的指令,并运行在更高的时钟频率上。在整数运算方面,
AMD无疑是做得非常成功得,基于AMD的K6/233在Windows95的商业测试中性能
已相当接近PentiumII/233,但仍有几个百分点的落后。由于K6具有更大的L1缓存,
所以随着频率的增长,它能获得比Pentium MMX更显著的性能提升。K6稍微落后的地
方是在运行需要使用到MMX或FP(浮点指令)的应用程序方面,比起同样频率的
Pentium MMX,甚至没有MMX的奔腾都要差许多,这样就使K6在某些3D游戏方面
的表现远不如INTEL的出色了。另外,AMD的MMX单元一次只能处理一条指令,而
Intel的MMX单元能够处理两条指令。因此K6 在执行MMX指令和浮点指令时性能要
差一些。AMD没有象Intel那样为这些功能投入资源。浮点和MMX 性能主要取决于两
点:处理周期和吞吐量。处理周期是指从一个指令开始到完成所用的时间。这个性能描述
了处理器完成一个操作所需的时间。吞吐量指的是一定时间内可以开始进行处理的指令数
量;在一个管线化的乘法单元或浮点单元中,两个或多个操作可以并行执行,这增加了吞
吐量,但同时也延长了处理周期。所有Intel的CPU都具有完全管线化的MMX和浮点
单元,所以在每个时钟周期内都可以开始一个新的操作,虽然每个操作的结果可能在几个
时钟周期后才能出来。但执行一个长的顺序计算操作时(这种操作是典型的多媒体应用中
常用的),吞吐量比处理周期更重要。 AMD的K6在处理某些MMX操作的时候具有
比Intel的CPU更短的处理周期,但单个操作的吞吐量是一样的,而且较短的处理周期并
不能弥补K6不能同时处理两个MMX指令的不足。虽然Intel的MMX CPU可以同时处
理两个MMX指令,但它的MMX单元只含有一个乘法单元和一个移位单元,所以它不
能同时进行这些关键操作。而且同时只能有一个MMX指令操作内存和整数寄存器在浮点
处理方面起作用,因此K6在某些操作上的处理周期仍比Intel的短,但它每两个时钟周
期才能开始一个操作,而Intel的芯片可以每个周期开始一个。最终的结果是对于许多浮
点操作来说,AMD的芯片的吞吐量只能达到Intel芯片的一半。这种弱点在ZD 3D
WinMark 97 测试中充分的暴露了出来,这个测试综合了浮点运算,包括Pro/Engineer,
AutoCAD和一些PhotoShop 测试。在这些测试中,K6/233要比Pentium II/233 慢,
有时甚至比Pentium MMX/233慢。在3D WinMark 测试中,如果使用 软件模拟方式
来完成所有3-D任务,K6/233的性能只有Pentium II/233的三分之二,使用一个好的
3-D图形卡,这种差距缩小到18%,仍然相当可观。与Pentium MMX/233 比较,
K6/233在软件模拟方式下慢18%,使用好的图形卡也慢7%。 但是作为AMD对
INTEL的沉重一击,K6的确是光荣地完成了任务,市场在占有率因为这样而上升到了历
史的最高点。由于在一段时间里INTEL出现了放弃低端市场的念头,因此AMD的名声
可谓到达了颠峰!
K6系列CPU一共有五种频率,分别是:166/200/233/266/300,五种型号都采用
了66外频,但是后来推出的233/266/300已经可以通过升级主板的BIOS而支持100
外频,是CPU的性能得到了一个飞跃。在倍频方面,K6系列是从2.5~4.5不等,核心电
压则是有2.9,3.2,22三种,特别值得一提的是他们的一级缓存都提高到了64KB,比
MMX足足多了一倍,这也是K6的整数性能为什么要比MMX好的缘故了。
正所谓山雨欲来风满楼,AMD公司连续推出的好几款CPU的性能与INTEL公司的
都十分接近,这表明AMD已经有足够的实力来研制比INTEL更加先进,而且性能价格
比更加高的产品了,不出所料。
1998年中,AMD最新K6-2处理器正式推出。这是首款采用3DNow!技术的微软
视窗操作系统兼容型X86微处理器,内置3DNow!指令及超标量MMX功能,可以产生
栩栩如生的影象和图形效果、大屏幕的影音效果,并为用户带来更精彩的因特网经历。
K6-2从诞生的那一天起,就凭借其最新的技术得到了包括微软在内的各独立软/硬件供应
商的支持。这款K6-2是AMD公司自推出K6CPU后又推出的一款采用最新3DNow技
术的CPU,它采用了全新的硅晶体制造技术(学名叫CS44E IC,并用C4倒装),将硅晶
精度提高到了0.25微米,硬是将原来K6晶体面积(Die size)的168mm2降到了现在
的68mm2,同时晶体数量也增加了50万个(成为930万个),其余结构基本同K6相同,
L1 CACHE仍是64KB,但它的面积也比以前的小了,仅有原来的1/2大。此外它的工作
电压也从2.9/3.2伏降到了2.2伏,据推测,它的耗电量有可能还不到10瓦。并采用最
先进的3DNow技术。当前,随着新一代CPU运算速度的提升,以及许多新的显示芯片
纷纷内建了3D图形加速功能,毫无疑问,3D图形加速技术已成为98年的新主流。可是
谁才真正是3D运算的核心呢,看来CPU与显示卡厂商还有的比拼。
尽管Intel宣布了MMX指令集能够加速多媒体的应用,尤其是影像处理方面,不过
直到MMX一代为止,这还仅限于2D方面,3D的许多图形函数库的运作是不可能靠这
区区57组MMX指令集就可以实现了的,而且它还需要浮点运算指令的配合,更要花上
数百千行的程式执行码才能尽其职能。但事实上应用MMX加速的效应虽然也有,但极为
有限,偏偏MMX的规划又跟浮点运算的区域重叠,造成了MMX与FPU指令过于频繁
的切换,反而把MMX加速所节省下来的时间给抵消掉了!AMD在K6获得MMX指令
集支持后,就看到了这个问题的弊端。于是在它K6获得成功之后,AMD就提出了自己
的AMD 3D技术结构。一个3D影像实体的产生,依先后次序分为四个阶段:第一,是
应用软件或游戏软件提供3D环境的素材(类似于基本数据的传送),此部分着重浮点运
算;第二,是通过空间几何学,画出物品的框架与轮廓,此阶段仍然要靠浮点运算;第三,
进行视野修正(三角形修正法),依视角作形体的修正;最后再进行实体着色,画出真正
的3D立体实体。AMD的3D技术,就是针对第一阶段、第二阶段、第三阶段的重点部
分做加强支持,事实上这三部分也是比较依赖CPU的部分;至于第四阶段因为要涉及到
具体的着色、合成等运算,AMD就将其就完全交给3D加速卡去全权负责,因为各个显
卡厂商都有自己影像合成、着色方面的的独门秘诀,AMD想挤进去还做不到呢!这也比
较合理一些,业有所长,术有专攻嘛。怎么样,看了AMD的3D技术有何想法?别着急,
K6 3D从880万颗晶体加到了930万颗,它可是还增加了不少新功能啊。其中包括增加
Superscalar MMX Unit,现在K6 3D在一个时钟内可以执行解码/执行两条MMX指令。
而且不受指令配对的限制。(P55C/Pentium II中有个限制:不能在同时钟下执行两个
MMX乘法指令)增加24组专门为3D加速的新指令(AMD 3D指令集),它可以一道
指令执行多个浮点运算。针对此24组指令,它还可以加快3D影像处理、声音合成等的
执行速度,当然它的3D指令要配合3D加速卡才行。而且它不会再象MMX那样使用重
复的浮点运算的区域,造成指令的重叠了。100MHz的外部总线频率,它可以大幅度提
高CPU与L2 CACHE和DRAM之间的交换速度,进而提升整个系统的性能。
说到了K6-2,自然要向大家介绍一些有关3DNow!技术的知识: AMD为确保
系统发挥更高的三维图形性能而对x86处理器结构作了改进,3DNow!技术便是这个研发
过程的第一项成果。这项新技术可提高三维图形、多媒体、以及浮点运算密集的个人电脑
应用程序的运算能力,使“逼真的运算平台”成为现实。3DNow!是一组共21条新指令,
可采用单指令多数据(SIMD)及其它加强的性能以缓解主处理器与三维图形加速卡之间在
三维图形通道上所形成的传输瓶颈。3DNow!技术可加强三维图形通道前端的物理及几何
运算功能,使三维图形加速器可以全面发挥其性能。 由于K6-2处理器备有SIMD式的指
令以及双寄存器执行通道,因此可以在每一时钟周期内执行四个浮点运算。K6-2/333的
浮点性能最高可达1.333 Gflops,较Pentium Ⅱ 333及Pentium Ⅱ 400的浮点性能优
胜很多(这两款Pentium的最高浮点性能分别只有0.333 Gflop及0.4 Gflop)。AMD-K-
2-300可发挥1.2Gflop的最高浮点性能,若与最高性能只有0.3 Gflop的Pentium Ⅱ
300比较,K6-2-300的三维处理性能要高3倍。在3DNow!技术的支持之下,供应商可
开发性能更强劲的软硬件应用方案,Windows兼容型个人电脑可以发挥更卓越的三维图
形性能及更逼真的视觉效果。3DNow!若与各大三维图形加速器配合使用,可发挥各种不
同的优点,其中包括以更高的帧速率播放高清晰度画面、建造更接近真实世界的物理模型、
更逼真的三维图形及影像、以及可与影院媲美的影音效果。在制定3DNow!技术标准及整
个计划执行的过程中,Microsoft、应用程序开发商、图形供应商、以及x86处理器供应
商均提供意见,整个计划获得业界广泛支持。3DNow!技术可与现在的x86软件兼容,经
过优化,适用于3DNow!技术的应用程序可以与现时所有的操作系统配合运行。
由此可见,AMD公司的产品是首次在整数性能以及浮点运算性能上同时超越INTEL,
这是何等令人兴奋的消息,也正是因为K6-2的推出,让INTEL感觉到了危机感,不但
CPU的价格一路下降,而且本已经打算停止生产的赛扬系列CPU又推出了最新版本棗内
置128KB一级缓存的赛扬A。让我们广大的电脑爱好者欣喜若狂!
再说回去K6-2,它的频率目前也是有五种:266/300/333/350/400,核心电压都是
2.2伏特,所以发热量比较低,一级缓存比起K6没有丝毫的改变,同样是64KB,不过在
这五种型号里面,我们应该注意一下K6-2-400,可以这样说,它是目前CPU市场上性
能价格比最高的产品,为什么?且听我慢慢道来: K6-2自从上市以来一直被超频爱
好者所“不齿”,就是因为它的超频性能不好,但是K6-2-400的发布却是值得我们骄傲
的,我拿到一块K6-2 400的样品之后马上对其进行测试,使我惊奇的发现,这颗小小的
芯片竟有如此潜能,一举甩掉了K6-2不好超频的历史,足以与和PII争个你死我活。
当Intel Celeron 300A 以其最优的性价比赢得市场后,K6-2的日子越来越不好过了,
具有重大意义的K6-2 400也就在这个时候横空出世,如果你说AMD K6-2的优势何在?
可能就是它的低价格和接近PII的高性能。可自从Intel Celeron 300A 处理器的产生,改
变了INTEL一贯的高价格,并且赛扬的价格比K6-2还要低,这时K6-2的价格可没有任
何优势可言,但同频率的赛扬在综合性能和K6-2还有一点差距,这对K6-2来说可能是
个好消息。但别望了,赛扬的超级超频能力可以说有此疯狂的地步。Intel Celeron 266
可以超到450MHz,Intel Celeron 300可以超到500MHz,这不能不说对K6-2是个压
力。为此,K6-2自从K6-2 350后,就开始注重芯片潜在的能力的研制和开发。在今天
他推出的K6-2 400就能说明这一点。K6-2 350可以上400MHz,甚至有人超到
450MHz,而更让我们惊奇的是K6-2 400可以超到500MHz(准确地说是504MHz),
我甚至向更高的550MHz冲剌,可是失败了,开机能自检为550MHz,但一会就当机了。
对于超频的方法在往后再慢慢阐述,我要声明的是,K6-2 400超到500后系统非常稳定,
能完整地通过全面测试,至少我是这样。 经过详细测试,赛扬300A已被锁死在
100x4.5上,而Celeron 333Mhz 已被锁死在100 x5之上。而且测试之后还可以看出
K6-2 和Celeron 只差 0.97%,可以忽略不计,要知道因为PII的L2快取是主频的一半,
在500MHz时即为250MHz,而此时的K6-2 500MHz的L2快取还是100MHz,所以
K6的分数低一点也是有原因的,至于3D图形性能实在太令我吃惊了,K6-2的性能居然
超过了对手33%,性能的巨大提升不能不说明了AMD的实力,尤其是K6-2的3D
NOW!K6-2 400的性能表现非常出色,它能更好地实现性能和价格两者的关系,这使
我们在选购电脑时又多了一种选择,并且延长了S7主板的寿命。
K7 是AMD公司刚刚推出不久的全新CPUMD目前采用3D NOW!指令集的
K6-2处理器,广受好评。而新一代功能强大的K7继续采用3D NOW!指令集。
AMDK7采用200MHz的外频!而Inter公司明年有可能只会推出133MHz外频的处理
器。AMD甚至表示,2000年时,将会推出基于1000MHz外频的产品。而且在K7的设
计之中,AMD放弃了一直都沿用的Socket 7结构,转向将采用卡匣式结构,这样看起
来,AMD K7更像是PII了。据AMD所公布的资料显示,K7第一个版本采用的是0.25
微米的制造技术,而后将采用0.18微米新工艺。K7加强了整数、浮点运算和多媒体运算
的能力,具有每次可发出九条指令的超阶层微架构、超阶层管线的浮点运算单元。K7并
没有采用INTEL的GTL+系统总线协议,它使用的是Digital公司的Alpha系统总线协议
EV6。EV6系统总线有许多的优点,首先它有许多比GTL+更为优秀的构造,例如点对点
布局。其次它可以支持200mhz的外频,也就是说我们一年以后见到的K7有可能工作在
200mhz的外频下,K7将是第一个真正支持RDRAM或DDR SDRAM的CPU,其中
RDRAM可以提供1.6GB/S的数据传输。K7没有把Cache内建在处理器里。但是,K7
具有64位可编程控制的后置式L2 cache界面,可支持512KB~8MB的二级缓存。
现在我们就来看看K7的结构到底是怎么样的: ·3个并行的X86指令解码
器; ·9个为高频率优化的超标量微结构; ·动态推测时序,乱序执
行; ·2048个入口分支预测表和12个入口返回堆栈; ·3个超标量乱序整数管
道,每个包含: 整数执行单元 地址产生单元 ·3个超标量乱序多媒体管
道; ·64K指令一级CACHE+64K数据一级CACHE,每两路相关; ·2个通用
64位数据CACHE装载/存储端口; ·高速64位后方2级CACHE控制器: 支
持512K到8MB二级CACHE 可编程接口速度 ·高速64位系统接口:
200MHz系统总线。 接下来我们就看看K7各种详细的性能指标: 一、K7
采用的系统总线: AMD的K7处理器并没有采用和Intel的GTL+相同的系统
总线协议,它使用的是Digital公司的Alpha系统总线协议EV6。顺便说一下,Alpha处
理器是一种用于服务器系统的纯64位处理器,其性能优于现在用于PC系统的处理器。K7
使用的EV6系统总线有许多的优点,首先,它有许多比GTL+更为优秀的构造,例如它使
用点对点布局。其次它可以支持200MHz的外频,也就是说我们一年以后见到的K7有
可能是工作在200MHz的外频下,K7 CPU将成为第一个从高带宽内存如Direct
RDRAM和DDR SDRAM中受益的CPU。Intel的GTL+结构在100MHz总线下的尖峰
带宽只有800MB/s;在133MHz时只有1066MB/s。Direct RDRAM和DDR SDRAM在
100MHz总线下能提供1.6GB/s的带宽,这种带宽正好配合K7的200MHz EV6总线。到
K7发布的时候,我想大家手上的SDRAM都得扔掉了(到那时SDRAM也已经落伍了),
因为能和200MHz外频相配的内存只有Direct RDRAM和DDR SDRAM。没办法,如果
你是一个狂热的电脑爱好者,手头又有足够的银子的话,就可以去买了,当然花这些钱还是
值得,这对于计算机的性能会有较大的提高。
二、K7中的Cache: AMD将在1999年底推出内建L2 Cache的
“Sharptooth棗钢牙”(K6-3)处理器,不过新一代的K7没有将L2 Cache建在处理
器内 ,但是,K7内置的tag RAM足以支持和Intel的PentiumⅡ处理器一样的512KB
的L2 Cache,同时AMD还考虑生产像Intel的P6 CPU一样的外置的tag RAM,来支
持不少于2MB~8MB的具有64位可编程控制的后置L2 Cache。虽然K7将不会把L2
Cache内建在处理器里,但是L2 Cache的速度将占CPU主频的1/3至全速,并且L2
Cache将使用SRAM或者DDR SRAM以保证其速度。K7将拥有不少于128KB的L1
Cache,其中,64KB将作为数据缓存,剩下的64KB将作为指令缓存。要知道Pentium
Ⅱ只提供了仅有32KB容量的L1 Cache。有传言说Katmai可能会有不少于64KB的L1
Cache,但这也仅是K7的L1 Cache容量的一半。拥有大量的L1 Cache对高速的处理
器来说是必须的,没有足够的缓存是导致处理器性能提高的一大瓶颈。灵活的L2 Cache
设计,使得AMD可以像Intel一样,通过L2 Cache的大小和速度来决定CPU的用途,
工作站或是服务器。K7将和Intel的Deschutes内核一样有64GB的寻址空间,但Slot
1只有4GB的寻址空间,而Slot A可以有64GB,故而K7的缓存空间也能达到64GB。
因此,我认为使用加大缓存容量和DDR SDRAM作为L2 Cache的K7一定能够提供非
常优秀的性能。 三. K7微结构优点: K7有三条并行的x86指令译码器,
用于将X86指令翻译成定长的微指令,每条微指令可以执行1到2个操作。K7有两种不
同的译码流水线做这个工作,直接路径译码器快速地译码通用指令,而辅助路径译码器在
微代码ROM中检索复杂的X86指令。K7有72个指令控制单元指令,控制单元分配微
指令到乱序整数管道和乱序多媒体管道中去。乱序整数管道可以支持15个微指令,最大
可同时进行30个操作,它的工作是分配3个独立的操作到3个并行的整数执行单元中去,
每个执行单元都带有一个地址发生单元。地址发生单元能够通过优化L1和L2缓存数据
的存取来保证最快的操作速度。 总之:K7的推出,所造成的最大的挑战是Intel即
将发布的Coppermine棗带有同步L2缓存的0.18um工艺的Katmai。Coppermine的
结构仍将与Katmai类似,因此Coppermine只有通过更高的主频来还击K7。这将是
Intel公司1999年7月以前的主要任务。也许KNI与3D Now!的对抗将使得一切都不同。
很明显,AMD不仅仅是发布一种新的CPU,而是一个正面进攻计划,对Intel的逐步进
攻,直到K7的最后攻击。这就是为什么引入像Slot A这样的新的平台。K7卓越的设计
将会吸引众多人的注意。Intel将不得不面临一场艰苦的战役。只有一个全新设计的CPU
才有机会击败K7,因此他们只能比计划大大提前地推出Willamette,总而言之CPU发
展下去将是好戏连场,绝对不容错过呢! ====================
======
在个人电脑20多年的发展历史上,AMD在与Intel的竞争中似乎从来没有像现在这
样占据优势,这一切似乎都要归功于它推出的x86-64系列64位CPU。我们知道,x86
结构在公元1981年随着IBM PC-XT个人电脑的中央处理器——Intel的8086进入了人
类的世界,这颗在当时拥有优秀性能和低廉价格的处理器,是一颗真正16位的微型处理
器(8086有16位的寄存器、运算单元和16位的输入输出总线,它的孪生兄弟8088与
8086内核完全相同,但是为了兼容性采用了8位的输入输出)。随后发布的80286也是
一颗16位的x86结构处理器,采用16位的x86指令系统(IS,Instrction Set),但拥
有更为先进的保护模式指令集。很快,PC的发展就使Intel觉得有必要推出基于32位
x86指令集的CPU——80386。80386是一个里程碑,是个人电脑称霸天下的重量级武
器,这个处理器的技术和市场策略简直无懈可击,一时间各家各户的兼容处理器,包括TI、
Cyrix、IBM和AMD一拥而上,想在PC普及已经汹涌澎湃不可遏制的大潮中分得一杯
羹。然而胜者终究是Intel,为了表明自己伟大的胜利,Intel把基于32位x86指令系统
的个人电脑,叫做英特尔体系32(IA-32,Intel Architecture-32)。从此以后的10多年
间,80486、80586(Pentium,这个词是“第五代”的意思)、80686(Pentium2)、
Pentium3直到Pentium4,Intel一直牢牢占据着个人电脑发展路程上的核心地位。32
位的x86架构也经历了10多年的风雨,过去20年中,X86以无可比拟的性能价格比优
势成为计算平台的标准。以每年超过1亿台的装机量,90%以上的市场占有率被用户广泛
认可。同时开放平台的良性竞争环境推动X86派的技术发展远远超过RISC体系。X86产
品已经从最初的PC机走入了工作站、服务器领域,大有取RISC而代之,统一计算天下
的态势。在这个过程中阻碍X86进入高端企业市场的,就是X86仍然基于32位技术。
对于高端的企业级服务器与工作站应用无能为力。伴随着企业计算应用的发展64位应用
将越来越广泛,令X86向64位扩展势在必行,也成为统一64位计算标准的希望。与此
同时,个人、商务和移动计算领域,32位计算也渐渐开始显得力不从心,不管出于技术
还是竞争需要,32位的时代,已经渐渐开始过去了。 在x86从32位向64位的扩张过
程中,Intel和AMD第一次在指令系统这样的根本方面产生了重大区别。我们知道,从
80386开始,指令系统的决定权一直在Intel手中,AMD只能生产所谓的“兼容”处理
器,也就是说标准是Intel定的,AMD只是靠着与INtel的交叉授权,依靠自己的勤奋努
力,在处理器市场上占有一席之地。在企业市场上,传统上是RISC厂商和UNIX的天下,
Intel想要打进去,并获得与在个人电脑上同样的成功,简直是它梦寐以求的事情。因为
AMD64位处理器的名气实在太大,所以大家似乎都觉得AMD是64位计算的领跑者,
其实客观来讲,Intel进军64位处理器比AMD还要早一些,只不过它的策略有所不同。
Intel并不认为个人和移动领域需要64位的体系结构,同时,觉得把x86扩展到64位来
与64位厂商的RISC系统拼在声势上要弱一些。而且,INtel想要在64位企业计算领域
一支独秀,也不想把AMD这些尾巴牵扯进来,形成32位市场上这种尾大不掉的局面,
因此,Intel单独发布了专为64位市场而定做的IA-64架构,以及相关的64位指令规格,
就是大名鼎鼎的EPIC(Explicitly Parallel Instruction Computing,显式并行指令计算),
并发布了名为Itantium(安腾)的企业级64位处理器。安腾确实是高性能的处理器,但
是它的IA-64并不兼容x86-32指令集,也就是说个人电脑的应用程序并不能在安腾上运
行,这样,大众实际上是被Intel划到了64位的界外。 要不是有这样的大好机会,AMD
想跳出来自己研发处理器架构并与Intel分庭抗礼,是非常需要勇气的。但是机会终究还
是出现了,AMD决定自行研发自己的64位处理器架构,并命名为x86-64。从这个名字
我们就能看出,AMD的64位指令系统是从x86扩充而来的,并且,AMD让新的64位
处理器兼容以往的32位指令集,也就是说,AMD的新处理器,不但是一颗64位处理器,
同时也是32位的。在AMD64结构中,出现了一个新的所谓“长模式(Long Mode)”,
作用是设置CPU按照64位方式运行。长模式的命名也许是参照了众人熟悉的“实模式”
和“32位模式”。长模式不仅指具有64位性能,而且寄存器还可以扩展为64位并加入
了新的寄存器。长模式是通过控制位来激活的,该控制位称为LMA(Long Mode Active)。
当LMA未被激活时,处理器运行在标准的x86模式下,可以运行的是16位或 32位的
OS和应用,而当LMA被激活后,64位扩展方式就可以执行了,这时就是新的64位
CPU。长模式还被划分为两种子模式,即“64位模式”和“兼容模式”。这两种子模式由
CS(Code Segment)寄存器中的D位和L位控制。“兼容模式”表示可以在64位模式下
运行16位或32位程序,这类似于386处理器中的虚拟86模式,旧的x86模式(32位
或16位)被称为“法定模式(Legal Mode)”。当进入64位长模式时 (LMA=1, CS.L=1
and CS.D=0),操作数的标准大小还是32 位,寻址却是64 位了。长模式的性能可以综
合概括为:虚拟的64位寻址,寄存器扩展到64位、附加的8个寄存器(R8-R15)、附加
的8个SIMD寄存器(XMM8-XMM15)、64位指令指针、Flat寻址模式。其中,附加的
新的SIMD寄存器使多媒体寄存器总数达到16个,弥补了x86结构中的薄弱环节。为了
使增加的寄存器更具有逻辑性,AMD采取的是一种对16位和32位寄存器的顺延方式。
这种方式提高了时钟速度使CPU性能更优。 相比于32位处理器,64位处理器的核心是
经过改进的,两者的异同主要有以下几点:一级缓存维持原有的128KB,其中64KB为
指令缓存,64KB为数据缓存。根据AMD64处理器的架构,二级缓存的寻址能力允许二
级缓存的容量在1MB到8MB之间。但尽管Athlon已经可以支持8MB的二级缓存,但
事实上AMD从来没有这样做。服务器市场是AMD64处理器的一个主攻目标,所以大于
1MB的二级缓存是十分有必要的。另外AMD未来还将会使用三级缓存。AMD64处理
器的管线长度比Athlon增加了两级,这使得它可以运行在更高的频率上。AMD64处理
器在分支预测单元上作了改进。AMD64处理器支持更大的翻译后备缓冲区
(Translational Lookaside Buffers,TLB)。以下分别做一个简单总结。 AMD 64位处理
器架构设计的首要目标是提供新一代的性能。体现这种设计思路最明显的例子就是
Opteron处理器改变了上一代处理器的流水线设计。流水线前端指令获取与解码逻辑标
识被精减,提供从解码器到执行管道调度程序间更大的指令打包程度。为适应这一改变,
设计中重新定义了管道分级以保持高度的频率可测量性,结果比第七代微架构多出两个管
道分级,最终产品拥有12级整数运算流水线和17级浮点运算流水线。在延长流水线得
到频率提升的同时,考虑到处理器架构的扩展性,Opteron处理器最初将采用0.13微米
的SOI(Silicon on Insulator,绝缘硅)工艺进行生产。随着低于0.10微米工艺的采用,
频率也会实现相应的提升。最终决定Opteron性能提升的关键因素是Opteron微架构比
以前的微架构具有更高的IPC(每时钟执行指令数)值。 同时,AMD的64位处理器还
集成了内存控制器,这在传统上是由北桥完成的,也就是说传统上北桥是处理器和内存之
间的“中转站”,北桥通过内存总线驱动内存读写,再通过处理器总线也就是前测总线
(FSB,Front Side Bus)将数据转发给CPU。这种机制在增强处理器兼容性和降低设计
难度的同时必然带来了效率低和带宽限制。在处理器微架构性能提升方面,如何在降低访
问延迟的同时提供给处理器内核足够的内存带宽,成为性能提升的最大瓶颈之一。在
AMD的新处理器中驱动内存的工作直接由处理器接管了,也就是说,这种处理器不再有
传统上的前测总线的概念,当然也就没有因此而来的带宽限制。Opteron微架构集成了
一个双通道的DDR控制器,该控制器拥有能够支持多达8个DDR DIMM(每通道4个)
的128位接口。内存控制器最初的设计是使用非缓冲或注册型(registered) DIMM来支
持PC1600、PC2100和PC2700 DDR内存。以PC2700为例,这种条件下处理器的有
效带宽可高达5.3GB/s。这一直接连接方式能够显著降低处理器的内存延迟,并且随着处
理器频率的提升内存延迟会进一步降低。此外,还能使硬件与软件预取具有更高的带宽利
用率,从而达到进一步降低处理器有效内存延迟的目标。集成在Opteron处理器内的内
存控制器在多处理器系统中有更加惊人的表现。运用并行连接方式的多处理器,每个都拥
有自己的有效内存带宽,随着处理器数目的递增,使系统性能具有良好的扩展性。在一个
4路处理器的多处理系统中,系统能够支持多达32个DIMM,在使用PC2700内存时可
以提供高达21.3GB/s的系统有效带宽,真是惊人!! 与此同时,还有AMD大名鼎鼎的
HyperTransport(超传输)技术,HyperTranport技术为嵌入式应用提供了高性能的数
据传输方案。通过HyperTransport技术,电脑内部芯片(网络和通讯设备之间的通讯)传
输带宽最多可以达到现有技术标准的40倍。而且HyperTransport的特别设计还可应用
于0.13微米级芯片技术。HyperTransport的目的并不是取代其它的I/O技术,它只是
提供了一种高标准基础上的端到端内部连接标准以满足内存以及I/O原件的数据传输需要,
并且可以用于连接传统的低速I/O设备和最新的高速I/O媒介。与把内存控制器集成到处
理器内部来提升内存带宽的方法一样,HyperTransport互连控制器也被集成到Opteron
处理器内部,在处理器和I/O子系统之间提供了拓展性极强的数据连接带宽。在
Opteron处理器内部的数据通道为双向16位的通讯,可以达到1600MT/s(每秒百万次
传送)的工作效率,可提供双向为6.4GB/s的带宽。在Socket 754/940时代,AMD 64
位系列处理器支持的HyperTransport频率仅仅为800MHz,而在最新的Socket 939系
列处理器上,支持的HyperTransport频率已经达到1000MHz,这也就是为什么高端的
Socket 939处理器比同频同规格的Socket 940处理器性能要有一定程度提高的原因。
在这种全新的架构中,HyperTransport总线的频率通常为传统内存总线频率的数倍,所
以能够提供的带宽也就非常高。这样以来,Athlon 64处理器在内存带宽方面就摆脱了天
生的缺憾,从而能够有利于进一步的提高整体系统的性能。HyperTransport频率从最低
的600MHz到最高的1000MHz,能够提供最高到8GB/s的带宽。
针对大工作负荷的TLB子系统与增强型分支预测功能,Opteron微架构的TLB和前
几代AMD处理器微架构相比,除了具有更大的TLB入口规模,及随之带来的更少的延迟
之外,还带有无须软件干预的多进程过滤器来共享TLB。Opteron处理器的分支预测功
能的增强使性能得到很大的提升,在较大的工作负荷下性能提升尤其明显。它主要是通过
把全局历史计数器中的双峰计数器的数量增至16K(这等同于第七代微架构的4倍)得以
实现。 在对32位x86-32指令集的增强方面,Opteron处理器微架构能支持全部32位
x86标准架构的增强指令,包括Intel MMX和AMD的专业3DNow! 技术(整合了增强
型3DNow!技术和SSE)。另外,AMD Opteron处理器还引入了对SSE2指令的支持。
然而AMD新一代处理器的研发过程并不顺利,处理器的一再延期推出不但使芯片组供应
商陷入了进退两难的境地,同时也引发了媒体的种种猜测——难道AMD真要倒下去了吗?
随着AthlonXP渐渐走向迟暮,改进的Barton核心在来势汹汹的Pentium4面前颇有螳
臂当车的味道,AMD近几个季度的巨额亏损也暴露了这一问题。AMD自己也清楚新一
代处理器的上市时间是越快越好,只有这样才可能扭转目前的困境,然而作为一款蕴含了
多种创新技术的产品,研发过程中所要面对的难题自然也会更多。Hammer一再延期的
原因不在于32位/64位的指令兼容和效能问题,而是长期阻碍AMD处理器频率提升的
制造工艺问题——主要是绝缘硅(SOI)技术的应用,以至于很长一段时间AMD只能拿出
800MHz的样品用作展示和媒体测试。2003年初与IBM的技术合作解决了AMD在SOI
使用上的燃眉之急,Opteron和Athlon 64处理器的频率也得以提高到较合理的水平。
另一方面,由于新处理器整合了内存控制器,而在研发过程中内存标准进行了多次升级,
并且双通道内存技术成为了主流,因此AMD也不得不临时修改了新处理器的内存控制器
架构,这也给Athlon64的按时上市增加了难度。但不管如何,AMD成动了,它发布的
Opteron处理器(在研发的时候叫做K8,核心代号Hammer大锤)迅速被市场所接受,
在一年之内,AMD推出了三个系列的64位处理器:面向服务器和工作站的Opteron系
列,这个系列的处理器集成双通道DDR控制器,只支持带ECC校验的内存;面向发烧友
和顶级个人电脑的Athlon FX系列(双通道DDR控制器,支持带或者不带ECC校验的
内存)和面向高性能、低价格桌面电脑的Athlon 64系列(单通道DDR控制器,支持不
带ECC校验的内存),并且正在推出面向笔记本市场的Moblie Athlon 64系列,如狼似
虎的抢夺64位计算进入个人电脑领域所产生的丰厚回报。 AMD的64位处理器一共有
三个系列,或者说按照市场需要的不同划分成了三个档次。有趣的是,AMD在64位处
理器的针脚上放弃了自己在Socket462上从一而终的良好生活作风,大玩儿特玩儿Intel
擅长的强制分级游戏,在短短一年的时间里,推出了三种用于64位处理器的针脚规格。
刚发布的时候,对于高端的Opteron是采用Socket940的规格,共有940个针脚,比
Socket462多了一倍也还不止,一般处理器的针脚都排列在四周,中间留下一块空间,
但是我们在Socket940的CPU上看到,由于针脚实在太多,处理器背面已经被密密麻麻
的针脚占满了。对于低端的Athlon 64,最初是采用Socket754的754根针脚,后来又
出现了Socket939的规格,而且这种规格的处理器,不但有Athlon 64,同时还有
Athlon FX,这在客观上为消费者选择AMD的处理器造成了困难。Socket 940的针脚数
量和Socket 939虽然只有一根的区别,但是在针脚位置的安排上却有着比较大的不同,
也就是说Socket 940接口并不是由Socket 939接口在某一个位置增加一根针得来的,
这两种接口没办法做到互相兼容。 从AMD发展的蓝图上我们可以大概这样预测,
Socket940接口会留给Opteron系列(双通道ECC内存),现有的940接口Athlon FX
会慢慢消失,后面发布的Athlon FX系列(双通道普通内存)全会是939接口,而754
接口的处理器都是Athlon 64(单通道普通内存),直到明年初754接口被AMD淘汰掉,
Athlon 64可能也就完成了历史使命。以上的对应关系也有一些例外,现有的Athlon FX
处理器有一些是采用940接口,同时,高频的Athlon 64处理器也有939接口的。 在设
计上Operton是为了服务器和工作站市场的,所以多处理器功能就成为必不可少的要素
了。Operton分为100、200和800三个不同的系列,100系列不能并行处理,200系
列支持一路和两路并行处理,800系列则支持一路、两路、四路和八路并行处理,是
Operton系列中的高端型号。除了并行处理,AMD在高端的Operton系列中还埋伏了
一道伏笔,就是双核心能力,这是专为对付Intel的HyperThreading超线程技术准备的。
Intel目前在其处理器中加入的超线程技术实质也是一种多核心架构理念,主要是希望解
决缓存命中问题,但该技术并没有像先前芯片工程师预想的那么高效。超线程技术原理是
能够在单核心处理器中建立多指令执行单元,如果其中一个执行单元出现缓存命中失败问
题,其他单元也许可以保证正常工作。但在实际使用中发现,经常会出现两个执行单元数
据冲突的现象,所以并没有很大的提高效率。AMD的双核心的设计则不会出现上面的情
况,因为两个处理器各自配备缓存,争夺的焦点主要集中在与主内存的数据交换上。预计
AMD将在2004年底展示其双核心处理器样品。 Athlon FX虽然不能够支持双内核,但
是它按照运算速度的不同,也分为不同的型号,最先推出的为Athlon FX-51,采用SOI
130nm工艺,频率是2.2GHz,然后是Athlon FX-53、Athlon FX-55等,至于三个系
列中的Athlon 64,它的分级方法是按照AMD传统的PR值,从3200+(130nm工艺,
频率2.0GHz)开始,3400+、3500+、3600+、3700+、3800+…………等等。对应于
三种不同接口,AMD在每个系列上都采用了不同的命名方式,真不知道他们在搞什么。
在新的939针的Athlon FX/Athlon 64处理器和将来要发布的940针Operton处理器
中,AMD新增了一个重要的硬件级病毒防护功能,这项功能是Intel、AMD和微软三家
为了应付层出不穷的病毒软件而特别制定的。我们知道,缓冲区溢出是病毒攻击的首要手
段,但是讨厌的是这个手段虽然广为人知,却苦无一劳永逸的解决之道,逼得微软只能越
来越频繁地发布补丁,有了这项技术,这一切都会全面改观了。AMD把这个功能叫做
“Execution Protection”(Intel的叫法略有不同),它是一个被集成在CPU内部的锁定
机构,当操作系统激活这个功能时,CPU缓冲区的数据将会只读,而不能执行,这可以
有效防治病毒的缓冲区溢出攻击。目前的CPU是做不到这一点的,只能任由病毒肆虐。
激活了该功能后,计算机用户对数据安全所花费的心思将会大大减少,病毒库更新将不再
那么频繁,而更新更加频繁的Windows补丁,很大一部分都变得不再必要。操作系统依
靠“吃补丁”生存的习惯也就得以改变。WIndows XP的Service Pack 2支持并实现
AMD 64处理器中的病毒保护功能。这项硬件防病毒功能的具体作用有多大,我们评测室
正在策划一项测试。 至于研发核心,则是一个相当复杂的问题。总体来讲,AMD 64位
处理器在研发计划叫做K8(上一代叫K7),其中Operton第一代核心叫做
SledgeHammer(1MB二级缓存/核心面积193平方毫米),而第二代核心则比较混乱,
100系列单路(不支持并行处理)核心叫做维纳斯(Venus),200系列核心叫做特络伊
(Troy),800系列核心叫做雅典(Athens)。到2005年,AMD将会推出单路丹麦
(Danmark)核心、两路意大利(Italy)核心和八路埃及(Egypt)核心的第三代
Operton,要注意,第三代核心不管能不能并行处理,都是双内核的。真够乱套的。
Athlon FX系列和Opteron有着说不清的血缘关系,先推出的940针和最近推出的939
针的Athlon FX都是SledgeHammer核心(1MB二级缓存/核心面积193平方毫米),
下一代看来发展路线会与Operton分道扬镳,自行推出2005年上半年发布的圣地亚哥
(San Diego),第四代将变成双内核的托莱多(Toledo),2005年内发布。至于Athlon
64系列,第一代核心叫做ClawHammer(1MB二级缓存/核心面积193平方毫米),现
在第二代核心纽卡斯尔(NewCastle)(512KB二级缓存/核心面积144平方毫米)也已
经发布了,至于下一代,按照AMD的规划将采用温彻斯特(Winchester)核心,这是
单内核的,且不能并行处理。 光有CPU是没有意义的,在配套芯片组方面AMD也下了
很大工夫。芯片组对于AMD的Opteron以及Athlon64而言是极为重要的,因为对于
如今的PC架构而言,决定整体性能的关键已经不仅仅是CPU,芯片组同样不可忽视。客
观而言,芯片组的设计难度还是在处理器之下,但是需要考虑的问题很多,而以AMD在
芯片组设计方面显然是没有太多精力。因此AMD很需要VIA、SiS、ALi以及NVIDIA提
供的相关配合,使之能够集中精力,全力以赴地做好AMD64位处理器的研发工作。每当
AMD新推出一款处理器,它首先都会配上相应的芯片组,K6时期的AMD 640芯片组,
Athlon K7时期的AMD 750/760芯片组,Athlon MP时期的AMD 760MP/MPX芯片
组,这些都为AMD处理器站稳脚跟立下了汗马功劳。有趣的是,一旦VIA、SiS、Ali以
及NVIDIA推出更为成熟的芯片组,AMD总是功成身退,更多地扮演技术指引的角色,
同时为第三方芯片组厂商赢得充足的开发时间。 K8芯片组也不例外,AMD 8000芯片组
率先推出,充当Opteron的开道锣手,而紧随其后的VIA、SiS、ALi以及NVIDIA则纷
纷跟进。威盛在AMD发布Athlon 64处理器的同时就发布了K8T400,后来又发布了
K8T800和整合芯片组K8M800,2004年5月,为了更好的支持AMD刚刚发布的
Socket 939接口的处理器,威盛推出了K8T800芯片组的升级版本K8T800 Pro芯片组。
K8T800 Pro相对于K8T800做了两个重要的改进。首先是其AGP和PCI时钟相对于
HyperTransport总线来说是独立的,这意味着AGP总线频率和PCI总线频率都可以自
由调节,对于超频玩家来说是一项很重要的改进,它可以让玩家尽可能的挖掘CPU的超
频潜力,而不会因为系统的其它设备影响超频的结果。K8T800 Pro的第二个重要的改进
是支持1GHz的HyperTransport总线。这意味着北桥芯片同CPU对话的速度比以前更
快。K8T800支持双向16-bit、800MHz HyperTransport总线连接,因此其理论上的峰
值传输带宽为6.4GB/s。K8T800 Pro则支持双向16-bit HT总线连接,这意味着CPU
和北桥之间以1GHz总线连接时的峰值带宽为8GB/s。相对K8T800,K8T800 Pro还有
如下几点的改进:首先是总线接口采用了更灵活的异步方式,而K8T800只支持同步模式;
第二是K8T800 Pro南北之桥间的联系采用了新一代的V-LINK技术,最大速率可以达到
1066MB/s,比之前提高了1倍;另外一点K8T800 Pro支持最新的Socket939接口。
还兼容Socket 754接口以及Socket 940接口,当然最终产品支持哪种接口的处理器是
由主板上提供的CPU插座决定的,尽管这些主板可能都采用K8T800 Pro芯片组。一般
来讲,K8T800 pro会搭配VT8237南桥芯片,此芯片提供AC'97 VERSION2.2的6声
道声卡、两个ATA133 IDE接口、两个SATA150的接口,并为此接口提供了RAID功能、
六个主控(BUS MASTER)PCI接口、八个USB 2.0/1.1接口、通过LPC IT8705F的超
级I/O芯片,提供软驱、红外线、两个串口、并口、游戏/MIDI和硬件监测接口。此外,
还要加上PS/2键盘和鼠标接口。K8T800pro不支持PCI-E,因此威盛还将推出K8T890
芯片,除了支持到1GHz HyperTransport总线之外,还同时支持AGP8X和PCI-
Express 16x,让没有升级到PCI-Express 16x显示卡的用户也可以继续使用目前的
AGP8X显示卡。另外,整合型的K8M890也将同时推出。 nVIDIA作为AMD重要的合
作伙伴,在AMD 64位芯片组方面的动作十分积极,主要也是由于ATi和Intel走的很近。
nForce3系列芯片组成为AMD推荐的64位平台。nVIDIA公司推出了基于Opteron平
台的nForce3 Pro 150以及nForce3 Pro 250芯片组(nForce3 150是第一个单芯片设
计的64位主板芯片组。该产品采用单芯片设计主要是因为对北桥芯片性能影响最大的因
素——内存控制器已经内建在Athlon 64系列CPU中,北桥的概念也因此淡化。此外,
nForce3集成了AGP 8X控制器,USB2.0控制器,提供了两个Fast ATA133控制器并且
提供了对RAID 0模式磁盘阵列的支持以及对PCI 2.3规范的支持。),针对Athlon64处
理器平台NVIDIA还将推出Crush K8系列芯片组,包括nVIDIA Crush K8、nVIDIA
Crush K8S、nVIDIA Crush K8 Pro、nVIDIA Crush K8 3GIO、nVIDIA Crush K8G3等。
其中,Crush 3GIO支持PCI Express X16图形接口。此外它还支持4个PCI Express X1
总线扩展槽,实际上就是一个PCI Express控制器。Crush K8G3则是在Crush 3GIO的
基础上整合了FX5600级别的图形核心,可以提供较为理想的图形性能。 Crush 3GIO和
Crush K8G3都将与Crush K8-04南桥搭配,通过HyperTransport总线连接南北桥。
Crush K8-04南桥可支持4个Serial ATA和4个ATA 133接口,支持NV RAID功能,
直接整合了千兆以太网和无线网络技术,并支持网络防火墙。此外,Crush K8-04支持
24bit/96kHz的7.1声道Azalia声效,提供8个USB 2.0接口。 ATI则是在Intel和
AMD两个平台积极的耕耘,基于AMD64位平台的芯片组规划有集成了Radeon 9600
级别的图形核心的RS480,支持PCI Express,以及没有集成图形内核的RX480,
RX480和RS480都可以同SB400或SB450南桥搭配。新品于2004年第一季度出样,
第二或第三季度开始批量生产。
SiS也已经在AMD 64位平台也推出面向主流高性能平台的SiS755,面向高端高性
能平台的SiS755FX,以及整合图形芯片的SiS760。这三款芯片组都会搭配SiS964南桥、
1GB的MultIO的南北桥总线、支持AGP8X、支持ATA133和SATA150、支持USB2.0、
支持800MHz的HT总线频率、支持单通道内存(960还将支持双通道内存)。由于最重
要的内存控制器集成到了CPU内部,SiS北桥对性能的影响程度减小了,它只需要控制
AGP以及Hyper Transport和妙渠技术(MuTIOL)就可以了。SiS在这方面做了大量的
准备工作,一方面通过妙渠技术(MuTIOL)提升南北桥之间的总线带宽,另一方面则通
过HyperStreaming引擎技术提升数据传输效率。SiS在2004年还将推出的SiS756和
SiS761两款芯片组,均支持Athlon 64处理器,其HyperTransport总线从800MHz提
升到1000MHz,单向传输速率高达2000Mb/s,SiS761更是整合了DX9图形内核。
SiS756是SiS755系列的下一代产品,它的规格同K8T890相当,支持PCI Express X16
图形接口。SiS756搭配的南桥芯片是SiS965和SiS966,配合ASHE技术可获得更高的
磁盘效能,而在其它功能方面SiS756芯片组也丝毫不弱:Serial ATA RAID、PCI
Express X1扩展槽、千兆网络、USB 2.0及IEEE 1394等功能一应俱全。SiS761是
SiS756的整合版本,也是SiS760的升级版本,所整合的图形核心与Prescott平台的
SiS 662相同,均可支持DirectX9 API,至于3D性能还有待验证。 关于SiS还要多说两
句,SiS在传统上是走物美价廉的路线,但是现在看来,它的AMD芯片组可不是省油的
灯,其性能基本上可以跟任何一个强劲的对手包括VIA、nVIDIA、ATi相抗衡,而且感觉
上有点儿青出于蓝胜于蓝的势头。现在,我认为是一些主流主板厂商应该放更多注意力在
SiS身上的最佳时机,按照现有的性能表现,再加上SiS一贯的低价格,我认为完全可能
通过SiS打出一块市场。 64位的操作系统,现在看来也不是问题。运行在PC机上的操
作系统很多,Windows就有好几种,Linux更是不计其数,再加上Solaris、BSD三兄弟
(FreeBSD、OpenBSD、NetBSD)、OS/2、DarWin、QNX、SCO UNIX等等等等,
简直是数不胜数。但是主流的只有Windows和Linux。64位的Linux内核已经发布了,
SuSE和RedHat等Linux大家都已经推出了自己的64位Linux产品,Windows方面,
不少人都认为它在64中毫无建树,在这里必须要为微软正名。微软在2001年就推出了
Windows2000 DataCenter的64位版本,是为Intel安腾服务器推出的IA-64架构的操
作系统,不能运行在个人电脑上,到了2003年,Windows Server 2003推出了四个版
本,分别是专业版、web服务器版、企业版和数据中心版;其中企业版和数据中心版都
有32位和运行于安腾之上的64位两个版本,同时Windows XP也有64位的安腾工作
站版,应该说微软在64位的路上是先行者(正如Intel一样)。实际上,微软的比尔盖茨
是64位计算的忠实拥护者,他说“64位已经来到”可不是一次两次了。当然,微软也看
出来了跟着Intel走比较危险,2003年9月,微软为AMD推出了Windows XP的64
位测试版本,2004年1月,又推出了Windows Server 2003的64位测试版本,当时
微软的说法是2004年中以前推出正式板,现在看来延期了。有人说是年底之前出,危险
的是不管是AMD还是微软都对此事闭口不提,说不出个所以然来。至于这个延期有没有
Intel的关系还不好说,Intel是这样的,它的安腾实在抗不住了,终于发布了兼容x86-
64的核心叫Nocona的64位至强处理器,上演了一场两个64位处理器(至强vs安腾)
同门相残的惨剧。 新至强的指令集和AMD 64几乎是一模一样的,在2004年IDF会议
上发布时叫做IA-32E,也就是此前网上纷纷传言的Yamhill技术。和AMD x86-64一样,
Intel的IA-32E技术是在原有IA32构架基础上以最小的改动实现对64-bit寻址能力的支
持,实际是对原有IA32处理器构架体系的增强设计,同时又兼顾了新构架对原有的IA32
构架下开发的32bit甚至16bit代码的支持。IA-32E通过删除INC/DEC两个指令实现
REX prefix,提供64位模式下新增寄存器的指令编码空间,64位通用寄存器(GPR)以及
SSE/SSE-2/SSE-3寄存器(XMM)都增加8组。另外,新增64位平面寻址模式、中断优
先权控制机制以及RIP-Relative寻址模式,这些也都与AMD x86-64完全相同。IA-32E
提供64位模式和兼容模式,64位模式支持64位的操作系统、应用程序、驱动程序、平
滑虚拟寻址空间(flat virtual address space)和通用寄存器(general-purpose registers,
GPR),兼容模式支持64位的操作系统和驱动程序,应用程序和通用寄存器会支持32位
环境,提供4GB的寻址空间。兼容模式将不支持IA-32架构的虚拟8086模式(Virtual-
8086 Mode)和实模式(Real Mode),许多DOS的设备驱动程序将无法作用。以微软操
作系统为例,Windows Me和以上已经移除实模式程序代码,所以不会受连累,但MS-
DOS、Windows 95/98会受到影响。从上面来说,IA-32E可以兼容于AMD x86-64。
毕竟目前AMD64已经获得了业界的广泛支持,这让Intel采用AMD的x86-64架构变
成了必然的选择。由于英特尔在过去与AMD签署过关于x86指令集交互授权协议,所以
英特尔可以采用AMD x86-64而不必交付权利金。 不过,IA-32E和AMD x86-64依然
有着不同之处,比较明显的差别是:AMD x86-64有3DNow!,Intel没有;Intel拥有
SSE-3,AMD x86-64还没有。不过,这些都是小差距,双方要加入这些功能并不会有什
么困难。微软和英特尔宣称操作系统将可互相兼容并不是没有理由的,这也是软件厂商最
欢迎的结果。这种结果恐怕也是唯一的选择,因为谁都无法承受为Intel和AMD分别编
写程序的代价,微软就表示已经有了两个64位操作系统(真可怜!!),不会再为第三个
64位架构写操作系统,连微软尚且如此,其它软件厂商就更不用提了吧。 64位的操作系
统,需要专门的64位驱动程序,这方面就比较差了,实际上这也是AMD的软肋,它的
影响力不够,大家都抱着观望的态度,跟着它跑的厂商不多,所以为64位操作系统编写
的驱动到现在还是远远不够丰富,当然一些大厂,比如Nvidia和ATi,都已经发布了64
位的驱动程序,要解决这个问题,微软的帮助对于AMD是至关重要的。相信在正式发布
64位Windows的时候,大多数驱动都已经有64位了,这是因为微软为了新操作系统推
出时的竞争力和兼容性,会花很大力气去完善WHQL库的规模。 最后而且是最终能够决
定AMD 64位处理器命运的,就是64位应用程序,我们知道安腾的挫折主要就是因为为
它编写的程序太少,据说到现在只有几百款,而在SUN的Solaris操作系统(也是64位
的)上运行的程序已经上万款了,在个人电脑上这个相应的数字是几百万款。其实,对于
使用者来讲,64位处理器、64位系统、64位驱动程序等等全都是不可见的,可见的只
有利用这些操作环境运行的64位应用软件,没有应用程序,什么都是白搭。对于AMD
64处理器来讲,它有个大的优势在于不但64位性能强劲,32位性能也很强,刚才我们
说过了,它同时也是一颗32位处理器。因此,在现在的阶段,大家都是在32位的应用
环境下使用,其实根本没有发挥它全部的潜力(这也说明了它惊人的实力)。但是这毕竟
不是长久之计,没有64位的应用环境,64位处理器就像离开水的鱼,是没有生存和发展
空间的。 到今天为止,为64位编写的软件数目还很少。这里就要说到这篇东西,本来这
应该是一篇64位处理器的64位表现评测,请注意是64位表现,关于AMD 64的评测
已经实在太多了,但通通都是把它当成32位处理器测的,使用了32位的系统、驱动和
测试软件,测出来的当然是它在32位环境下的性能表现,也就是上面说的寄存器
LMA=0,长模式没激活,所有寄存器工作在32位下,所有64位专用寄存器不可用的情
况下的性能,如果大家看过白皮书,就会发现从内核而言这时的处理器和Athlon XP几
乎是完全一样的(当然多了一些管线、Hyper Transpot、内存直接吞吐等功能)。因此我
从一开始就并不想做这样的测试,但是到最后,也没能做成64位测试,主要是因为64
位的软件太少了,测是软件就更少,游戏几乎没有——但不是完全没有,Unreal
Tourament 2004已经放出了64位demo,是Linux版本,Windows的64位游戏还没
有,很多厂商说正在做,但也有消息说DOOM3将不会推出64位版。至于在64位系统
上运行32位测试软件和32位游戏——因为64位的Windows是向下兼容的,因此可以
将32位软件运行在64位操作系统上——则并没有测试意义,所有的软件在64位环境
下运行,都会面临效率下降的问题,原因很简单,64位系统并不是位32位软件设计的,
与32位系统情况不同(那时处理器运行在32位模式下实际上就是一颗32位CPU),此
时处理器是在长模式下运行的,用兼容32位运行,效率并不高。 总之,32位系统+32
位测试,不是本文的目标,64位系统+32位测试,效率会下降,而且也不是目标,64位
系统+64位测试,目前看来,时机还并未成熟。AMD提供了一些数据,表明在真正64
位模式下处理器速度会大幅上升,这才是64位的应用前景,Intel在2005年之前,还不
会推出64位的桌面处理器,这一段时间对于AMD来讲是比较重要的。在64位的战役
中,AMD已经领先一步,能不能取得最终胜利,就取决于能不能迅速将64位的应用环
境变成熟,一旦成熟,那么江山就是铁打的了。但是,Intel只怕不会乐见其成吧?