2024年9月11日发(作者:太叔雁芙)
维普资讯
瓣 .p C a j C 0㈧
Radeon HD 2900XT深度解析
擎繇 让理性;{导消费 让DI y改变生活
整整半年以前,NVIDIA发布了业界第一款支持DirectX 10 API的图形显示芯片G80,从此,NVIDIA带领我们走入了
DirectX 1O时代。DirectX 10带给消费者的是完全不同的视觉盛宴。作为唯一一家能够和NVIDIA竞争的图形显示芯片巨头,
ATI一直致力于DirectX10产品的研发.终于在今年的5月14日,ATI正式发布了我们期待已久的RadeonHD 2900XT 吹
响了DirectX 10的第一次决战号角。
重重危机,R600让ATI走出危难 竞争对手率先构架完成产品线
早在1年之前,无数的消息来源显示了ATI和
NVIDIA,均将在最短时间内发布支持DirectX l0
API的图形显示芯片R600和G80。在2006年l 1月.
NVIDIA率先推出了支持DirectX l0的G80图形显
示核心。很快的,NVIDIA通过G80的良好销售
抢夺了一些高端市场份额 紧接着NVIDIA再次推
出了在显存规格上Costdown的G80产品.从ATI
手中抢走绝大部分中高端市场份额;但NVIDIA并
不满足,在今年的4月17日.又推出了G84/G86图
形显示核心,将DirectX 10引入了主流市场。至此.
GeForce 8系列的产品线基本构架完成。
结束了1 9个月的等待
一
般来说 图形显示芯片的技术、架构的更新
周期,大约是12-1 8个月 显然,从2005年10月
维普资讯
策划:本刊编辑部
HD 2000系列将不但在性能上具有竞争力,在高清
视频、高保真音频以及其他影音娱乐方面同样具有
易用性和竞争力。无论是以性能为前提,还是以娱
乐为前提的用户,都可以通过Radeon HD 2000系
列产品,获得最好的影音娱乐享受。
ATIRadeonHD2000系列产品线介绍
高端对决——2900XT Vs 8800GTS
R600是ATI本代高端产品的研发代号,其对
应的产品是已经推出的Radeon HD 2900XT以及
RadeON HD 2900XTX。,目前的Radeorl HD
22日发布R520到现在, R600已经经历了19个月
的酝酿,从更新周期上计算,推出的时间并不算太
晚。但从市场的角度来考虑,ATI已经失去了先机,
如果要抢回被竞争对手占据的份额,就意味着ATI
2900XTX只是特供OEM的产品,在零售市场上很
难找到其踪迹。目前已经上市的:R ad eon HD
2900XT拥有7.2亿晶体管,采用80纳米制造工艺,
拥有恐怖的320个Stream Processor Units,核心频
率740MHz,具备了16个Texture Units、16个ROP,
可以搭配GDDR4/GDDR3显存 公版采用了单颗
显存32bit 32MB规格的设计,16颗显存组成了
512bit
、
必须拿出性能更加优秀、价格更加低廉的产品。终
于在今年的5月l4日,ATI发布了支持DirectX l0
的产品Radeon HD 2900XT。
其实,ATI稍晚发布R600,也是有一定原因的。
竞争对手率先透露的产品信息 效能信息,尤其是
AMD在半导体方面的开发经验,都使得ATI对
512MB的显存规格;显存频率1650MHz,
待机功耗低于215W。
Radeon HD 2900XT是AT1次高端的产品,其
l
R600的改进更具有针对性。ATI也在这段时间内,
充分的调整了架构以及产品线,并且通过和半导体
芯片制造商更深层次的合作,有效的降低了成本。
可以说,Radeon HD 2000系列图形显示芯片,是
翳 醛…
慰 _
ATI花费巨大精力后,推出的产品。
I I
看Radeon HD 2000系列迎战NVIDIA
我们在上文中提到了,NVIDIA已经在低、中、
高端分别推出了产品,ATI面临的是来自NVIDIA
和市场的双重压力,能否后来居上,Radeon HD
2000系列产品将起到决定性的作用。Radeon HD
2000系列产品,包括了高端的Radeon HD 2900系
列;中端的Radeon HD 2600系列以及低端的
Radeon HD 2400系列,3个系列的产品涵盖了整个
!
GeForce 8800GTS将是2900XT的最大竞争对手
竞争对手为NVIDIA采用G80图形显示核心的高端
产品GeForce 8800GTS,单从规格上来看,无论是
流处理单元的数量还是显存位宽,Radeon HD
2900XT要明显强于GeForce 8800GTS,甚至是更
强悍的GeForce 8800GTX、8800Ultra。除了这些
参数差别外,Radeon HD 2900XT还拥有数字音频
输出以及HDMI视频、音频输出功能!更重要的一
点,Radeon HD 2900XT的价格相当便宜,官方定
桌面图形芯片市场。
从产品的命名上,ATI放弃了Radeon X1000
系列的“x”,转而使用 HD”来做数字之前的标
价为399美金(512bit/512MB GDDR3显存版本)。
号,全新命名方式的采用,体现了ATI在产品推广
方面的用意一一性能将和附加功能并重,Radeon
而同样价格的GeForce 8800GTS,只拥有96个流
处理器、320bit显存位宽。
维普资讯
W W。w P C d l Y C O
‘
Radeon HD 2900XT深度解析
p 稻 让理性} 消费
12D f Y改变生活 i釜一
中端战役——2600系列Vs 8600系列
在主流市场上.Radeon HD 2600系列将成为
ATI的主打产品,Radeon HD 2600系列研发代号
为RV630,采用65纳米制造工艺,集成了超过3.8
亿晶体管,拥有120个Stream Processor Units,核
心频率600MHz以上.具备8个Texture Units、4
Radeon HD 2400系列.这个系列的产品主要面向
中低端市场,Radeon HD 2400系列核心研发代号
为RV610.采用65纳米制造工艺.集成了1.8亿晶
体管.拥有4O个Stream Processor Units.核心频
率525MHz以上,具备4个Texture UnitS、4个ROP,
显存位宽64bit.容量可选.可以搭配GDDR3或
小于25w。
个ROP.显存位宽128bit,容量256MB,厂商可
GDDR2显存,显存频率高于800MHz.待机功耗
以根据产品的定位、需求,为Radeon HD 2600系
列搭配GDDR4/GDDR3/GDDR2显存,显存频率
高于800MHz,待机功耗小于45W。
Radeon HD 2600系列的主要竞争对手是
NVIDIA GeForce 8600系列产品 Radeon HD 2600
Radeon HD 2400系列产品.‘是ATI即将在低
端市场上投放的一颗重磅炸弹,面对竞争对手的
GeForce 8500GT和Costdown的GeForce 8400GS.
R
adeon HD 2400系列产品以65纳米制造工艺和
.
系列从参数上依旧是领先对手,并且,Radeon HD
2600还能够支持AVIVO HD、数字音频输出以及
HDMI。AVIVO HD是ATI引以为傲的AVIVO视
频回放技术的改进版,能够针对H264、VC一1以及
MPEG2等高清视频编码格式进行硬件解码,因此,
64bit显存位宽,降低了产品的成本。但成本的降低
并没有减少Radeon HD 2400系列产品的功能,
Radeon HD 2400系列同样支持AVIVO HD、
具备AVIVO HD视频回放技术的Radeon HD 2600
系列,能够流畅的播放HD—DVD以及蓝光电影,最
大程度的降低对CPU的依赖。
HDMI视频音频输出和数字音频输出,一定程度上
降低了数字家庭构架的成本。
火拼低端——2400系列Vs 8500/8400
除了Radeon HD 2600系列外,ATI还推出了
匮 DIV No.7.2007 57
维普资讯
策划:本刊编辑部
R600架构分析 ’
行浮点运算或函数运算.和处理整数指令.拥有128
个Streaming Processors的G80.理论上在同一个
作为ATI第一款支持DirectX 10 API的图形
显示芯片.Radeon HD 2000系列抛弃了传统的像
素Shader、顶点Shader的分离式架构。转而采用统
一
周期内.最多能够完成128个数据以及指令运算。
在加入了Dua1 ISSUE的设计后.进行Multiply
Shader架构。说到统一Shader架构.就不得不谈
ADD运算时.可以多进行~组Multipy运算。但
G80的Streaming Processors频率和核心频率并不
到ATI为微软Xbox360游戏主机所设计的Xenos图
形显示芯片。
同步。举例来说.GeForce 8800GTX的核心频率
仅仅为575MHz.而Shader频率却高达1.35GHzj
这就大大提升了Streaming Processors的处理能力。
而在R600的设计中.ATI同步了Stream Processor
设计源自Xenos图形显示芯片
Units和核心频率.Radeon HD 2900XT的Shader
频率仅仅为740MHz,几乎比GeForce 8800GTX
低了一倍。一
Xenos拥有48个Unified Shaders.可以根据需
求.进行顶点运算或者进行像素运算.虽然并不支
持DirectX 10.但Xenos却拥有数据流输出功能.
效率较分离式架构的图形芯片高出不少;同时.
Xenos还可以支持多线程分配。ATI将Xenos称之
为第一代统一Shader架构的图形显示芯片。有了
Xenos的开发经验.R600的统一Shader架构开发
起来更加得心应手.加之和微软的紧密合作.AT1
对DirectX 10的理解可以说更加深刻。在之前的杂
志中.我们详细分析了G80核心架构.在下面的文
章中.我们会通过R600架构和G80架构的对比,详
细的解析ATI第二代统一Shader架构。
320个流处理单元一一颠覆性的数量
众所周知,统一Shader架构中,流处理器的数
量相当重要,R600拥有320个Stream Processdr
Units,而GeForce 8800Ultra只有128个Streaming
Processors
,
数量上大大超过了G80。不过我们需
要解释的是:G80和R600是完全不同的架构,流处
理器的数量对比是没有任何意义的。
让我们先回顾下G8 0的设计.G 80的每个
Streaming Processors
,
在分解ATI R600图形显示核心的架构后,能
够发现ATI和NVIDIA的本质差异。ATI采用了
SIMD(Single Instrucion Multiple Data】的设计,
均能够在同一个周期中,进
核心拥有4组流处理器,并各自连接一组Texture
Units
,
每组拥有16个流处理器,共计64个流处理
58 No.7.2007馐 DIV
维普资讯
爨, 黪 搿f 0 }
1“
Radeon HD 2900XT深度解析
繇 让理性引导消费 让D l Y改变生括
器。细心的读者可能会发现.ATI宣传的Radeon
HD 2900XT拥有320个Stream Processor Units.
翻译成中文是流处理单元.并不是320个流处理
器。
的指令数量.在很大程度上.要取决于UTDP(Ultra
Thred Displath Processor)能将更多的简单指令.
集合成一组VLIW指令.填满一条流水线上的16个
流处理器.80个ALU。为了提升SIMD的运算效
率.ATI在2900XT中加入了8KB的读取缓存.作
为虚拟暂时存储空间.配合Stream Out Buffer.存
储一些不需要经过渲染后端处理的数据。
早在上代的R580图形显示核心中,ATI在每
个Pixel Shader Unit中。集成了4个ALU,R580采
用了标量+矢量的设计 所以每个周期只能处理2
组Scalar运算或1组VectorSD 1组Scalar运算。R600
采用了经过革新的SuperSCalar架构,不再分为
还记得ATI黄金3比1架构吗7每条渲染管线
中拥有3个Pixel Shader Units;ATI的统一Shader
架构和3比1架构拥有异曲同工之妙一一实际上
ATI每个流处理器中,拥有5组ALu.这5组ALu
也就是所谓的5组Stream Processor Units,64个
流处理器共有320个Stream Processor Units。
在ATI每个流处理器中.1组闲置的ALu分支
分预测单元,配置了缓存器,可以存放输出/输出
数据,5组ALu最多可以处理5份数据。所以,
2900XT 320个Stream Processor Units,在一个周
期内.可以完成320分数据。不过,每个SIMD只
能执行一份VLIW指令,因此,每个周期能够执行
Vector和Scalar,所以5个ALU最多可以处理5组
Scalar运算或1组Vector和2组Scalar运算。不过,
无论是5D,还是4D+1D.5个ALU并不是全功能
的,根据ATI的设计.5个ALU中.只有1个能够
执行函数运算.浮点运算以及Multipy运算.但不
能进行ADD运算;其余的4个只能做Multipy ADD
运算。不过,R600的优势很大一个部分在于,每个
流处理器都能够独立执行完全不同的指令,而
NVIDIA的每个流处理器只能在一个周期内,执行
完全相同的指令。
根据ATI提供的信息,Radeon HD 2900XT最
高可以达到475GFLOPs的运算能力,竞争对手的
『i DlV No.7.2o07 59
维普资讯
策划:本刊编辑部
8800Ultra可以达到576GFLOPs,但运算能力的差
别,并不能代表一切,二者的流处理器设计完全不
同:各自的优势会根据软件的不同而不同
有助于提高执行效率,所以在R600中,一个周期
可以处理32个Stencil Shadow。另外,8比l的z
Compression压缩比显然已经不够了,R600中,
ATI将Z Compression的压缩比提升到了16比1,
Z Compression压缩比的提升,能够有效的降低显
存位宽的占用。纹理数据所占用的空间进一步降
低。Z Compression压缩比的提升,对Z—Buffer的
要求也有所提高,ATI将R600的Z—Buffer设置成
可以独立进行压缩运算,进一步的提升了效率。
很重要的一点是,R600加入了Re—Z机制,在
Re—Z机制中,Pixel在进行Render之前,会首先检
查,滤除不会被显示在画面上的Pixel;而普通的图
ATI为了提高R600的sIMD架构的执行效率,
在设定引擎中,增加了指令合并的功能~一每个不
形显示核心,会在Pixel进行Render后进行检查,大
大浪费了系统的资源。我们可以认为,Re—Z机制就
是R600绘制预测的一个部分。
是完全独立的指令,将被合成成一个较长的指令,
再交给流处理器,提升了ALU的利用率。在另一个
方面,ATI延续了Ultra Threaded Dispatch Pro-
NVIDIA的G80图形显示核心,整合了6个
Render-Back Ends,从理论上来说,G80在一个周
期内能够处理24 Pixels,G80拥有两组Z/Stencil
Processor Units
,
cessor的设计,在数据和指令交给流处理器和顶点/
纹理单元之前,需要经过2个排序以及仲裁单元,决
定哪些指令需要优先处理,哪些指令不需要等待运
算结果,哪些指令需要为其他指令腾出空间,等等。
另外,Shader Instuction Cache以及Shader Constant
Cache,都存储了一些资源,当重复的时候,可以
因此.G80在一个周期内,能够
进行48个Stencil Shadow的运算。从单纯的规格上
看,G80在这个部分的确要强于R600,但16比1
的Z Compression压缩比和Re—Z机制的加入,可
以在软件的支持下,挽回一些差距。
直接从缓存中提取,降低延迟,从而提升执行效率。
虽然,每一组SIMD都是完全独立的,ult ra
Threaded Dispatch Processor却可以将相关的运算,
迟。
更灵活的CFAA反锯齿模式
抗锯齿设置一直是提升画质的技术,而高端图
同时放入相同的SIMD中,进一步降低了运算的延
形显示芯片恰恰能够在速度和画质之间,具备良好
的平衡性——不会因为画质的提升而降低应用软件
的速度。一直以来,ATI和NVIDIA在画质方面均
有所进步。NVIDIA在G80中,加入了CSAA,抗
锯齿的等级从上代产品的8x提升到了16x,画面质
量大幅度提升。ATI同样在R600中,加入了全新
的抗锯齿模式CFAA。
新一代的Radeon HD 2900XT和上代的
Radeon X1950XTX相比,保持了4个Render・Back
Ends的设计,理论上来说,一个周期能够处理l6个
Pixels
.
但是R600较上代产品.多出了一组z,
.
Stencil Processor Unit
Z/Stencil处理单元的出现.
60 No.7.2007 I ̄DIY
维普资讯
e辔{ e 0 m
Radeon HD 2900XT深度解析
让理性 |导消费 让D 1 y改变生活
CFAA是Custom Filter Anti—Aliasing的简写
一
般的抗锯齿技术的采样数据 均为采样点范围内
的数据 而CFAA则可以读出采样点边缘外围的数
据 大大的提升了采样的精确度。根据ATI的技术
资料 CFAA可以分为Narrow Tent以及Wide
Tent。
细心的读者会发现:R600一直宣传支持24x
CFAA 为什么无论采用Narrow Tent还是Wide
Tent 都没有达到24x CFAA呢?是的 R600中的
确加入了一项名为Edge Detection的锯齿侦测技术
能够修补画面上所有被侦测出的锯齿 当4x AA和
8x AA搭配Edge Detection技术后 才能够称之为
12x和24x CFAA。实际上 ATI目前尚未完成Edge
Detection技术驱动程序的开发 所以我们依旧无
法看到Edge Detection技术带来的画面体验。抗锯
齿等级的增加 同时带来了另外一个问题:显存带
宽的占用率越来越高 为了解决这个问题 ATI将
压缩比提升到了128比1 一定程度上降低了CFAA
模式对显存部分的负载。
实际上Narrow Tent和Wide Tent两种取样方
式很容易理解 Narrowt Tent是指读取取样点范围
全新Tessellation增益技术
Tessellation增益技术是ATI备受瞩目 且引
以为傲的技术 这项技术首先出现在微软的
Xbox360游戏主机中 Xenos图形显示核心就具备
内较近的数据 正常的2x AA/4x AA/8X AA搭配
Narrowt Tent后 变成4x AA/6x AA,12x AA
(CFAA);而Wide Tent读取的则是取样点范围内
较远的数据 使用后2x AA/4x AA/8X AA将变成
6x AA/8x AA/16x AA(CFAA)。
Tessellation增益技术。Tessellation增益技术可以
将数据在进入Vertex Shader运算前 以编程技术做
出修补。Te s sel1atiOn增益技术是微软下一代
DirectX的必备功能 由于和微软紧密的关系 ATI
在R600中已经整合了该技术。
厦 DlV No.7.2007 61
维普资讯
策划:本刊编辑部
根据ATI的官方资料显示,Tessellation增益
技术可以把一个简单的多边形,分割成更少的三角
形.并且以优秀的编程技术,并使这些三角形加入
更加细致的轮廓。经过Pre—Tessellation技术缩减
后.高达1280038个三角形组成的物件,可以减少
到840个:而通过Tessellation增益技术后.可恢
复到100080238个。不过,这些三角形所占用的
VBS(VRAM Buffer Size)由之前的45MB下降
dress Unit
.
这些Texture Address Unit可以用作
Shader指令,为Texture进行寻址工作。每组Texture
Address Unit可以运算1个Geometry Shader或
Pixel Shader的Texture Fetches(纹理拾取):但如
果要执行Vertex Texture Fetches的话.就需要多
负责一个Vertex Fetches。
到100KB左右:但是执行时间增长至之前的两倍。
由此可见,Tessellation增益技术可以使游戏的执
行效率提升,或者提升游戏的精细度,相当灵活
Tessellation增益技术必须通过游戏 应用软
揭开Texture Unit,我们能够看到Texture
Samplers
,
R600中共计80个。每个Texture Sam—
pier在一个周期可以处理1次FP32数据.如果进行
Vertex Fetches计算,则必须占用4个T,exture
Samplers:如果进行Vertex Texture Fetches计算,
必须占用16个。这就意味着每组Texture Units单
元,正好符合同时处理Vertex Fetches和Vertex
Texture Fetches计算的要求。此外,执行Geometry
Shader或Pixel Shader的Texture Fetches,均需要
20个Texture Samplers。
每组Texture Unit内建了4个FP32 Texture
Filiter Units,R600中共有16个,每个周期可以处
理1组64bit的BilinearFiltering(双线性过滤).或
2个周期处理1组l28bit的Bilinear Filtering。这些
件的支持才能够实现,Tessellation增益技术会不
会像DX10一样,陷入没有软件支持的尴尬7.ATI
Texture Filiter Units也可以处理不同格式的Trilin.
ear Filtering或Anisotropic Filtering。在R580中,
在R600中集成了这项技术,想必是希望游戏厂商
能够在引擎开发时,提供对Tessellation增益技术
的支持,目前.ATI的Tessellation增益技术开发
包正在准备中。
GPU并不支持FP Texture Filtering.而在R600中,
可以支持FP32 Texture Filtering,这算是ATI的一
个进步吧。
所有的Texture Unit都会连接32KB的Vertex
Cache.这些Vertex Cache只能供给VS使用;Tex—
更强的Texture单元
Texture Unit一直都是图形显示核心中.最重
要的部分之一。R600在Texture Unit的设计上.采
用了每组SIMD连接l组Texture Unit的方式.R600
ture Unit还连接了可以供给所有Shader使用的
32KB L1 Texture Cache。这种弹性的设计令Ver—
tex Fetch资源,能够被再利用在Texture Fetches
上.一定程度上提高了效率,减少了资源的浪费:
容量巨大的256KB L2 Cache也有助于提升Texture
中共有4组Texture Unit。每个纹理单元中,拥有
8个Texture Address Unit共计32个Texture Ad.
的计算效率。另外.ATI在R600中,引入了压缩
维普资讯
键 键 pi,/镑{ e 0 m
Radeon HD 2900XT深度解析
繇 让理性引导消费 让D l Y改变生活
比9:9:9:5的REGB 32bit HDR模式(DX10中
还有一种是11:11:10模式),能够提供对67MT
(Texture Size=8192 x 8192)解析度Texture的支
持。
反观竞争对手的G80图形显示核心,G80整合
了32个Texture Address Units 64个Texture Fil—
ter Units
,
理论上每个周期可以进行32个Unfil—
tered Texture Samples或者Filtered Texture Samples
的计算。R600最多只能在一个周期内,处理16个
Unfiltered Texture Samples和l 6个Filtered Texture
Samples,或32个Unfiltered Texture Samples。R600
在技术规格上有一些劣势,但却能够同时处理UTS
.
和FTS,所以只要有软件的支持,R600的整体表现
会更进一步。 .
业界领先的51 2bit显存位宽
512bit显存位宽是R600图形显示芯片在规格
上的另一个特点 虽然只搭配了1 6 50MH z的
DDR3显存 但显存带宽已经达到了l05 6GB/s,而
R580中优秀的环形总线设计,经过改进后 使R600
外,R600中加入了PCI Express Ringstop,这样GPU
在读取数据的时候,同样不需要Crossbar Switch。
达到了1024bit内部环形显存位宽。
以往的Crossbar Switch在进行内存读取的时
AVIVO HD
蓝光和HD—DVD的推出,引领我们进入了高
清时代。越来越多的高清影片采用H 264、VC一1、
Mpeg2等方式进行编码。PC在进行视频解码的时
候,需要CPU担负起大量工作 而拥有超过CPU
晶体管数量数倍的图形显示芯片,却一直在闲置。
ATI和NVIDIA都看到了这一点,为了解放CPU,
降低CPU在高清视频影片播放时的负载,ATI和
NVIDIA纷纷推出了自主研发的AVIV0和
候,Client Interface会对显存控制器提出读取请求
显存控制器会做出计划,并对显存发出指令,要求
PureVideo视频回放技术。
从Radeon Xl000系列图形显示芯片开始 ATI
The HD V ̄de。 ecode Ch
H 264/AVC can also use cABAc
based compression
CABAC offers verv high
compression ratos w^Ile
min}mizing}nformat ̄bn fvideo
将数据传输到控制器中,再由显存控制器传回到
Cleint Interface
,
e:CABAC
HPEG ̄
A
 ̄,C
延迟很高。在R600的环形显存总
线的设计中,由平常的2组256bit只读环形管道,增
加了2组256bit只写环形管道,所以,写入的时候
detail)Ioss ‘
_豳 擘 ¨ i
不需要通过Crossbar Switch,写入效率大幅度提
升。4组256bit的环形管道,组成了l024bit的内部
环形显存位宽。
在R600中,Ringstop数量依然是4组,每组的
RingStop内部包括了128bit显存界面,可以连接4颗
The adeoff}s that Its very
computationafly expensive and
challenging to pc processors
・
Process ls particularly
unfriendly to CPU's branch
prediction Joglc
・
Not paralleIizable so}t doesn
ift On the GPU pipeline
曩 。7 1.誊 ¨ M
圜。l5 1t~,0。 ¨一 矗
蟹 ~~一 …
维普资讯
策划:本刊编辑部
在所有的图形显示芯片中,整合了AVIVO硬件视
频解码引擎.R600也不例外.ATI改进了AVIVO.
并重新命名为AVIVO HD。AVIVO HD不再是简
单的视频引擎.还增加了音频部分。而音频部分的
加入,正是AVIVO HD最大的革新。Radeon HD
2000系列图形显示核心内部整合了5.1数字音频控
制单元.数字音频数据能够通过HDMI输出,同时
还能够输出视频信号.而目前市场上大部分提供
HDMI的显卡.均不能够提供音频输出.或只能通
过转接提供音频输出。当然,如果你有一块高档声
卡.也可以通过同轴接口,将音频数据输入R600
AVIVO HD提供了一个完整的视频解码解决方
案 我们知道,高清视频解码的流程是:比特流处
理/信息有损解码~波形变换~像素预测~区块重排
~
中.再由HDMI进行音频、视频数据输出。
遗憾的是,Radeon HD 2900XT拥有AVIVO
HD音/视频处理的能力,却缺少UVD通过视频解
后期处理,如果是全部为CPU进行解码,那么这
些工作都需要CPU去做,CPU占用率自然而然难
以控制;而AVIVO视频解码技术.在比特流处理/
信息有损解码这个部分是CPU来进行的;但是全新
的UVD能够独立运算4个部分,完全将CPU从繁
杂的工作中解脱出来。
竞争对手NVIDIA在G84/86上引入了全新的
PureVideo HD PureVideo HD基于一颗集成在核
心内的BSP处理器,专门负责硬件解码。有趣的是
面向主流、中低端市场的G84/86系列图形显示芯
片 才能够支持第二代PureVideo引擎 GS0只支
持第一代PureVideo。
Radeon HD 2900XT显卡介绍
码控制器.而只有Radeon HD 2600系列和Radeon
HD 2400系列图形显示芯片.才整合了UVD视频
解码控制器。实际上。高端的2900XT不整合UVD
也是有一定道理的。高端显卡必定搭配高端的处理
器。处理器能够独立完成对VC一1、H.264的解码运
算;HD 2600和2400系列图形显示芯片通常会搭
配主流、低端处理器 处理器的解码能力相对较低。
搭配了UVD的2600和2400系列产品。能够分担
CPU的工作。使CPU能够在播放视频的时候.同
时能够进行一些后台运算。
维普资讯
糖
★
》 } q
§ 0 ;
《
#
l A
嬉由
§
O -
垂
誊
毒
{
嚣
^
. .+
《
#
¨
。冀
0 ●
0
l
诤
0
‘
,
口
O
0
。
々
o
o
’ ,
三 §博
.
,“
静
# .
一
§
∥
§罐、
。
. 。。
未0 ≥;豁
々≈ l :.{《鬈l .. , {tj; l lt , 1 +
;… 鑫
!} *《
n
●
《
§ 协 。
:薅 _
0
0
√ ;
0
O O Ie}
川
鬟
纛
一
l
《 } 冀 一
} { }, 搿
一
。0
.1
一 “
警●
铡
8
l
舞
藕
黪
一。 景
.
£
_l l-.
O
-- ; ’
。
…
: : 篙蠢篱
:
,
十
‘
fl
●
:
{ 藉 簧麓
潦
自
l {
:::
;
0
㈠
{ ¨
_・
●=::
:
’。--
・・I
:
¨一 f
●
::
静
■”
0
:0 -
; ÷{
;
毋
,
0
’
.I0 == !
臻 辩 … 。搽。 ! 辩
≈f ll一
l
巷
维普资讯
策划:本刊编辑部
Radeon HD 2900XT性能测试
硬件测试平台
处理器
主板
Intc1C0糟2Dl的E6850
^sJusP5KDe1m【e(DDR2}
内存
硬盘
操作系统
显示驱动
DireetX版本
Corsair删S2 DDR2.1O66 2GB Du8l Channel 4-4—4—12
WD R印t0rx 15OGB loo0o ̄m
软件测试平台
Wm ̄ws XP Professna1 SP2tWi ̄ws Vista H0me Edid0n
Forccwarc 158.24 F0r Vist ̄158.22 For)(P WHQL
A11Cata1ysl 7,5 ForVista/XPWHQL
. Direct)(9.oc,Direct)(10
关于测试的说明:测试中,我们使用了Fraps
记录路点之间的FPS,为了保证测试的准确性,我
们以5次作为一个基准,测试结果是5次测试结束
后,去掉最高值和最低值后,剩下3次加权平均后
获得。另外,由于Windows Vista下OpenGL性能
低下,所以测试中我们将OpenGL测试项目《雷神
之锤4》放在了Windows XP下进行。
至于在整个2900XT测试中的对比显卡,我们
选择了ATI上代旗舰Radeon X195oxTx、NVIDIA
基于G80图形显示核心l的GeForce 8800GTX、
GeForce 8800GTS 640MB、GeForce 88OOGTS
高的频率将使得这款8800GTS获得更强的性能。
测试成绩分析
正如技术部分对R600的分析,320个Stream
能,但是纹理单元的弱势,也令R600失去了一些
项目获胜的机会。测试我们选择了被NVIDIA指责
Units在性能测试中表现出了优异的性
3 20MB,同时还选择了市场上比较特殊的一款
Processor
GeForce 8800GTS 640MB OC版本。这款产品的
核心频率达到了600MHz.显存频率1800MHz ̄更
游戏基准测试Fu ̄re 3DMark系列
.
I RadonHD 2900xT l Ra ̄onX1950XTX GeFo ̄e 8800GTX.I GeF0rce 8800GTS l GeF0rce 8800GTS oc I GeF0rce 8800GTS 320
3DMar ̄l 10396 l6690 1o635 I 8870 I 1o503 I 7725
3DMark05 I 17950 I13568 16845 I 155o6 l 18O64 I 145ol
分辨率160o×1 00HighQuai
Radcon}ID
2弓00XT
。
GeF0rce
880 玎 0C
RadeOn
X1950XTX
GeFdree
8800GTX
GcFote ̄
8800G.rS
GeForce
88(10(邢32o
极度恐慌
彩虹六号:维加斯
极品飞车1O
富神之锤4
上古卷轴4
无限试驾
122
48.9
48.8
129.8
63.1
74.9
85
252
35.6
93.7
32.1
34.4
129.0
21.3
N,A
156
47.0
56.2
137.4
59.6
67.8
ll3
32.9
39.8
115.6
44.8
51.3
136
38.8
43.2
129.6.
59.2
62.1
170.3
41.0
26
11O
3Z4
39.4
60.8
43.8
50.8
152.8
l1.0
N,A
半条命2:失落海岸线
切尔诺贝利阴云
狂野西部(DX10)
147.3
2q.3
24
178.2
46 8
27
156.4
35.2
22
、
分辨率1920×1200HigIl QlI蛐ty
R耐eonHD Rade0ll GeForee GeForce GeFo ̄e GeForee
2900XT X195o】 8800GTX 8800Grs 88咖GTSoc 8800(I1’S 32O
极度恐慌
彩虹六号维加斯
极品飞车10
富神之锤4
上古卷轴4
无限试驾
半条命2:失落海岸线
切尔诺贝利阴云
狂野西部(DX10)
l02
41.3
43.6
126.3
56.2
64.2
l27.6
26.2
20
75
2L9
30.1
8o.9
29.0
30.9
94.1
18.2
NIA
137
39.6
47.2
133.2
52.3
60.1
165.6
’ 加6
24
96
28.3
33.6
l109
加.9
43.2
138.4
29.4
16
l13
37.2
41.5
130.6
48.0
522
145.9
35.7
19
95
20.0
33.9
47.3
加.6
43.1
138.4
10.7
N,A
66 No.7.2007 嘲 V
维普资讯
魄魄嗡
Radeon HD 2900XT深度解析
e
C d y e()m
让D I Y改变生活 Y 让理性 导消费
分辨率2560 X 160t)High Qu棚ty
Radeon HD Radeon GeForcc GeForcc GeForcc GeForce
2900XT Xl95OX1lx 880(N3Tx 880oGTs 880oGTS 0C 880oGTS 320
极度恐慌 62 42 85 印 7l 58
彩虹六号:维加斯
极品飞车l0
25.6
29.7
l】6
l7.5
27.8
2q9
l8.2
20.6
23.6
25.1
3.0
N/A
上古卷轴4
无限试驾
36.7
43.0
20.6
20.6
386
36.6
28.3
27 3
34.7
334
276
2l 2
半条命2.失落海岸线
切尔诺贝利阴云
・
87.9
16 7
26.8
10.6
1326
26.1
97.3
l8.5
l】5.2
22.9
97.4
3.5
分辨率l60o×l2004A ̄I6AFHighQu ̄lty
Rade0nHD
.
Radean
X195OXTx
GeForee
880013Tx
GeForee
880oGTS
GeForce
880oGTS oC
GeForee
880oGTS 320 2900xT
极度恐慌
彩虹六号维加斯
极品飞车l0
留神之锤4
61
43.3
32.5
94.2
59
22-3
32.2
70.2
86
30 3
49.8
l10.6
印
226
346
77.7
73
26_3
40 8
90.6
59
Nf
340
加0
上古卷轴4 48.6 28.9 50.0 38.4 43.7
半条命2:失落海岸线 l22.7 ll2.6 l49.5 l】2.6 138.6
37.0
lo8.7
分辨率1920×1200 4A ̄I6AF High Qu ̄ty、
RadeonHD
2900xT
RacIeon
Xl950X1lx
GeForee
880013Tx
GeForce
880oGTS
GeForce
880oGTs O12
GeFor ̄
880oGTS 320
极度恐慌 54 49 72 53 62 52
彩虹六号:维加斯
橛品飞车l0
留神之锤4
40.2
27.8
82 6
19.6
26.7
6o.7
279
40.6
93-3
l22
29.4
69.5
14.5
33-3
81.0
N,A
29.0
25.8
上古卷轴4
半条命2:失落海岸线
42l3
86.4
‘
IhdeonHD
29(}QXT
25 8
77.2
45.2
l30.2
33-3
卯.2
40.1
1l7.8
33-3
784
分辨率256o×16004A ̄I6AFHighQuanty
Rlld ̄n
X】950X1X
GeFor ̄
880013Tx
GeFo ̄e
880oGTS
GeForce
8N)OGTSOC
GeForce
8800GTS 320
极度恐慌
彩虹六号:维加斯
极品飞车l0
33
24.5
17.9
29
9.8
l6.2
39
l6
246
27
l 5
l5 9
3l
3.9
l8.8
2l
N/A
N/A
上古卷轴4
半条命2:失落海岸线
29.2
56.8
l8.6
5l
289
82.9
20.2
53.6
24.7
76.2
6.5
l9.5
偏向ATI的游戏,也选择了被ATI认为,和NVIDIA
有着良好关系的游戏,当然,也有被广大玩家、厂
商认为是比较公正的测试项目。但经过测试我们发
现:性能依旧是成绩的主导,在NVIDIA的优势项
目中,ATI并不输给NVIDIA,还在-_些测试中大
幅度的领先NVIDIA。这就说明了,320个sPu的
实力的确不可小视。
Radeon HD 2900XT高清视频回放测试
高清视频播放自从Radeon X1000图形显示卡
发布后,就成为了我们测试中的一个必备项目,
Radeon HD 2900XT的测试也不例外。在高清视频
回放测试中,我们使用了H.264编码的《通天塔》
1080P版本。为了最大程度的体现体现GPU对于
CPU的解放程度,我们将Intel Core 2 Duo E6850
处理器降频到l33MHz外频。
嘲D No.7_2007 67
维普资讯
簧捌:本刊编辑部
功耗和运行时的高温、噪音 一直是高端显卡
所拥有的三大”特性” 甚至有些消费者很难想象
一
款显卡的功耗在250W以上 这个功耗已经达到
了自己电源的额定功率!而温度更是高达待机60
度,满载80~90度j如果不能够将高温迅速散去 就
可能导致核心、显存或供电部分烧毁.因此高端显
卡的散热器不但 个头 巨大,工作起来的噪声也
非常恐怖。其实,高端显卡的高功耗 高温都是能
够理解的。例如说2900XT 晶体管的数量达到了
7亿个 采用了80纳米制造工艺 但核心面积只有
21mm×20mm 而NVIDIA G80图形核心,集成
了6.81亿晶体管 基于TSMC 90纳米制造工艺 核
心面积420~490平方毫米。这么高的集成度 功耗、
温度的控制难度可想而知。
为了保证测试的稳定 我们使用了Seasonic
M12 800W电源 800W的功率足以满足整套平台
的使用,同时,为了达到最好的测试效果 我们也
使用了一款额定功率400W的电源进行测试,测试
中2900XT的稳定性同样优秀。
测试结果和我们的猜测几乎一致 Radeon HD
2900XT并没有能够表现出较低的温度和功耗 但
绝不像外界传闻的那么高 400W的电源已经能够
满足一套中高端平台和2900XT的需求。
Radeon HD 2900XT抗锯齿画面对比
在文章的前一个技术部分 我们已经谈到了
2900XT在抗锯齿方面的一些改变,枯燥的技术是
很难被人接受的,还是让我们了解下GeFO rce
8 800GTS、RadeOil HD 2900XT和Radeon
X1950XTX三款显卡的抗锯齿表现。测试版的驱动
可以令Radeon HD 2900XT工作在24x CFAA下
但我们使用的驱动程序却无法打开24x cFAA。
对比三张图片,除了1950XTX渲染后锯齿较
为明显外 2900XT和GeForce 8800GTS打抗锯齿
后 图片锯齿有了明显的改善,但是2900XT的柔
化度要更好一些。遗憾的是.大多数的用户目前还 无法打开24x CFAA
}‘R耐eonHD 2900XT温度、功耗测试(待机/满载)
。
}f 2900XT f 1950XI'X l 8800GTS f 8800GTX
I功耗
温度
l
}
224/340W
66/92。c
I
I
172t230W
53/72。c
I
J
195/270W
65/77。c
I
J
203/320W
74/85。C
维普资讯
W W /9 C a i y.e 0 m
让理性引导消费 让D I Y改变生活
Radeon HD 2900XT深度解析
c 、
ATI Mobility Radeon HD 2000系列产品规格表
MobiliyRadeotnHD MobiliyRatdeonHD MobiliyRatdeonHD
’
MobiifyRatdeonHD Mobiliyt Radeon HD
2300
产品定位
核心频率
显存频率
240。...
主流市场
350,-450MHz
4O0--500h
2400xT
主流市场
5OO-600 珏Iz
600--700 №
260o
.
性能甩户
400-500MI ̄
550H目0m
2600xT
.-游戏用户
6OO--700h珏Iz
700-750l吡
八门级
450-,48砸
400-550 ̄仆k
制造工艺
DirectX版本 。
9Ohm
9.0e
65nm
DX10
65nm
DX10
65rim
DX10
65//m
DX10
UVD
Powerplay
支持
6.0
支持
7.0
支持
7.0
支持
7.0
支持
7 0
显存位宽 64,12蹦t 64bit 64bit 64,128bit 641128bit
衍生一一移动平台同样出色
基于R600出色的统一Shader架构.ATI继
下,Shader的运算能力也不会低于G80。不过.我
们更加关心R600的纹理过滤部分。根据我们的测
试结果.2900XT在16x AF下的纹理过滤运算能力
要低于GeForce 8800GTS.未来ATI会拿出什么样
的改进方式,我们不得而知。
NVIDIA后,即将推出拥有统一Shader架构的
Mobility Radeon HD 2000系列图形显示芯片.这
就意味着在短时间内.移动平台也将会全面进入
DirectX 10时代。Mobility Radeon HD 2000系列
图形显示芯片目前共有5款产品.分别是Mobility
Radeon HD 2300、2400、2400XT
、
我们现在无法对R600和G80的优劣做出一个
评价一一用DirectX 10的显卡运行DirectX 9游戏
2600、2600XT。
根本无法展现其真实性能.而DirectX 10游戏目前
很难见到。多数游戏厂商尚未完成DirectX 10下游
戏的开发,或者在进行引擎的改进。另外.游戏引
擎和显卡的联系很大,采用不同引擎的游戏.在测
试中多少都具有一些倾向性。我们缺少一款能够作
Mobility Radeon HD 2300作为一款有差别的
HD 2000系列产品.产品定位入门级,无论是制造
工艺、PowerPlay节电技术还是DirectX版本.都
要落后其余的2000系列产品。我们从ATI了解到.
Mobility Radeon HD 2300将会是一款面向低端用
为基准的DirectX 10测试程序进行测试.从而得到
优劣的结论。
户的产品.价格相对比较低廉.因此规格上有所缩
减也是无可厚非的。
写在最后的话
我们花费了一段时间.对R600进行了比较详
细的测试。理论上来说.次高端的Radeon HD
2900XT的竞争对手应该是GeForce 8800GTS.但
从规格上看,2 900XT已经超过了G eFO rc e
8800GTX!但是在实际性能测试中.Radeon HD
2900XT战胜了GeForce 8800GTS.但和性能更强
的8 800GTX还有一段差距。至于高频版本的
GeForce 8800GTS 640MB
,
性能较公版高出很多.
399美元的Radeon HD 2900XT.效能较同类
别产品来说.相当的优秀。Radeon HD 2900xT虽
然功耗和温度都较高.但这并不足以埋没2900XT
的能力。我们同样期待ATI面向移动和桌面Radeon
但在大多数测试项目上.和2900XT相比依旧落败。
2900XT有一些我们认为很特殊、很优秀的特
性.例如Tessellation增益技术、320个Stream
Processor Units。遗憾的是.不完善的驱动无法完
全发挥这些优秀特性的性能。ATI对于超标量架构
的诠释.还需要继续加强;同时.VLIW指令的整
合也是需要解决的一个问题。相比于G80.R600核
心更加偏重于平行的大数量Shader运算.平行条件
HD 2600、2400系列产品的发布.毕竟这些产品才
是大多数消费者能够接受的。
2024年9月11日发(作者:太叔雁芙)
维普资讯
瓣 .p C a j C 0㈧
Radeon HD 2900XT深度解析
擎繇 让理性;{导消费 让DI y改变生活
整整半年以前,NVIDIA发布了业界第一款支持DirectX 10 API的图形显示芯片G80,从此,NVIDIA带领我们走入了
DirectX 1O时代。DirectX 10带给消费者的是完全不同的视觉盛宴。作为唯一一家能够和NVIDIA竞争的图形显示芯片巨头,
ATI一直致力于DirectX10产品的研发.终于在今年的5月14日,ATI正式发布了我们期待已久的RadeonHD 2900XT 吹
响了DirectX 10的第一次决战号角。
重重危机,R600让ATI走出危难 竞争对手率先构架完成产品线
早在1年之前,无数的消息来源显示了ATI和
NVIDIA,均将在最短时间内发布支持DirectX l0
API的图形显示芯片R600和G80。在2006年l 1月.
NVIDIA率先推出了支持DirectX l0的G80图形显
示核心。很快的,NVIDIA通过G80的良好销售
抢夺了一些高端市场份额 紧接着NVIDIA再次推
出了在显存规格上Costdown的G80产品.从ATI
手中抢走绝大部分中高端市场份额;但NVIDIA并
不满足,在今年的4月17日.又推出了G84/G86图
形显示核心,将DirectX 10引入了主流市场。至此.
GeForce 8系列的产品线基本构架完成。
结束了1 9个月的等待
一
般来说 图形显示芯片的技术、架构的更新
周期,大约是12-1 8个月 显然,从2005年10月
维普资讯
策划:本刊编辑部
HD 2000系列将不但在性能上具有竞争力,在高清
视频、高保真音频以及其他影音娱乐方面同样具有
易用性和竞争力。无论是以性能为前提,还是以娱
乐为前提的用户,都可以通过Radeon HD 2000系
列产品,获得最好的影音娱乐享受。
ATIRadeonHD2000系列产品线介绍
高端对决——2900XT Vs 8800GTS
R600是ATI本代高端产品的研发代号,其对
应的产品是已经推出的Radeon HD 2900XT以及
RadeON HD 2900XTX。,目前的Radeorl HD
22日发布R520到现在, R600已经经历了19个月
的酝酿,从更新周期上计算,推出的时间并不算太
晚。但从市场的角度来考虑,ATI已经失去了先机,
如果要抢回被竞争对手占据的份额,就意味着ATI
2900XTX只是特供OEM的产品,在零售市场上很
难找到其踪迹。目前已经上市的:R ad eon HD
2900XT拥有7.2亿晶体管,采用80纳米制造工艺,
拥有恐怖的320个Stream Processor Units,核心频
率740MHz,具备了16个Texture Units、16个ROP,
可以搭配GDDR4/GDDR3显存 公版采用了单颗
显存32bit 32MB规格的设计,16颗显存组成了
512bit
、
必须拿出性能更加优秀、价格更加低廉的产品。终
于在今年的5月l4日,ATI发布了支持DirectX l0
的产品Radeon HD 2900XT。
其实,ATI稍晚发布R600,也是有一定原因的。
竞争对手率先透露的产品信息 效能信息,尤其是
AMD在半导体方面的开发经验,都使得ATI对
512MB的显存规格;显存频率1650MHz,
待机功耗低于215W。
Radeon HD 2900XT是AT1次高端的产品,其
l
R600的改进更具有针对性。ATI也在这段时间内,
充分的调整了架构以及产品线,并且通过和半导体
芯片制造商更深层次的合作,有效的降低了成本。
可以说,Radeon HD 2000系列图形显示芯片,是
翳 醛…
慰 _
ATI花费巨大精力后,推出的产品。
I I
看Radeon HD 2000系列迎战NVIDIA
我们在上文中提到了,NVIDIA已经在低、中、
高端分别推出了产品,ATI面临的是来自NVIDIA
和市场的双重压力,能否后来居上,Radeon HD
2000系列产品将起到决定性的作用。Radeon HD
2000系列产品,包括了高端的Radeon HD 2900系
列;中端的Radeon HD 2600系列以及低端的
Radeon HD 2400系列,3个系列的产品涵盖了整个
!
GeForce 8800GTS将是2900XT的最大竞争对手
竞争对手为NVIDIA采用G80图形显示核心的高端
产品GeForce 8800GTS,单从规格上来看,无论是
流处理单元的数量还是显存位宽,Radeon HD
2900XT要明显强于GeForce 8800GTS,甚至是更
强悍的GeForce 8800GTX、8800Ultra。除了这些
参数差别外,Radeon HD 2900XT还拥有数字音频
输出以及HDMI视频、音频输出功能!更重要的一
点,Radeon HD 2900XT的价格相当便宜,官方定
桌面图形芯片市场。
从产品的命名上,ATI放弃了Radeon X1000
系列的“x”,转而使用 HD”来做数字之前的标
价为399美金(512bit/512MB GDDR3显存版本)。
号,全新命名方式的采用,体现了ATI在产品推广
方面的用意一一性能将和附加功能并重,Radeon
而同样价格的GeForce 8800GTS,只拥有96个流
处理器、320bit显存位宽。
维普资讯
W W。w P C d l Y C O
‘
Radeon HD 2900XT深度解析
p 稻 让理性} 消费
12D f Y改变生活 i釜一
中端战役——2600系列Vs 8600系列
在主流市场上.Radeon HD 2600系列将成为
ATI的主打产品,Radeon HD 2600系列研发代号
为RV630,采用65纳米制造工艺,集成了超过3.8
亿晶体管,拥有120个Stream Processor Units,核
心频率600MHz以上.具备8个Texture Units、4
Radeon HD 2400系列.这个系列的产品主要面向
中低端市场,Radeon HD 2400系列核心研发代号
为RV610.采用65纳米制造工艺.集成了1.8亿晶
体管.拥有4O个Stream Processor Units.核心频
率525MHz以上,具备4个Texture UnitS、4个ROP,
显存位宽64bit.容量可选.可以搭配GDDR3或
小于25w。
个ROP.显存位宽128bit,容量256MB,厂商可
GDDR2显存,显存频率高于800MHz.待机功耗
以根据产品的定位、需求,为Radeon HD 2600系
列搭配GDDR4/GDDR3/GDDR2显存,显存频率
高于800MHz,待机功耗小于45W。
Radeon HD 2600系列的主要竞争对手是
NVIDIA GeForce 8600系列产品 Radeon HD 2600
Radeon HD 2400系列产品.‘是ATI即将在低
端市场上投放的一颗重磅炸弹,面对竞争对手的
GeForce 8500GT和Costdown的GeForce 8400GS.
R
adeon HD 2400系列产品以65纳米制造工艺和
.
系列从参数上依旧是领先对手,并且,Radeon HD
2600还能够支持AVIVO HD、数字音频输出以及
HDMI。AVIVO HD是ATI引以为傲的AVIVO视
频回放技术的改进版,能够针对H264、VC一1以及
MPEG2等高清视频编码格式进行硬件解码,因此,
64bit显存位宽,降低了产品的成本。但成本的降低
并没有减少Radeon HD 2400系列产品的功能,
Radeon HD 2400系列同样支持AVIVO HD、
具备AVIVO HD视频回放技术的Radeon HD 2600
系列,能够流畅的播放HD—DVD以及蓝光电影,最
大程度的降低对CPU的依赖。
HDMI视频音频输出和数字音频输出,一定程度上
降低了数字家庭构架的成本。
火拼低端——2400系列Vs 8500/8400
除了Radeon HD 2600系列外,ATI还推出了
匮 DIV No.7.2007 57
维普资讯
策划:本刊编辑部
R600架构分析 ’
行浮点运算或函数运算.和处理整数指令.拥有128
个Streaming Processors的G80.理论上在同一个
作为ATI第一款支持DirectX 10 API的图形
显示芯片.Radeon HD 2000系列抛弃了传统的像
素Shader、顶点Shader的分离式架构。转而采用统
一
周期内.最多能够完成128个数据以及指令运算。
在加入了Dua1 ISSUE的设计后.进行Multiply
Shader架构。说到统一Shader架构.就不得不谈
ADD运算时.可以多进行~组Multipy运算。但
G80的Streaming Processors频率和核心频率并不
到ATI为微软Xbox360游戏主机所设计的Xenos图
形显示芯片。
同步。举例来说.GeForce 8800GTX的核心频率
仅仅为575MHz.而Shader频率却高达1.35GHzj
这就大大提升了Streaming Processors的处理能力。
而在R600的设计中.ATI同步了Stream Processor
设计源自Xenos图形显示芯片
Units和核心频率.Radeon HD 2900XT的Shader
频率仅仅为740MHz,几乎比GeForce 8800GTX
低了一倍。一
Xenos拥有48个Unified Shaders.可以根据需
求.进行顶点运算或者进行像素运算.虽然并不支
持DirectX 10.但Xenos却拥有数据流输出功能.
效率较分离式架构的图形芯片高出不少;同时.
Xenos还可以支持多线程分配。ATI将Xenos称之
为第一代统一Shader架构的图形显示芯片。有了
Xenos的开发经验.R600的统一Shader架构开发
起来更加得心应手.加之和微软的紧密合作.AT1
对DirectX 10的理解可以说更加深刻。在之前的杂
志中.我们详细分析了G80核心架构.在下面的文
章中.我们会通过R600架构和G80架构的对比,详
细的解析ATI第二代统一Shader架构。
320个流处理单元一一颠覆性的数量
众所周知,统一Shader架构中,流处理器的数
量相当重要,R600拥有320个Stream Processdr
Units,而GeForce 8800Ultra只有128个Streaming
Processors
,
数量上大大超过了G80。不过我们需
要解释的是:G80和R600是完全不同的架构,流处
理器的数量对比是没有任何意义的。
让我们先回顾下G8 0的设计.G 80的每个
Streaming Processors
,
在分解ATI R600图形显示核心的架构后,能
够发现ATI和NVIDIA的本质差异。ATI采用了
SIMD(Single Instrucion Multiple Data】的设计,
均能够在同一个周期中,进
核心拥有4组流处理器,并各自连接一组Texture
Units
,
每组拥有16个流处理器,共计64个流处理
58 No.7.2007馐 DIV
维普资讯
爨, 黪 搿f 0 }
1“
Radeon HD 2900XT深度解析
繇 让理性引导消费 让D l Y改变生括
器。细心的读者可能会发现.ATI宣传的Radeon
HD 2900XT拥有320个Stream Processor Units.
翻译成中文是流处理单元.并不是320个流处理
器。
的指令数量.在很大程度上.要取决于UTDP(Ultra
Thred Displath Processor)能将更多的简单指令.
集合成一组VLIW指令.填满一条流水线上的16个
流处理器.80个ALU。为了提升SIMD的运算效
率.ATI在2900XT中加入了8KB的读取缓存.作
为虚拟暂时存储空间.配合Stream Out Buffer.存
储一些不需要经过渲染后端处理的数据。
早在上代的R580图形显示核心中,ATI在每
个Pixel Shader Unit中。集成了4个ALU,R580采
用了标量+矢量的设计 所以每个周期只能处理2
组Scalar运算或1组VectorSD 1组Scalar运算。R600
采用了经过革新的SuperSCalar架构,不再分为
还记得ATI黄金3比1架构吗7每条渲染管线
中拥有3个Pixel Shader Units;ATI的统一Shader
架构和3比1架构拥有异曲同工之妙一一实际上
ATI每个流处理器中,拥有5组ALu.这5组ALu
也就是所谓的5组Stream Processor Units,64个
流处理器共有320个Stream Processor Units。
在ATI每个流处理器中.1组闲置的ALu分支
分预测单元,配置了缓存器,可以存放输出/输出
数据,5组ALu最多可以处理5份数据。所以,
2900XT 320个Stream Processor Units,在一个周
期内.可以完成320分数据。不过,每个SIMD只
能执行一份VLIW指令,因此,每个周期能够执行
Vector和Scalar,所以5个ALU最多可以处理5组
Scalar运算或1组Vector和2组Scalar运算。不过,
无论是5D,还是4D+1D.5个ALU并不是全功能
的,根据ATI的设计.5个ALU中.只有1个能够
执行函数运算.浮点运算以及Multipy运算.但不
能进行ADD运算;其余的4个只能做Multipy ADD
运算。不过,R600的优势很大一个部分在于,每个
流处理器都能够独立执行完全不同的指令,而
NVIDIA的每个流处理器只能在一个周期内,执行
完全相同的指令。
根据ATI提供的信息,Radeon HD 2900XT最
高可以达到475GFLOPs的运算能力,竞争对手的
『i DlV No.7.2o07 59
维普资讯
策划:本刊编辑部
8800Ultra可以达到576GFLOPs,但运算能力的差
别,并不能代表一切,二者的流处理器设计完全不
同:各自的优势会根据软件的不同而不同
有助于提高执行效率,所以在R600中,一个周期
可以处理32个Stencil Shadow。另外,8比l的z
Compression压缩比显然已经不够了,R600中,
ATI将Z Compression的压缩比提升到了16比1,
Z Compression压缩比的提升,能够有效的降低显
存位宽的占用。纹理数据所占用的空间进一步降
低。Z Compression压缩比的提升,对Z—Buffer的
要求也有所提高,ATI将R600的Z—Buffer设置成
可以独立进行压缩运算,进一步的提升了效率。
很重要的一点是,R600加入了Re—Z机制,在
Re—Z机制中,Pixel在进行Render之前,会首先检
查,滤除不会被显示在画面上的Pixel;而普通的图
ATI为了提高R600的sIMD架构的执行效率,
在设定引擎中,增加了指令合并的功能~一每个不
形显示核心,会在Pixel进行Render后进行检查,大
大浪费了系统的资源。我们可以认为,Re—Z机制就
是R600绘制预测的一个部分。
是完全独立的指令,将被合成成一个较长的指令,
再交给流处理器,提升了ALU的利用率。在另一个
方面,ATI延续了Ultra Threaded Dispatch Pro-
NVIDIA的G80图形显示核心,整合了6个
Render-Back Ends,从理论上来说,G80在一个周
期内能够处理24 Pixels,G80拥有两组Z/Stencil
Processor Units
,
cessor的设计,在数据和指令交给流处理器和顶点/
纹理单元之前,需要经过2个排序以及仲裁单元,决
定哪些指令需要优先处理,哪些指令不需要等待运
算结果,哪些指令需要为其他指令腾出空间,等等。
另外,Shader Instuction Cache以及Shader Constant
Cache,都存储了一些资源,当重复的时候,可以
因此.G80在一个周期内,能够
进行48个Stencil Shadow的运算。从单纯的规格上
看,G80在这个部分的确要强于R600,但16比1
的Z Compression压缩比和Re—Z机制的加入,可
以在软件的支持下,挽回一些差距。
直接从缓存中提取,降低延迟,从而提升执行效率。
虽然,每一组SIMD都是完全独立的,ult ra
Threaded Dispatch Processor却可以将相关的运算,
迟。
更灵活的CFAA反锯齿模式
抗锯齿设置一直是提升画质的技术,而高端图
同时放入相同的SIMD中,进一步降低了运算的延
形显示芯片恰恰能够在速度和画质之间,具备良好
的平衡性——不会因为画质的提升而降低应用软件
的速度。一直以来,ATI和NVIDIA在画质方面均
有所进步。NVIDIA在G80中,加入了CSAA,抗
锯齿的等级从上代产品的8x提升到了16x,画面质
量大幅度提升。ATI同样在R600中,加入了全新
的抗锯齿模式CFAA。
新一代的Radeon HD 2900XT和上代的
Radeon X1950XTX相比,保持了4个Render・Back
Ends的设计,理论上来说,一个周期能够处理l6个
Pixels
.
但是R600较上代产品.多出了一组z,
.
Stencil Processor Unit
Z/Stencil处理单元的出现.
60 No.7.2007 I ̄DIY
维普资讯
e辔{ e 0 m
Radeon HD 2900XT深度解析
让理性 |导消费 让D 1 y改变生活
CFAA是Custom Filter Anti—Aliasing的简写
一
般的抗锯齿技术的采样数据 均为采样点范围内
的数据 而CFAA则可以读出采样点边缘外围的数
据 大大的提升了采样的精确度。根据ATI的技术
资料 CFAA可以分为Narrow Tent以及Wide
Tent。
细心的读者会发现:R600一直宣传支持24x
CFAA 为什么无论采用Narrow Tent还是Wide
Tent 都没有达到24x CFAA呢?是的 R600中的
确加入了一项名为Edge Detection的锯齿侦测技术
能够修补画面上所有被侦测出的锯齿 当4x AA和
8x AA搭配Edge Detection技术后 才能够称之为
12x和24x CFAA。实际上 ATI目前尚未完成Edge
Detection技术驱动程序的开发 所以我们依旧无
法看到Edge Detection技术带来的画面体验。抗锯
齿等级的增加 同时带来了另外一个问题:显存带
宽的占用率越来越高 为了解决这个问题 ATI将
压缩比提升到了128比1 一定程度上降低了CFAA
模式对显存部分的负载。
实际上Narrow Tent和Wide Tent两种取样方
式很容易理解 Narrowt Tent是指读取取样点范围
全新Tessellation增益技术
Tessellation增益技术是ATI备受瞩目 且引
以为傲的技术 这项技术首先出现在微软的
Xbox360游戏主机中 Xenos图形显示核心就具备
内较近的数据 正常的2x AA/4x AA/8X AA搭配
Narrowt Tent后 变成4x AA/6x AA,12x AA
(CFAA);而Wide Tent读取的则是取样点范围内
较远的数据 使用后2x AA/4x AA/8X AA将变成
6x AA/8x AA/16x AA(CFAA)。
Tessellation增益技术。Tessellation增益技术可以
将数据在进入Vertex Shader运算前 以编程技术做
出修补。Te s sel1atiOn增益技术是微软下一代
DirectX的必备功能 由于和微软紧密的关系 ATI
在R600中已经整合了该技术。
厦 DlV No.7.2007 61
维普资讯
策划:本刊编辑部
根据ATI的官方资料显示,Tessellation增益
技术可以把一个简单的多边形,分割成更少的三角
形.并且以优秀的编程技术,并使这些三角形加入
更加细致的轮廓。经过Pre—Tessellation技术缩减
后.高达1280038个三角形组成的物件,可以减少
到840个:而通过Tessellation增益技术后.可恢
复到100080238个。不过,这些三角形所占用的
VBS(VRAM Buffer Size)由之前的45MB下降
dress Unit
.
这些Texture Address Unit可以用作
Shader指令,为Texture进行寻址工作。每组Texture
Address Unit可以运算1个Geometry Shader或
Pixel Shader的Texture Fetches(纹理拾取):但如
果要执行Vertex Texture Fetches的话.就需要多
负责一个Vertex Fetches。
到100KB左右:但是执行时间增长至之前的两倍。
由此可见,Tessellation增益技术可以使游戏的执
行效率提升,或者提升游戏的精细度,相当灵活
Tessellation增益技术必须通过游戏 应用软
揭开Texture Unit,我们能够看到Texture
Samplers
,
R600中共计80个。每个Texture Sam—
pier在一个周期可以处理1次FP32数据.如果进行
Vertex Fetches计算,则必须占用4个T,exture
Samplers:如果进行Vertex Texture Fetches计算,
必须占用16个。这就意味着每组Texture Units单
元,正好符合同时处理Vertex Fetches和Vertex
Texture Fetches计算的要求。此外,执行Geometry
Shader或Pixel Shader的Texture Fetches,均需要
20个Texture Samplers。
每组Texture Unit内建了4个FP32 Texture
Filiter Units,R600中共有16个,每个周期可以处
理1组64bit的BilinearFiltering(双线性过滤).或
2个周期处理1组l28bit的Bilinear Filtering。这些
件的支持才能够实现,Tessellation增益技术会不
会像DX10一样,陷入没有软件支持的尴尬7.ATI
Texture Filiter Units也可以处理不同格式的Trilin.
ear Filtering或Anisotropic Filtering。在R580中,
在R600中集成了这项技术,想必是希望游戏厂商
能够在引擎开发时,提供对Tessellation增益技术
的支持,目前.ATI的Tessellation增益技术开发
包正在准备中。
GPU并不支持FP Texture Filtering.而在R600中,
可以支持FP32 Texture Filtering,这算是ATI的一
个进步吧。
所有的Texture Unit都会连接32KB的Vertex
Cache.这些Vertex Cache只能供给VS使用;Tex—
更强的Texture单元
Texture Unit一直都是图形显示核心中.最重
要的部分之一。R600在Texture Unit的设计上.采
用了每组SIMD连接l组Texture Unit的方式.R600
ture Unit还连接了可以供给所有Shader使用的
32KB L1 Texture Cache。这种弹性的设计令Ver—
tex Fetch资源,能够被再利用在Texture Fetches
上.一定程度上提高了效率,减少了资源的浪费:
容量巨大的256KB L2 Cache也有助于提升Texture
中共有4组Texture Unit。每个纹理单元中,拥有
8个Texture Address Unit共计32个Texture Ad.
的计算效率。另外.ATI在R600中,引入了压缩
维普资讯
键 键 pi,/镑{ e 0 m
Radeon HD 2900XT深度解析
繇 让理性引导消费 让D l Y改变生活
比9:9:9:5的REGB 32bit HDR模式(DX10中
还有一种是11:11:10模式),能够提供对67MT
(Texture Size=8192 x 8192)解析度Texture的支
持。
反观竞争对手的G80图形显示核心,G80整合
了32个Texture Address Units 64个Texture Fil—
ter Units
,
理论上每个周期可以进行32个Unfil—
tered Texture Samples或者Filtered Texture Samples
的计算。R600最多只能在一个周期内,处理16个
Unfiltered Texture Samples和l 6个Filtered Texture
Samples,或32个Unfiltered Texture Samples。R600
在技术规格上有一些劣势,但却能够同时处理UTS
.
和FTS,所以只要有软件的支持,R600的整体表现
会更进一步。 .
业界领先的51 2bit显存位宽
512bit显存位宽是R600图形显示芯片在规格
上的另一个特点 虽然只搭配了1 6 50MH z的
DDR3显存 但显存带宽已经达到了l05 6GB/s,而
R580中优秀的环形总线设计,经过改进后 使R600
外,R600中加入了PCI Express Ringstop,这样GPU
在读取数据的时候,同样不需要Crossbar Switch。
达到了1024bit内部环形显存位宽。
以往的Crossbar Switch在进行内存读取的时
AVIVO HD
蓝光和HD—DVD的推出,引领我们进入了高
清时代。越来越多的高清影片采用H 264、VC一1、
Mpeg2等方式进行编码。PC在进行视频解码的时
候,需要CPU担负起大量工作 而拥有超过CPU
晶体管数量数倍的图形显示芯片,却一直在闲置。
ATI和NVIDIA都看到了这一点,为了解放CPU,
降低CPU在高清视频影片播放时的负载,ATI和
NVIDIA纷纷推出了自主研发的AVIV0和
候,Client Interface会对显存控制器提出读取请求
显存控制器会做出计划,并对显存发出指令,要求
PureVideo视频回放技术。
从Radeon Xl000系列图形显示芯片开始 ATI
The HD V ̄de。 ecode Ch
H 264/AVC can also use cABAc
based compression
CABAC offers verv high
compression ratos w^Ile
min}mizing}nformat ̄bn fvideo
将数据传输到控制器中,再由显存控制器传回到
Cleint Interface
,
e:CABAC
HPEG ̄
A
 ̄,C
延迟很高。在R600的环形显存总
线的设计中,由平常的2组256bit只读环形管道,增
加了2组256bit只写环形管道,所以,写入的时候
detail)Ioss ‘
_豳 擘 ¨ i
不需要通过Crossbar Switch,写入效率大幅度提
升。4组256bit的环形管道,组成了l024bit的内部
环形显存位宽。
在R600中,Ringstop数量依然是4组,每组的
RingStop内部包括了128bit显存界面,可以连接4颗
The adeoff}s that Its very
computationafly expensive and
challenging to pc processors
・
Process ls particularly
unfriendly to CPU's branch
prediction Joglc
・
Not paralleIizable so}t doesn
ift On the GPU pipeline
曩 。7 1.誊 ¨ M
圜。l5 1t~,0。 ¨一 矗
蟹 ~~一 …
维普资讯
策划:本刊编辑部
在所有的图形显示芯片中,整合了AVIVO硬件视
频解码引擎.R600也不例外.ATI改进了AVIVO.
并重新命名为AVIVO HD。AVIVO HD不再是简
单的视频引擎.还增加了音频部分。而音频部分的
加入,正是AVIVO HD最大的革新。Radeon HD
2000系列图形显示核心内部整合了5.1数字音频控
制单元.数字音频数据能够通过HDMI输出,同时
还能够输出视频信号.而目前市场上大部分提供
HDMI的显卡.均不能够提供音频输出.或只能通
过转接提供音频输出。当然,如果你有一块高档声
卡.也可以通过同轴接口,将音频数据输入R600
AVIVO HD提供了一个完整的视频解码解决方
案 我们知道,高清视频解码的流程是:比特流处
理/信息有损解码~波形变换~像素预测~区块重排
~
中.再由HDMI进行音频、视频数据输出。
遗憾的是,Radeon HD 2900XT拥有AVIVO
HD音/视频处理的能力,却缺少UVD通过视频解
后期处理,如果是全部为CPU进行解码,那么这
些工作都需要CPU去做,CPU占用率自然而然难
以控制;而AVIVO视频解码技术.在比特流处理/
信息有损解码这个部分是CPU来进行的;但是全新
的UVD能够独立运算4个部分,完全将CPU从繁
杂的工作中解脱出来。
竞争对手NVIDIA在G84/86上引入了全新的
PureVideo HD PureVideo HD基于一颗集成在核
心内的BSP处理器,专门负责硬件解码。有趣的是
面向主流、中低端市场的G84/86系列图形显示芯
片 才能够支持第二代PureVideo引擎 GS0只支
持第一代PureVideo。
Radeon HD 2900XT显卡介绍
码控制器.而只有Radeon HD 2600系列和Radeon
HD 2400系列图形显示芯片.才整合了UVD视频
解码控制器。实际上。高端的2900XT不整合UVD
也是有一定道理的。高端显卡必定搭配高端的处理
器。处理器能够独立完成对VC一1、H.264的解码运
算;HD 2600和2400系列图形显示芯片通常会搭
配主流、低端处理器 处理器的解码能力相对较低。
搭配了UVD的2600和2400系列产品。能够分担
CPU的工作。使CPU能够在播放视频的时候.同
时能够进行一些后台运算。
维普资讯
糖
★
》 } q
§ 0 ;
《
#
l A
嬉由
§
O -
垂
誊
毒
{
嚣
^
. .+
《
#
¨
。冀
0 ●
0
l
诤
0
‘
,
口
O
0
。
々
o
o
’ ,
三 §博
.
,“
静
# .
一
§
∥
§罐、
。
. 。。
未0 ≥;豁
々≈ l :.{《鬈l .. , {tj; l lt , 1 +
;… 鑫
!} *《
n
●
《
§ 协 。
:薅 _
0
0
√ ;
0
O O Ie}
川
鬟
纛
一
l
《 } 冀 一
} { }, 搿
一
。0
.1
一 “
警●
铡
8
l
舞
藕
黪
一。 景
.
£
_l l-.
O
-- ; ’
。
…
: : 篙蠢篱
:
,
十
‘
fl
●
:
{ 藉 簧麓
潦
自
l {
:::
;
0
㈠
{ ¨
_・
●=::
:
’。--
・・I
:
¨一 f
●
::
静
■”
0
:0 -
; ÷{
;
毋
,
0
’
.I0 == !
臻 辩 … 。搽。 ! 辩
≈f ll一
l
巷
维普资讯
策划:本刊编辑部
Radeon HD 2900XT性能测试
硬件测试平台
处理器
主板
Intc1C0糟2Dl的E6850
^sJusP5KDe1m【e(DDR2}
内存
硬盘
操作系统
显示驱动
DireetX版本
Corsair删S2 DDR2.1O66 2GB Du8l Channel 4-4—4—12
WD R印t0rx 15OGB loo0o ̄m
软件测试平台
Wm ̄ws XP Professna1 SP2tWi ̄ws Vista H0me Edid0n
Forccwarc 158.24 F0r Vist ̄158.22 For)(P WHQL
A11Cata1ysl 7,5 ForVista/XPWHQL
. Direct)(9.oc,Direct)(10
关于测试的说明:测试中,我们使用了Fraps
记录路点之间的FPS,为了保证测试的准确性,我
们以5次作为一个基准,测试结果是5次测试结束
后,去掉最高值和最低值后,剩下3次加权平均后
获得。另外,由于Windows Vista下OpenGL性能
低下,所以测试中我们将OpenGL测试项目《雷神
之锤4》放在了Windows XP下进行。
至于在整个2900XT测试中的对比显卡,我们
选择了ATI上代旗舰Radeon X195oxTx、NVIDIA
基于G80图形显示核心l的GeForce 8800GTX、
GeForce 8800GTS 640MB、GeForce 88OOGTS
高的频率将使得这款8800GTS获得更强的性能。
测试成绩分析
正如技术部分对R600的分析,320个Stream
能,但是纹理单元的弱势,也令R600失去了一些
项目获胜的机会。测试我们选择了被NVIDIA指责
Units在性能测试中表现出了优异的性
3 20MB,同时还选择了市场上比较特殊的一款
Processor
GeForce 8800GTS 640MB OC版本。这款产品的
核心频率达到了600MHz.显存频率1800MHz ̄更
游戏基准测试Fu ̄re 3DMark系列
.
I RadonHD 2900xT l Ra ̄onX1950XTX GeFo ̄e 8800GTX.I GeF0rce 8800GTS l GeF0rce 8800GTS oc I GeF0rce 8800GTS 320
3DMar ̄l 10396 l6690 1o635 I 8870 I 1o503 I 7725
3DMark05 I 17950 I13568 16845 I 155o6 l 18O64 I 145ol
分辨率160o×1 00HighQuai
Radcon}ID
2弓00XT
。
GeF0rce
880 玎 0C
RadeOn
X1950XTX
GeFdree
8800GTX
GcFote ̄
8800G.rS
GeForce
88(10(邢32o
极度恐慌
彩虹六号:维加斯
极品飞车1O
富神之锤4
上古卷轴4
无限试驾
122
48.9
48.8
129.8
63.1
74.9
85
252
35.6
93.7
32.1
34.4
129.0
21.3
N,A
156
47.0
56.2
137.4
59.6
67.8
ll3
32.9
39.8
115.6
44.8
51.3
136
38.8
43.2
129.6.
59.2
62.1
170.3
41.0
26
11O
3Z4
39.4
60.8
43.8
50.8
152.8
l1.0
N,A
半条命2:失落海岸线
切尔诺贝利阴云
狂野西部(DX10)
147.3
2q.3
24
178.2
46 8
27
156.4
35.2
22
、
分辨率1920×1200HigIl QlI蛐ty
R耐eonHD Rade0ll GeForee GeForce GeFo ̄e GeForee
2900XT X195o】 8800GTX 8800Grs 88咖GTSoc 8800(I1’S 32O
极度恐慌
彩虹六号维加斯
极品飞车10
富神之锤4
上古卷轴4
无限试驾
半条命2:失落海岸线
切尔诺贝利阴云
狂野西部(DX10)
l02
41.3
43.6
126.3
56.2
64.2
l27.6
26.2
20
75
2L9
30.1
8o.9
29.0
30.9
94.1
18.2
NIA
137
39.6
47.2
133.2
52.3
60.1
165.6
’ 加6
24
96
28.3
33.6
l109
加.9
43.2
138.4
29.4
16
l13
37.2
41.5
130.6
48.0
522
145.9
35.7
19
95
20.0
33.9
47.3
加.6
43.1
138.4
10.7
N,A
66 No.7.2007 嘲 V
维普资讯
魄魄嗡
Radeon HD 2900XT深度解析
e
C d y e()m
让D I Y改变生活 Y 让理性 导消费
分辨率2560 X 160t)High Qu棚ty
Radeon HD Radeon GeForcc GeForcc GeForcc GeForce
2900XT Xl95OX1lx 880(N3Tx 880oGTs 880oGTS 0C 880oGTS 320
极度恐慌 62 42 85 印 7l 58
彩虹六号:维加斯
极品飞车l0
25.6
29.7
l】6
l7.5
27.8
2q9
l8.2
20.6
23.6
25.1
3.0
N/A
上古卷轴4
无限试驾
36.7
43.0
20.6
20.6
386
36.6
28.3
27 3
34.7
334
276
2l 2
半条命2.失落海岸线
切尔诺贝利阴云
・
87.9
16 7
26.8
10.6
1326
26.1
97.3
l8.5
l】5.2
22.9
97.4
3.5
分辨率l60o×l2004A ̄I6AFHighQu ̄lty
Rade0nHD
.
Radean
X195OXTx
GeForee
880013Tx
GeForee
880oGTS
GeForce
880oGTS oC
GeForee
880oGTS 320 2900xT
极度恐慌
彩虹六号维加斯
极品飞车l0
留神之锤4
61
43.3
32.5
94.2
59
22-3
32.2
70.2
86
30 3
49.8
l10.6
印
226
346
77.7
73
26_3
40 8
90.6
59
Nf
340
加0
上古卷轴4 48.6 28.9 50.0 38.4 43.7
半条命2:失落海岸线 l22.7 ll2.6 l49.5 l】2.6 138.6
37.0
lo8.7
分辨率1920×1200 4A ̄I6AF High Qu ̄ty、
RadeonHD
2900xT
RacIeon
Xl950X1lx
GeForee
880013Tx
GeForce
880oGTS
GeForce
880oGTs O12
GeFor ̄
880oGTS 320
极度恐慌 54 49 72 53 62 52
彩虹六号:维加斯
橛品飞车l0
留神之锤4
40.2
27.8
82 6
19.6
26.7
6o.7
279
40.6
93-3
l22
29.4
69.5
14.5
33-3
81.0
N,A
29.0
25.8
上古卷轴4
半条命2:失落海岸线
42l3
86.4
‘
IhdeonHD
29(}QXT
25 8
77.2
45.2
l30.2
33-3
卯.2
40.1
1l7.8
33-3
784
分辨率256o×16004A ̄I6AFHighQuanty
Rlld ̄n
X】950X1X
GeFor ̄
880013Tx
GeFo ̄e
880oGTS
GeForce
8N)OGTSOC
GeForce
8800GTS 320
极度恐慌
彩虹六号:维加斯
极品飞车l0
33
24.5
17.9
29
9.8
l6.2
39
l6
246
27
l 5
l5 9
3l
3.9
l8.8
2l
N/A
N/A
上古卷轴4
半条命2:失落海岸线
29.2
56.8
l8.6
5l
289
82.9
20.2
53.6
24.7
76.2
6.5
l9.5
偏向ATI的游戏,也选择了被ATI认为,和NVIDIA
有着良好关系的游戏,当然,也有被广大玩家、厂
商认为是比较公正的测试项目。但经过测试我们发
现:性能依旧是成绩的主导,在NVIDIA的优势项
目中,ATI并不输给NVIDIA,还在-_些测试中大
幅度的领先NVIDIA。这就说明了,320个sPu的
实力的确不可小视。
Radeon HD 2900XT高清视频回放测试
高清视频播放自从Radeon X1000图形显示卡
发布后,就成为了我们测试中的一个必备项目,
Radeon HD 2900XT的测试也不例外。在高清视频
回放测试中,我们使用了H.264编码的《通天塔》
1080P版本。为了最大程度的体现体现GPU对于
CPU的解放程度,我们将Intel Core 2 Duo E6850
处理器降频到l33MHz外频。
嘲D No.7_2007 67
维普资讯
簧捌:本刊编辑部
功耗和运行时的高温、噪音 一直是高端显卡
所拥有的三大”特性” 甚至有些消费者很难想象
一
款显卡的功耗在250W以上 这个功耗已经达到
了自己电源的额定功率!而温度更是高达待机60
度,满载80~90度j如果不能够将高温迅速散去 就
可能导致核心、显存或供电部分烧毁.因此高端显
卡的散热器不但 个头 巨大,工作起来的噪声也
非常恐怖。其实,高端显卡的高功耗 高温都是能
够理解的。例如说2900XT 晶体管的数量达到了
7亿个 采用了80纳米制造工艺 但核心面积只有
21mm×20mm 而NVIDIA G80图形核心,集成
了6.81亿晶体管 基于TSMC 90纳米制造工艺 核
心面积420~490平方毫米。这么高的集成度 功耗、
温度的控制难度可想而知。
为了保证测试的稳定 我们使用了Seasonic
M12 800W电源 800W的功率足以满足整套平台
的使用,同时,为了达到最好的测试效果 我们也
使用了一款额定功率400W的电源进行测试,测试
中2900XT的稳定性同样优秀。
测试结果和我们的猜测几乎一致 Radeon HD
2900XT并没有能够表现出较低的温度和功耗 但
绝不像外界传闻的那么高 400W的电源已经能够
满足一套中高端平台和2900XT的需求。
Radeon HD 2900XT抗锯齿画面对比
在文章的前一个技术部分 我们已经谈到了
2900XT在抗锯齿方面的一些改变,枯燥的技术是
很难被人接受的,还是让我们了解下GeFO rce
8 800GTS、RadeOil HD 2900XT和Radeon
X1950XTX三款显卡的抗锯齿表现。测试版的驱动
可以令Radeon HD 2900XT工作在24x CFAA下
但我们使用的驱动程序却无法打开24x cFAA。
对比三张图片,除了1950XTX渲染后锯齿较
为明显外 2900XT和GeForce 8800GTS打抗锯齿
后 图片锯齿有了明显的改善,但是2900XT的柔
化度要更好一些。遗憾的是.大多数的用户目前还 无法打开24x CFAA
}‘R耐eonHD 2900XT温度、功耗测试(待机/满载)
。
}f 2900XT f 1950XI'X l 8800GTS f 8800GTX
I功耗
温度
l
}
224/340W
66/92。c
I
I
172t230W
53/72。c
I
J
195/270W
65/77。c
I
J
203/320W
74/85。C
维普资讯
W W /9 C a i y.e 0 m
让理性引导消费 让D I Y改变生活
Radeon HD 2900XT深度解析
c 、
ATI Mobility Radeon HD 2000系列产品规格表
MobiliyRadeotnHD MobiliyRatdeonHD MobiliyRatdeonHD
’
MobiifyRatdeonHD Mobiliyt Radeon HD
2300
产品定位
核心频率
显存频率
240。...
主流市场
350,-450MHz
4O0--500h
2400xT
主流市场
5OO-600 珏Iz
600--700 №
260o
.
性能甩户
400-500MI ̄
550H目0m
2600xT
.-游戏用户
6OO--700h珏Iz
700-750l吡
八门级
450-,48砸
400-550 ̄仆k
制造工艺
DirectX版本 。
9Ohm
9.0e
65nm
DX10
65nm
DX10
65rim
DX10
65//m
DX10
UVD
Powerplay
支持
6.0
支持
7.0
支持
7.0
支持
7.0
支持
7 0
显存位宽 64,12蹦t 64bit 64bit 64,128bit 641128bit
衍生一一移动平台同样出色
基于R600出色的统一Shader架构.ATI继
下,Shader的运算能力也不会低于G80。不过.我
们更加关心R600的纹理过滤部分。根据我们的测
试结果.2900XT在16x AF下的纹理过滤运算能力
要低于GeForce 8800GTS.未来ATI会拿出什么样
的改进方式,我们不得而知。
NVIDIA后,即将推出拥有统一Shader架构的
Mobility Radeon HD 2000系列图形显示芯片.这
就意味着在短时间内.移动平台也将会全面进入
DirectX 10时代。Mobility Radeon HD 2000系列
图形显示芯片目前共有5款产品.分别是Mobility
Radeon HD 2300、2400、2400XT
、
我们现在无法对R600和G80的优劣做出一个
评价一一用DirectX 10的显卡运行DirectX 9游戏
2600、2600XT。
根本无法展现其真实性能.而DirectX 10游戏目前
很难见到。多数游戏厂商尚未完成DirectX 10下游
戏的开发,或者在进行引擎的改进。另外.游戏引
擎和显卡的联系很大,采用不同引擎的游戏.在测
试中多少都具有一些倾向性。我们缺少一款能够作
Mobility Radeon HD 2300作为一款有差别的
HD 2000系列产品.产品定位入门级,无论是制造
工艺、PowerPlay节电技术还是DirectX版本.都
要落后其余的2000系列产品。我们从ATI了解到.
Mobility Radeon HD 2300将会是一款面向低端用
为基准的DirectX 10测试程序进行测试.从而得到
优劣的结论。
户的产品.价格相对比较低廉.因此规格上有所缩
减也是无可厚非的。
写在最后的话
我们花费了一段时间.对R600进行了比较详
细的测试。理论上来说.次高端的Radeon HD
2900XT的竞争对手应该是GeForce 8800GTS.但
从规格上看,2 900XT已经超过了G eFO rc e
8800GTX!但是在实际性能测试中.Radeon HD
2900XT战胜了GeForce 8800GTS.但和性能更强
的8 800GTX还有一段差距。至于高频版本的
GeForce 8800GTS 640MB
,
性能较公版高出很多.
399美元的Radeon HD 2900XT.效能较同类
别产品来说.相当的优秀。Radeon HD 2900xT虽
然功耗和温度都较高.但这并不足以埋没2900XT
的能力。我们同样期待ATI面向移动和桌面Radeon
但在大多数测试项目上.和2900XT相比依旧落败。
2900XT有一些我们认为很特殊、很优秀的特
性.例如Tessellation增益技术、320个Stream
Processor Units。遗憾的是.不完善的驱动无法完
全发挥这些优秀特性的性能。ATI对于超标量架构
的诠释.还需要继续加强;同时.VLIW指令的整
合也是需要解决的一个问题。相比于G80.R600核
心更加偏重于平行的大数量Shader运算.平行条件
HD 2600、2400系列产品的发布.毕竟这些产品才
是大多数消费者能够接受的。