2024年10月12日发(作者:潭一)
维普资讯
盲产品与测试 _堑虽盟里 pingce@gmail.conr
顶级显卡决死一战
g5 8 0、G 7 1对比坝4试 文/图 现代计算机评测室
2005年6月22日,nVIDIA发布了采用G7O显示核心的GeForce 78O0GTX,揭开项级显卡大战的序幕;2OO5年1 0
月5日,ATi发布全系列gadeon X1 000,gadeon×1 800XT的风头盖过G70;2005年1 1月14日,nVIDIA改进了GeForce 7800GTX
的PCB,推出了GeForce 78O0GTX 51 2MB,重夺显卡王者的宝座。至此,2OO5年显卡性能王座之争告一段落。
时间进入2OO6年,这次ATi率先发难,推出ga,deon X1 90O系列,而nVID1A也于近期正式接招,他们的还击武器
是——GeForce 7900GTX gadeon X1 900XTX和GeForce 7900GTX这两款目前最顶级的显卡相继走进本刊评测室,他们各
自有何看点?会碰撞出什幺样的火花?本文将揭晓答案。
48个像素渲染单元——Radeon X l 900XTX
,
Radeon X1900系列慨述
默认频率下的GeForce 78O0GTX仅能提供2 i i.2
Radeon Xi900系列的研发代号为R580,它采用
GFI OPS的FP32像素运算能力和47.2 GFLOPS的FP32
90nm工艺制程,其晶体
顶点运算能力。
管数量已经达到r非常
按照一般“常识”,多数玩家都会觉得R a d e o n
夸张的3.8亿,是ATi
X1900的3D性能应该远远强干GeForce 78OOGTX。实
前一代GPU一一R520
际情况究竟如何,我们会在后文中为大家分析。
的i.2倍,是nVIDIA 2.突出的高分辨率表现
G70的1.26倍。
目前 所有的R a d e o n系列显示核心都支持
Radeon Xi 900系列包括四个型号,分别为Radeon
Hierachicai Z特性,该技术主要是有针对性地去满足不
X19OO)£TX、Radeon X19OOXT Radeon X1900 CromFire
同分辨率的需求。不过,Hierachicai z技术要求在芯片
Edition以及Radeon X l 900 Aii In-Wonder。其中,
中提供高速的记忆功能以及有一定容量的记忆体容量。
Radeon Xi900XTX与Radeon Xi900XT之间只是频率
如果当前描绘的分辨率要求记忆体容量高于芯片集成
的差异,而另两个产品则是可实现不同功能。
的i 已体容量时,Hierachicai Z功能将会自动减低画面
由于是在R520核心的基础上发展而来,R580核心
的渲染品质。
保留了R 5 2 0核心的全部功能,其中包括对U lt r a
Radeon Xi900集成了比Radeon X1800多出50%的
Threading、Shader Model 3.0、AA的高动态范围渲 Hierachicai Z记忆体,以确保Xi900的性能不会在很高
染、AVIVO等技术的支持。 的分辨率下急剧下降。支持系统运行在l 920×1 200
__:、Radoen XI900的两个看点
(WUXGA)、2048×i536(OXGA)甚至2560×1600
1.具备4 8个像素渲染单元
(WQXGA)等分辨率下。
在顶点着色单元方面,R580和Radeon X1 800XT一
样,拥有8个。不过,R 5 80显示核心的像素渲染单元
的数量提升到了48个,是R520核心的3倍之多,也远
远多干GeForce 7800GTX、GeForce 7900GTX的24个。
这让Radeon XI900XTX的FP32精度像素运算能力达到
374.4GFLOPS,如果再加上顶点着色单元的话,Radeon
X1900XTX的FP32汁算能力达到_『426.4 GFI OPS,而
~~—
盟 一
维普资讯
pingce@gmail.corn
丛生里] 产品与测试
晶体管数量大幅降低——GeForce 7900GTX
GeForce 7900系列的研发代号
目前ATi,nVIDlA顶级显规格对比
为G71,它与Radeon X19oo系列一
样,采用90nm工艺制程,仅为190
研发代号
制造工艺
R580XTX R580XT G71 G70
平方毫米的核心尺寸,它的晶体管
数量甚至比上一代的7800GTX还要
少2400万。此外,G7l在频率方面
有所提升,GeForce 7900GTX的默
TSMC 90nm Low—K TSMC 90nm Low—K TSMC 9Onm Low—K TSMC 11Onm
晶体管数量
顶点着色器
380百万
8
380百万
8
278首万
8
304百万
8
像素着色单元 48
纹理寻址单元 16
纹理拾取单元 16
48
16
16
24
24
24
24
24
24
认核心频率达到了650MHz。
GeForce 7900系列目前发布了
GeForce 7900GTX和GeFOroe
色彩操作单元 16
256bit/8channel
16
256bit/8channel
16
256bit/4charlne1
1.6Gltz GI)1)R3
16
256bit/4channel
1.2GHz GDI)R3
内存带宽 1.55Gllz GDDR3
49.6GB/s
1
45Gllz GI)DR3
.
7900GT两个型号,他们之问的差异
46,4GB/s 51.2GB/s 38.4GIj/s
主要体现在频率上。由于其基于
G70设计,所以G71具备G70的所
有特效,如DirectX 9.0c,HDR、
CineFX 4.0、IntelliSample 4.0及
3D内核频率 650M
V5 《 3 2 52J GFLOPS
625iVHz
50 GFLOPS
10 GPixel ̄/;s
10 GTexeis/s
65OM
5O GFL。PS
10 4 GPixels/s
10 32 GTe ̄els/s
430MHz
37 6 GFLOeS
6 88 GPixels/s
10 32 GTexels/s
顶点转换能力 1 300百万顶点/秒 1 248百万顶点/秒
像素输出箭力 10 4 GPixels/s
纹理元素处理能力 10 4 GTexels/s
1 400百万顶点/秒 940百万顶点/秒
PureVideon等技术。
浮点唧抗锯齿
DVI接口
支持
2 I)ual 1 ink
支持
2 1)ua1 I ink
不支持
2 DuaI-Li
不支持
2 Dual—L 10bit angel link
l6bit dual link
IObit singcl link
16bit dual—link
视频技术
AvlVO{5li颧 『譬
WMV HD硬件加速
Mf]EG2 Hn硬件加速
H.264硬件加速
AvlVO视频9『擎
WMV—HD硬件加速
MPffG2 HI)硬件加速
I1.264硬件加速
l urevldeu}见颧 『擘
WMV l{D硬H珈速
Mf]EG2 f{f)硬件mI速
It.264硬件加速
Purcvjde0视频 l警
WMV-HD硬“:加速
MPEG2『II)硬件m}速
}】.264睫件加速
有关顶级显卡的三个疑问
1.G71比G70晶体管数量还少?
如前文所述,G7 l的晶体管数量比GeForce
2.Radeon XI900的48个像素渲染单元是怎么回事
从游戏引擎的发展来看,其对像素渲染的要求越来越多。
7800GTX少了2400万。这是因为过渡到90nm制
程后,原来G70核心里用作优化核心性能的晶
体管在G71里已
经不需要,这部
基于此,ATi多次表示,和纹理贴图相比,用户更需要像素操
作。
从Radeon X1900核
心逻辑架构图中,我们
知道顶点数据(Vertex
分晶体管就被删
去了。
Date)会最先流经8个顶
点着色单元(V e rt ex
Shaders),这些顶点着色
90nm制程的引入,让G71可以工作在更高
的频率,而且减少了核心面积,在同一块晶圆
上能切割出更多G7 l晶片,可以减少芯片制造
成本,功耗也可以得到降低 在这一点上,ATi
和nVIDIA的设计思路有所不同,ATi不惜成本
增加晶体管的数目,这样虽然能够提升核心性
能,但随着晶体管的增多,核心就越复杂,不
但让生产难度加大,而且功耗和发热量剧增,
也不利于显卡核心频率的提升
单元可以每频率处理两
个顶点指令,相当于每
秒可以执行l 0 0亿个指 gadeon×1 900系列核心逻辑架构图
令,因为每一个顶点着色单元有两个ALU单元,一个是1 28位
的向量逻辑运算单元(vector ALU),另一个是32位纯量逻辑
运算单元(scalar ALU),这可以做到全时32位浮点运算的精
密度。
一
难 一
维普资讯
昌昌产品与 试一厂
随后,像素数据经过・系列处理后会进到一个全新的分配处理
pingce@gmail.com
但运算能力和伍载量是不同的。
而R580的48个像素单元则是独立的,
但是这些像素单元并没有直接关联相应的
纹理单元,而是通过Ultra Threaded Dis—
Datch Processor统一调度。实际上R580总
器,将数据发送刮像素渲染单元(Pixel Shader)中。像素渲染单
庀每四个分一组,ATi将这4个像素渲染单元集中放入一个组别,称 _l
其为4倍像素着色核心
(Quad Pixel Shader
Cores)。在这里找们就能
共拥有与R 520相同的16个纹理单元。由
看出R580和R520之 的
最人区别,R520只集成r
4个这样的组圳,冈比像
于ATi认为像素的作用要大干纹理,未来
游戏的发展趋势就是需要更多的像素处理
而非纹理,因此像素与纹理的比例达到了
3:1。
素渲染单 的数量 l有4
×4共l6个,而从图巾我们可以看出,R580的组圳达到了l2个,因
此集成的像素渲染单元达到厂4×1 2共48个1
而nVIDIA则认为纹理单元的作用依
然非常重要,不同的游戏所需的像素处理
3.48个像素渲染 元和24条像素渲染线,准更强
存G70/G71的像素渲染架构中,每条流水线包含两个完全相同
的32位浮点像素渲染单元(Shader Unit),不过只有Shader Unit
难以统计,并且这一比例并非固定的,随
着场景设计的差异动态变化。因此,
nVIDIA将像素和纹理的比例设定为1:1。
1共享TMU处理纹理指令,而Shader Unit 2只处理算术指令进行
像素着色运算。冈此G70/G71虽然拥有24×2=48个Shader Unit,
但nVIDIA依然称之为24管线,也没有特别强调48个像素渲染单元,
这主要是凼为Shader Unit 1和Shader Unit 2虽然结构完全相同,
从这里我们可以看出,两家公司对游
戏发展趋势的不同理解造成了设计上的差
异,至于谁更把握得准确些,还得靠实际
游戏来检验。
顶级显卡长啥样——R580、G71实物赏析
我们拿到的测试样卡分别是XFX讯景生产的鳊号为“PV T71F--YDE9”的GeForce 7900GTX、蓝宝生产的X1 900XTX
51 2M PCI~E D-D/VIVO 这两家厂商都在显示核心发布后的第一时问推出了相关产品。
讯景PV-T71 F-YDE9
讯景PV-T71F YDE9的PCB板和GeForce 7800GTX 5l2MB一
样,采用的是P348公版设计,散热器方面同样采用Daul Slot双槽散
热设计,四条热管延伸到散热器两边密集的鳍片上面,散热效果相
当不错。这款显卡的默认核心工作频率为67 5MH Z。
显存方面,这款显卡采用的是三星生产的编号为“K4 J 5 324QC
BJ1 1”的1.1ns GDDR3,8颗组成了256bit/512MB的显存规格,显
默认工作频率为1700MHz。
由于G7 1核心的功耗并不大,所以整个PCB的设计比较简洁,做工精细,用料方面保持了XFX讯景一贯的
奢侈风格。这款显卡提供了DVI、S-Video输出接口。
~
j 一
维普资讯
pingce@gmail corn—————.
新品特写 堕 铝
谁才是真正的老大——R580、G71性能实测
硬件测试平台
CPU I ntium 4 EE 3.73Gflz AthjOrl 64 3000f
3Dmark05是FutureMark出品的专业3D测试软件
目前该版本是使
用最广泛的3D性
内存 威刚1]DRⅡ800 512MB×2
艘盛 fI 7K250 250GB(PATA,8MI{缓存)
仁板 Foxconn i955x tt; ̄GA 8N—SI I Pro IOCI(nForce 4 SI l Intel
Edition),华硕ASR32 MVP DELUXE(RD580}UI i1 575)
能理论测试软件。
通过测试结果我
们可以看到,
GeForce 7900GTX
IU源 航嘉冷I5l_l{ 悖版
系统 Windows XP SP2(英文版)、1)irectX 9.Oc
曲 I,'orcoWavc 84.17、ATj催化剂6.3
1.基准性能测试
作为ATi和nVIDIA两方面最高性能的显卡型号,R,adeon
的得分超过了
R a d e o n
X f 900XTX和GeForce 7900GTX在规格上各有千秋:Eadeon
X1 900XTX在架构上有一定优势,GeForce 7900GTX在频率
Xl90OXTX,不过
领先幅度并不大。
这两款显卡的表现都比较稳定,测试成绩大概领先
Radeon X1800XT约10%,与GeForce 7800GTX 256MB
上高于对手。那幺,究竟谁能夺得新的性能王座呢?
- . 墒 h
相比,5 l 2MB的显存容量优势明显,尤其是在高分辨
率井打开特效时。
在3DMark06
▲.
i 霉1
Il
1
中,由于nVIDIA
全系列显卡都不
支持HDR+AA,
所以我们只进行
了l024×768和
.
1600×l200两个
分辨率下的测试。
从测试成绩看,
_0 2 —一
维普资讯
口 一 新品特写
pingce@gmail.com
GeForce 7900GTX依然能够傲视群雄,不过其HDR测
试方面的运算能力不尽人意。
((Half-Life2))是ATi显卡的传统优势项M,Radeon
X1900XTX的表现的确再次验证了这一点。此外,我们
! r
还发现,在低分辨
率下,CPU已经成
为系统的瓶颈,几
款参与对比测试
的显卡性能的差
异几平没有表现
出来}在高分辨率时(1600×1200),Radeon X1900XTX
的优势还是比较大的。
基于OpenGL开发的((DOOM3))历来是nVID1A的
传统强项,测试结果的确如此。不过让我们感到惊喜的
是,Radeon X 1 900XTX与GeForce 7900GTX的性能差
异并不大。不知道
这是否与其4 8个
像素渲染单元的
性能强劲有关。
在其他游戏
的测试中,Radeon X1900XTX和GeForce 7900Gq’X互
有胜负,不过总体来说两者性能差别并不大。从测试结
果来看,Radeon X l 9o0XTX和GeForce 79o0GTX双方
实力比较接近,Radeon X l 900XTX在频率方面略输
GeForce 7900GTX一筹,这应该是GeForce 7900GTX
稍占上风的主要原因。
2.SI I VS CrossFire性能对比测试
在测试双卡互联性能的时候,我们采用了两块
GeFome 7900GTX组成SLI,一块g ̄deon x 1 900XTX显卡和一
块ga,deon x 1 900 CrossFire Edition显卡组成CrossF Jre;在平台
选择方面,SLI系统使用的是Pentium 4 550、技嘉GA 8N—
SLI Pro 1 0C1(采用nFopce 4 SL1 Intel Edition芯片组),CrossFire
系统使用的是Al1 ̄hlon 64 5000+、华硕ABg ̄2-MVP DELUXE
(ED580+ULi1 575)。
在3DMark05基准性能测试中,GeForce 7900GTX
总结:5eForce 7900GTX的性能表现基本上压住ATi
xI 9 00XTx,但尚不能与后者拉开档次性的距离,这种微
弱的优势是OeForce 7900GTX更高一筹的频率带来的。而
之所以GeForce 7900GTX能够轻松将频率提升起来,还是
基于它的9 0 nm新制程及更小的功耗带来的。
GeForce 7900GTX最大的改变英过于它的芯片设计了,
毕竟显示核心的尺寸越来越大,这对于消费者和厂商都
不是好事——低良品率,高昂的价格,以及可怕的功耗
一—— 一
_ , r
S L I和R a d e o i"1
X l 9 0 0 X T X
C rossFire都表现
出色,G eF O r c e
7900GTX的性能
更强。两者在跟其
单卡测试成绩对比, 性能有明显的提升。
3DMark06的测试结果显示,在低分辨率下,实际
上单卡和双卡互联
的成绩差不多,SLI
和CrossFire系统在
这里有些使不上
劲。在高分辨率打
开特效的时候,情况有所好转。
在游戏测试中,{{Half Life 2》的测试结果终于让
Radeon X l 900XTX占了些便宜 看来,单卡的性能对
双卡瓦联的性能起
着很大的作用。
在其他游戏测
试中,双方互有胜
负。G e F O r c e
9700GTX SLI的在《极品飞车》中居然出现了不如单卡
成绩的情况,而Radeon X1900XTX CrossFire则在 帝
国时代3 中表现较差。从这一结果我们可以看出,SLI
和C rossFire都还需要针对游戏做一些优化和改进。
都会阻止高性能显卡的普及。此次nVIDIA将G 71的尺寸
降下来,进而大幅提升频率,790 0GTX的最大功耗控制
在1 2 0W。在功耗和性能方面找平衡点,这才是理性的
芯片设计思路。
而对于ga,deon X1 900XTX来说。其48条像素渲染单元
基本上弥补了频率上的不足。该显示核心在架构上的优
势,以及对R5 2 0相关技术的继承 随着游戏对算术指
令利用的增加,这种优势会显现出来。
2024年10月12日发(作者:潭一)
维普资讯
盲产品与测试 _堑虽盟里 pingce@gmail.conr
顶级显卡决死一战
g5 8 0、G 7 1对比坝4试 文/图 现代计算机评测室
2005年6月22日,nVIDIA发布了采用G7O显示核心的GeForce 78O0GTX,揭开项级显卡大战的序幕;2OO5年1 0
月5日,ATi发布全系列gadeon X1 000,gadeon×1 800XT的风头盖过G70;2005年1 1月14日,nVIDIA改进了GeForce 7800GTX
的PCB,推出了GeForce 78O0GTX 51 2MB,重夺显卡王者的宝座。至此,2OO5年显卡性能王座之争告一段落。
时间进入2OO6年,这次ATi率先发难,推出ga,deon X1 90O系列,而nVID1A也于近期正式接招,他们的还击武器
是——GeForce 7900GTX gadeon X1 900XTX和GeForce 7900GTX这两款目前最顶级的显卡相继走进本刊评测室,他们各
自有何看点?会碰撞出什幺样的火花?本文将揭晓答案。
48个像素渲染单元——Radeon X l 900XTX
,
Radeon X1900系列慨述
默认频率下的GeForce 78O0GTX仅能提供2 i i.2
Radeon Xi900系列的研发代号为R580,它采用
GFI OPS的FP32像素运算能力和47.2 GFLOPS的FP32
90nm工艺制程,其晶体
顶点运算能力。
管数量已经达到r非常
按照一般“常识”,多数玩家都会觉得R a d e o n
夸张的3.8亿,是ATi
X1900的3D性能应该远远强干GeForce 78OOGTX。实
前一代GPU一一R520
际情况究竟如何,我们会在后文中为大家分析。
的i.2倍,是nVIDIA 2.突出的高分辨率表现
G70的1.26倍。
目前 所有的R a d e o n系列显示核心都支持
Radeon Xi 900系列包括四个型号,分别为Radeon
Hierachicai Z特性,该技术主要是有针对性地去满足不
X19OO)£TX、Radeon X19OOXT Radeon X1900 CromFire
同分辨率的需求。不过,Hierachicai z技术要求在芯片
Edition以及Radeon X l 900 Aii In-Wonder。其中,
中提供高速的记忆功能以及有一定容量的记忆体容量。
Radeon Xi900XTX与Radeon Xi900XT之间只是频率
如果当前描绘的分辨率要求记忆体容量高于芯片集成
的差异,而另两个产品则是可实现不同功能。
的i 已体容量时,Hierachicai Z功能将会自动减低画面
由于是在R520核心的基础上发展而来,R580核心
的渲染品质。
保留了R 5 2 0核心的全部功能,其中包括对U lt r a
Radeon Xi900集成了比Radeon X1800多出50%的
Threading、Shader Model 3.0、AA的高动态范围渲 Hierachicai Z记忆体,以确保Xi900的性能不会在很高
染、AVIVO等技术的支持。 的分辨率下急剧下降。支持系统运行在l 920×1 200
__:、Radoen XI900的两个看点
(WUXGA)、2048×i536(OXGA)甚至2560×1600
1.具备4 8个像素渲染单元
(WQXGA)等分辨率下。
在顶点着色单元方面,R580和Radeon X1 800XT一
样,拥有8个。不过,R 5 80显示核心的像素渲染单元
的数量提升到了48个,是R520核心的3倍之多,也远
远多干GeForce 7800GTX、GeForce 7900GTX的24个。
这让Radeon XI900XTX的FP32精度像素运算能力达到
374.4GFLOPS,如果再加上顶点着色单元的话,Radeon
X1900XTX的FP32汁算能力达到_『426.4 GFI OPS,而
~~—
盟 一
维普资讯
pingce@gmail.corn
丛生里] 产品与测试
晶体管数量大幅降低——GeForce 7900GTX
GeForce 7900系列的研发代号
目前ATi,nVIDlA顶级显规格对比
为G71,它与Radeon X19oo系列一
样,采用90nm工艺制程,仅为190
研发代号
制造工艺
R580XTX R580XT G71 G70
平方毫米的核心尺寸,它的晶体管
数量甚至比上一代的7800GTX还要
少2400万。此外,G7l在频率方面
有所提升,GeForce 7900GTX的默
TSMC 90nm Low—K TSMC 90nm Low—K TSMC 9Onm Low—K TSMC 11Onm
晶体管数量
顶点着色器
380百万
8
380百万
8
278首万
8
304百万
8
像素着色单元 48
纹理寻址单元 16
纹理拾取单元 16
48
16
16
24
24
24
24
24
24
认核心频率达到了650MHz。
GeForce 7900系列目前发布了
GeForce 7900GTX和GeFOroe
色彩操作单元 16
256bit/8channel
16
256bit/8channel
16
256bit/4charlne1
1.6Gltz GI)1)R3
16
256bit/4channel
1.2GHz GDI)R3
内存带宽 1.55Gllz GDDR3
49.6GB/s
1
45Gllz GI)DR3
.
7900GT两个型号,他们之问的差异
46,4GB/s 51.2GB/s 38.4GIj/s
主要体现在频率上。由于其基于
G70设计,所以G71具备G70的所
有特效,如DirectX 9.0c,HDR、
CineFX 4.0、IntelliSample 4.0及
3D内核频率 650M
V5 《 3 2 52J GFLOPS
625iVHz
50 GFLOPS
10 GPixel ̄/;s
10 GTexeis/s
65OM
5O GFL。PS
10 4 GPixels/s
10 32 GTe ̄els/s
430MHz
37 6 GFLOeS
6 88 GPixels/s
10 32 GTexels/s
顶点转换能力 1 300百万顶点/秒 1 248百万顶点/秒
像素输出箭力 10 4 GPixels/s
纹理元素处理能力 10 4 GTexels/s
1 400百万顶点/秒 940百万顶点/秒
PureVideon等技术。
浮点唧抗锯齿
DVI接口
支持
2 I)ual 1 ink
支持
2 1)ua1 I ink
不支持
2 DuaI-Li
不支持
2 Dual—L 10bit angel link
l6bit dual link
IObit singcl link
16bit dual—link
视频技术
AvlVO{5li颧 『譬
WMV HD硬件加速
Mf]EG2 Hn硬件加速
H.264硬件加速
AvlVO视频9『擎
WMV—HD硬件加速
MPffG2 HI)硬件加速
I1.264硬件加速
l urevldeu}见颧 『擘
WMV l{D硬H珈速
Mf]EG2 f{f)硬件mI速
It.264硬件加速
Purcvjde0视频 l警
WMV-HD硬“:加速
MPEG2『II)硬件m}速
}】.264睫件加速
有关顶级显卡的三个疑问
1.G71比G70晶体管数量还少?
如前文所述,G7 l的晶体管数量比GeForce
2.Radeon XI900的48个像素渲染单元是怎么回事
从游戏引擎的发展来看,其对像素渲染的要求越来越多。
7800GTX少了2400万。这是因为过渡到90nm制
程后,原来G70核心里用作优化核心性能的晶
体管在G71里已
经不需要,这部
基于此,ATi多次表示,和纹理贴图相比,用户更需要像素操
作。
从Radeon X1900核
心逻辑架构图中,我们
知道顶点数据(Vertex
分晶体管就被删
去了。
Date)会最先流经8个顶
点着色单元(V e rt ex
Shaders),这些顶点着色
90nm制程的引入,让G71可以工作在更高
的频率,而且减少了核心面积,在同一块晶圆
上能切割出更多G7 l晶片,可以减少芯片制造
成本,功耗也可以得到降低 在这一点上,ATi
和nVIDIA的设计思路有所不同,ATi不惜成本
增加晶体管的数目,这样虽然能够提升核心性
能,但随着晶体管的增多,核心就越复杂,不
但让生产难度加大,而且功耗和发热量剧增,
也不利于显卡核心频率的提升
单元可以每频率处理两
个顶点指令,相当于每
秒可以执行l 0 0亿个指 gadeon×1 900系列核心逻辑架构图
令,因为每一个顶点着色单元有两个ALU单元,一个是1 28位
的向量逻辑运算单元(vector ALU),另一个是32位纯量逻辑
运算单元(scalar ALU),这可以做到全时32位浮点运算的精
密度。
一
难 一
维普资讯
昌昌产品与 试一厂
随后,像素数据经过・系列处理后会进到一个全新的分配处理
pingce@gmail.com
但运算能力和伍载量是不同的。
而R580的48个像素单元则是独立的,
但是这些像素单元并没有直接关联相应的
纹理单元,而是通过Ultra Threaded Dis—
Datch Processor统一调度。实际上R580总
器,将数据发送刮像素渲染单元(Pixel Shader)中。像素渲染单
庀每四个分一组,ATi将这4个像素渲染单元集中放入一个组别,称 _l
其为4倍像素着色核心
(Quad Pixel Shader
Cores)。在这里找们就能
共拥有与R 520相同的16个纹理单元。由
看出R580和R520之 的
最人区别,R520只集成r
4个这样的组圳,冈比像
于ATi认为像素的作用要大干纹理,未来
游戏的发展趋势就是需要更多的像素处理
而非纹理,因此像素与纹理的比例达到了
3:1。
素渲染单 的数量 l有4
×4共l6个,而从图巾我们可以看出,R580的组圳达到了l2个,因
此集成的像素渲染单元达到厂4×1 2共48个1
而nVIDIA则认为纹理单元的作用依
然非常重要,不同的游戏所需的像素处理
3.48个像素渲染 元和24条像素渲染线,准更强
存G70/G71的像素渲染架构中,每条流水线包含两个完全相同
的32位浮点像素渲染单元(Shader Unit),不过只有Shader Unit
难以统计,并且这一比例并非固定的,随
着场景设计的差异动态变化。因此,
nVIDIA将像素和纹理的比例设定为1:1。
1共享TMU处理纹理指令,而Shader Unit 2只处理算术指令进行
像素着色运算。冈此G70/G71虽然拥有24×2=48个Shader Unit,
但nVIDIA依然称之为24管线,也没有特别强调48个像素渲染单元,
这主要是凼为Shader Unit 1和Shader Unit 2虽然结构完全相同,
从这里我们可以看出,两家公司对游
戏发展趋势的不同理解造成了设计上的差
异,至于谁更把握得准确些,还得靠实际
游戏来检验。
顶级显卡长啥样——R580、G71实物赏析
我们拿到的测试样卡分别是XFX讯景生产的鳊号为“PV T71F--YDE9”的GeForce 7900GTX、蓝宝生产的X1 900XTX
51 2M PCI~E D-D/VIVO 这两家厂商都在显示核心发布后的第一时问推出了相关产品。
讯景PV-T71 F-YDE9
讯景PV-T71F YDE9的PCB板和GeForce 7800GTX 5l2MB一
样,采用的是P348公版设计,散热器方面同样采用Daul Slot双槽散
热设计,四条热管延伸到散热器两边密集的鳍片上面,散热效果相
当不错。这款显卡的默认核心工作频率为67 5MH Z。
显存方面,这款显卡采用的是三星生产的编号为“K4 J 5 324QC
BJ1 1”的1.1ns GDDR3,8颗组成了256bit/512MB的显存规格,显
默认工作频率为1700MHz。
由于G7 1核心的功耗并不大,所以整个PCB的设计比较简洁,做工精细,用料方面保持了XFX讯景一贯的
奢侈风格。这款显卡提供了DVI、S-Video输出接口。
~
j 一
维普资讯
pingce@gmail corn—————.
新品特写 堕 铝
谁才是真正的老大——R580、G71性能实测
硬件测试平台
CPU I ntium 4 EE 3.73Gflz AthjOrl 64 3000f
3Dmark05是FutureMark出品的专业3D测试软件
目前该版本是使
用最广泛的3D性
内存 威刚1]DRⅡ800 512MB×2
艘盛 fI 7K250 250GB(PATA,8MI{缓存)
仁板 Foxconn i955x tt; ̄GA 8N—SI I Pro IOCI(nForce 4 SI l Intel
Edition),华硕ASR32 MVP DELUXE(RD580}UI i1 575)
能理论测试软件。
通过测试结果我
们可以看到,
GeForce 7900GTX
IU源 航嘉冷I5l_l{ 悖版
系统 Windows XP SP2(英文版)、1)irectX 9.Oc
曲 I,'orcoWavc 84.17、ATj催化剂6.3
1.基准性能测试
作为ATi和nVIDIA两方面最高性能的显卡型号,R,adeon
的得分超过了
R a d e o n
X f 900XTX和GeForce 7900GTX在规格上各有千秋:Eadeon
X1 900XTX在架构上有一定优势,GeForce 7900GTX在频率
Xl90OXTX,不过
领先幅度并不大。
这两款显卡的表现都比较稳定,测试成绩大概领先
Radeon X1800XT约10%,与GeForce 7800GTX 256MB
上高于对手。那幺,究竟谁能夺得新的性能王座呢?
- . 墒 h
相比,5 l 2MB的显存容量优势明显,尤其是在高分辨
率井打开特效时。
在3DMark06
▲.
i 霉1
Il
1
中,由于nVIDIA
全系列显卡都不
支持HDR+AA,
所以我们只进行
了l024×768和
.
1600×l200两个
分辨率下的测试。
从测试成绩看,
_0 2 —一
维普资讯
口 一 新品特写
pingce@gmail.com
GeForce 7900GTX依然能够傲视群雄,不过其HDR测
试方面的运算能力不尽人意。
((Half-Life2))是ATi显卡的传统优势项M,Radeon
X1900XTX的表现的确再次验证了这一点。此外,我们
! r
还发现,在低分辨
率下,CPU已经成
为系统的瓶颈,几
款参与对比测试
的显卡性能的差
异几平没有表现
出来}在高分辨率时(1600×1200),Radeon X1900XTX
的优势还是比较大的。
基于OpenGL开发的((DOOM3))历来是nVID1A的
传统强项,测试结果的确如此。不过让我们感到惊喜的
是,Radeon X 1 900XTX与GeForce 7900GTX的性能差
异并不大。不知道
这是否与其4 8个
像素渲染单元的
性能强劲有关。
在其他游戏
的测试中,Radeon X1900XTX和GeForce 7900Gq’X互
有胜负,不过总体来说两者性能差别并不大。从测试结
果来看,Radeon X l 9o0XTX和GeForce 79o0GTX双方
实力比较接近,Radeon X l 900XTX在频率方面略输
GeForce 7900GTX一筹,这应该是GeForce 7900GTX
稍占上风的主要原因。
2.SI I VS CrossFire性能对比测试
在测试双卡互联性能的时候,我们采用了两块
GeFome 7900GTX组成SLI,一块g ̄deon x 1 900XTX显卡和一
块ga,deon x 1 900 CrossFire Edition显卡组成CrossF Jre;在平台
选择方面,SLI系统使用的是Pentium 4 550、技嘉GA 8N—
SLI Pro 1 0C1(采用nFopce 4 SL1 Intel Edition芯片组),CrossFire
系统使用的是Al1 ̄hlon 64 5000+、华硕ABg ̄2-MVP DELUXE
(ED580+ULi1 575)。
在3DMark05基准性能测试中,GeForce 7900GTX
总结:5eForce 7900GTX的性能表现基本上压住ATi
xI 9 00XTx,但尚不能与后者拉开档次性的距离,这种微
弱的优势是OeForce 7900GTX更高一筹的频率带来的。而
之所以GeForce 7900GTX能够轻松将频率提升起来,还是
基于它的9 0 nm新制程及更小的功耗带来的。
GeForce 7900GTX最大的改变英过于它的芯片设计了,
毕竟显示核心的尺寸越来越大,这对于消费者和厂商都
不是好事——低良品率,高昂的价格,以及可怕的功耗
一—— 一
_ , r
S L I和R a d e o i"1
X l 9 0 0 X T X
C rossFire都表现
出色,G eF O r c e
7900GTX的性能
更强。两者在跟其
单卡测试成绩对比, 性能有明显的提升。
3DMark06的测试结果显示,在低分辨率下,实际
上单卡和双卡互联
的成绩差不多,SLI
和CrossFire系统在
这里有些使不上
劲。在高分辨率打
开特效的时候,情况有所好转。
在游戏测试中,{{Half Life 2》的测试结果终于让
Radeon X l 900XTX占了些便宜 看来,单卡的性能对
双卡瓦联的性能起
着很大的作用。
在其他游戏测
试中,双方互有胜
负。G e F O r c e
9700GTX SLI的在《极品飞车》中居然出现了不如单卡
成绩的情况,而Radeon X1900XTX CrossFire则在 帝
国时代3 中表现较差。从这一结果我们可以看出,SLI
和C rossFire都还需要针对游戏做一些优化和改进。
都会阻止高性能显卡的普及。此次nVIDIA将G 71的尺寸
降下来,进而大幅提升频率,790 0GTX的最大功耗控制
在1 2 0W。在功耗和性能方面找平衡点,这才是理性的
芯片设计思路。
而对于ga,deon X1 900XTX来说。其48条像素渲染单元
基本上弥补了频率上的不足。该显示核心在架构上的优
势,以及对R5 2 0相关技术的继承 随着游戏对算术指
令利用的增加,这种优势会显现出来。