最新消息: USBMI致力于为网友们分享Windows、安卓、IOS等主流手机系统相关的资讯以及评测、同时提供相关教程、应用、软件下载等服务。

王者Fermi,新君驾临 NVIDIA GeForce GTX 580 显卡评测

IT圈 admin 29浏览 0评论

2024年10月12日发(作者:税怡乐)

GeForce GTX 580:弥 ̄I'TGTX 480 

『勺缺失,打造完美Fermi 

GeForce GTX 580和GeForce GTX 480是一脉相承 

前最强的Tessellation曲面细分性能。它改进了ROP单 

的效率,提升了抗锯齿的性能。它大幅度提升了双精度一 

算性能,其双精度计算性能甚至达到了单精度计算性能l 

1/2。此外,它还集成了一级高速缓存和二级缓存,大幅J 

9,要了解GeForce GTX 580。我们先对GeForce GTX 

80进行一次回顾。 

2010上半年,NVIDIA在众人翘首以盼的目光下终 

提升了CUDA应用程序的性能,甚至还可以运行为其编: 

的C++程序。 

=推出了基于DirectX I1的GeForce GTX 480,这款称 

上划时代的显卡。NVIDIA这一代DirectX l1显卡的 

℃号为我们熟知的Fermi,而GeForce GTX 480的核心 

GeForce GTX 480的综合性能在单核心显卡中是] 

强的,设计也是最超前的,受到了业界的赞许。但它并不: 

美,首先是因为良率和功耗的问题,它并没有开启全部5】 

个流处理器(GFIO0核心的完整规格),而是仅仅打开 

480个流处理器,屏蔽了-一组即32个流处理器。此外,由= 

它的图形设计非常复杂,晶体管数量达到了30亿个,再) 

上其存在核心漏电的问题,因此其功耗和发热量很高。 

E号则为GFIO0。就这款产品的架构设计而言,GeForce 

}TX 480堪称有史以来图形架构设计最复杂、改进最多 

EIDirectX l1性能最强的显卡。 

GeForce GTX 480拥有多达l5个多形体引擎,具备目 

Mc评测室]IMC评测室 _鼍 -ibst 

・ 

在运行特别是满载状态时,噪音很大。这些都是GeForce 

GTX 480显卡的不足之处,也是NVIDIA在后续产品中着 

力改善的地方。 

此外,GeForce GTX 580还优化了晶圆的使用率和 

PCB走线等,带来的直接好处就是提升了它的使用效率。 

根据NVIDIA给出的数据,在相同频率、相同规格(SP、 

纹理等数量保持一致)的情况下,GeForce GTX 580的性 

GeForce GTX 580:我不是“马甲” 

现在,你大致能推测出GeForce GTX 580的一些特 

点了吧。是的,它弥补了GeForce GTX 480显卡的最大 

遗憾一具备了完整的512个流处理器。可能有一些用户 

能要超出GeForce GTX 480 10%左右。 

下面,我们一起来看看GeForce GTX 580的主要 

规格。它的核心代号为GFll0,每秒能处理204L个三角 

形,具备30亿个晶体管、4个GPC、512个流处理器、64 

会觉得GeForce GTX 580就是512SP版本的GeForce 

GTX 480显卡,不能说不正确,但至少不完全正确,因为 

NVIDIA在GeForce GTX 580上做了一系列的改进。一则 

个纹理单元和48个光栅单元,最大浮点计算能力为2.37 

TFLOPs。其核心频率、显存频率和流处理器频率分别 

为772MHz、4008MHz和l544MHz。它的显存规格为 

1.5GB/GDDR5/384.bit。根据NVIDIA给出的数据, 

是针对功耗和发热量的改进,之前 

G e F O r c e 

GeForce GTX 580显卡的最大功耗为244W,甚至比 

GTX 480存在核 

心漏电的问题,导 

致GeForce GTX 

GeForce GTX 480还低。 

GF1 1 0图形架构一览 

GFl l 011 00图形架构关键词 

1.四个GPC图形处理器集群 

4 80的个体功耗 

差・异较大,即一 

些GeForce GTX 

480功耗较高,而 

2.16组SM阵列、512个流处理器INVIDIA称其为512个CUDA核心) 

3.16个PolyMorph Engine(多形体引擎).四个Raster Engine(光栅 

化引擎) 

4 64个纹理单元 48个光栅单元 

5.384-bit(6×64.bit)/GDDR5的显存控制器 

些产品却较低。 

:在GeForce GTX 

580上,NVIDIA 

改善了核心漏电 

的问题。NVIDIA 

(D GeForce GTX 580的GPU-z信息 

从图形架构层面来看,GeForce GTX 580和GeForce 

GTX 480最大的不同是流处理器数量、纹理单元数量等规 

格差异,但两者所采用的图形架构是一致的。下面,我们将 

在GeForce GTX 

580的PCB上设计了专门的电源监控模块,限制了该显卡 

的最大功耗(后文会详细进行说明)。针对GeForce GTX 

480温度较高和散热器噪音较大的问题,GeForce GTX 

580在散热器上做了较大的改进,使用了均腔热板技术 

(后文会详细进行说明)。 

以GF100的图形架构为例,来进一步认识GF110图形架构。 

从GFll0的图形架构可以看出,它主要包含了一个主接 

口(Host Interface)、一个GigaThread ̄I擎、四个GPC、 

六个显存控制器、六个RoP分区和一个大小为768KB的L2 

高速缓存。其中,ROP分区紧邻L2高速缓存。当GPU通过 

表1:GeForce GTX 580.GeForce GTX 400系列和Radeon HD 5800/6800系列的规格一览 

核心代号 

匍程工艺 

晶体管数量 

流处理器单元(流 

处理算术逻辑单 

纹理单元 

光瞄单元 

显存类型 

物蝴率 

等效显存频率 

流处理器频率 

浮点预算 

显存带宽 

最大功耗 

GF110 

40nm 

GF100 

40nm 

GF100 

40nm 

Cypress 

40nm 

Barts 

40nm 

304Z 

512个 

64个 

30亿 

480个 

3O亿 

448I" 

56个 

21.5亿 

288X5个 

1 7{乙 

192×5个 

48个 

 ,

1536M13/384 

_b诖/GDDR5 

772MHz 

 j

40I" 

1280MB『320 

bitIGDDR5 

607MHz 

3348MHz 

1215MHz 

1 633TFL0Ps 

134G队 

215W 

4008MHz 

1544MHz 

2.37TFLOPs 

192.4GB/s 

244W 

Host Interface来读取CPU指令时,GigaThread ̄I擎能够 

从系统内存中获取指定的数据并将其拷贝到显存中,然后 

是一个处理核心。但其实SP只是一个功能单元,真正比较 

接近于我们常说的内核则是SP的上一级单位:Streaming 

Multiprocess0r(即本文所说的“SM”)。因为目前只有 

会为各个SM阵列创建和分派线程块。单个SM阵列亦会将 

多个Warp(32个线程的群组)调度至多个流处理器以及其 

它执行单元。当图形流水线中出现工作膨胀现象时,例如 

在执行Tessellation以及光栅化操作之后,GigaThread ̄l 

在SM这一级才具备Program Counter(程序计数器)、调 

度资源以及分离的寄存器堆块,即才能进行CUDA计算。 

在AMD统一着色器架构的GPU中,类似SM等级的部件 

是SIMD Core,例如RV870拥有20个SIMD Core。 

擎还能够将工作重新分配至SM阵列。 

在GF1 10/100中,每个SP都有全流水线化的整数算 

术逻辑单元(ALU)和浮点单元(FPU)。ALU支持64bit 

和扩展指令,支持算术、shift(位移)、Boolean(布尔)、 

comparision(比较)以及move(数据传输或者赋值)。 

虽然GFll0的SM数量从GT200的30个下降为16个,但SP 

总数却达到了5l2个(GT200为30X 8=240个),实际的 

单周期理论性能则提升了近l倍甚至更多(例如双精度浮 

点运算)。另外,GFllO的一个SP每个周期可以实现一个 

Thread的一条浮点指令或者整数指令。 

不同以往的纹理单元设计 

在GF1 10/100中,每个SM配备了四个纹理单元,共计 

64个纹理单元。和上一代GT200以及竞争对手Cypress动 

①GF110/GF100' ̄"包含7四个GPC,每一个GPC甚至可以独立运行。 

辄80个纹理单元相比,GF1 10/100的纹理单元数量不但没 

有提升,反而下降。这是为什么昵? 

事实上,在GT200架构中,最多三个SM共享一个纹 

GFl10/100具备四 

组GPC,一个GPC由四 

组S M阵列组成,共计 

I 2 8个流处理器、四个 

PolyMorph Engine多形 

理引擎,该纹理引擎包括八个纹理定址单元和过滤单元。 

而G92 ̄q是两个SM共享一个纹理引擎。但NVIDIA认为 

单纯地添加纹理单元的数量并不能有效提升GPU的纹理 

贴图能力,甚至造成部分单元闲置浪费。因此在GF100中, 

NVIDIA通过将纹理单元移植到SM中的设计来提升纹 

理单元的使用效率和时钟频率一一每个SM都配备了四个 

专属的纹理单元和一个12KB的纹理高速缓存。一个纹理 

单元在一个时钟周期内能够计算一个纹理地址并获取四 

个纹理采样,可以支持包括双线性、三线性在内的各向异 

性过滤模式。总的来看,GF1 10/100打破了之前将纹理单 

体引擎、l6个SFU单元。 

其中,每一组SM阵列具 

备32个流处理器、一个 

PolyMorph Engine多形 

体引擎、16个Load/Store 

单元、四个SFU单元和 

纹理单元、两个WarpN 

度器和指令发送器、能 

配置为4 8KB Shared 

Memorv+l6KB Ll缓 

元设计在SM阵列之外的做法,将纹理单元整合在SM阵 

列里面,在一定程度上提升了纹理单元的效率。 

存或者l 6KB Sh a red 

Memory+48KB Ll缓存 

的共享内存/L1缓存。 

创新的Shared Memory ̄flL1/L2缓存 

在GF1 10/100中,每个SM阵列里面拥有一个容量很 

小的内存空间, ̄PShared Memory,可以用于数据交换, 

程序员可以方便自由使用。有了Shared Memory ̄,同一 

在C U D A的概念 

里,CUDA Core或者SP 

④和GF100一样,GFI j0的一纽sM 

阵列由32个流处理器组成。 

个Thread block内的线程可以共享数据,极大地提升了 

NVIDIA GPU在进行GPU Computing应用时的效率。 

虽然Shared Memory对许多计算都有帮助,但它并 

(Streaming Processor 

内核。简称“SP”)指的就 

Mc评测室]n st 

不适用于所有的问题。最佳化的内存层次架构方案就是 

同时提供Shared Memory和Cache,GFl 10/100就采用 

可以显著提升我们的游戏体验。但曲面细分会将特定帧 

中的三角形密度增加数十倍,给光栅化等串行化运算单元 

带来很大的压力,因此对图形流水线的优化就迫在眉睫。 

而GeForce GTX 480所采用的GF100图形架构就是专为 

了这样的设计。在G80和GT200中,每个SM都有16KB的 

Shared Memory。而在GFl 10/100中,每个SM拥有64KB 

的Shared Memory,能配置为48KB Shared Memory+ 

l6KB L1 Cache或者16KB Shared Memory+48KB Ll 

DirectX l1而设计,具备15个PolyMorph Engine(多形体 

引擎,又称之为曲面细分单元)和四个Raster Engine(光 

Cache的模式(G8O和GT200不具备L1/L2 Cache)。程 

序员可以自己编写一段小的程序,把Shared Memory当 

栅化引擎),因此在引入曲面细分设计的DirectX ll游戏 

中将会获得更大的优势(曲面细分设计越复杂,其优势会 

越明显)。而GeForce GTX 580采用的GF110核心,则具 

备完整的l6个PolyMorph Engine,在DirectX l1游戏的 

应用中会更加优秀。 

成Cache来使用,由软件负责实现数据的读写和一致性管 

理。而对那些不具备上述程序的应用程序来说,也可以直 

接自动从L1 Cache中受益,显著缩减运行CUDA程序的 

时间。过去,GPU的寄存器如果发生溢出的话,会大幅度 

地增加存取时延。有了LI Cache以后,即使临时寄存器使 

用量增加,程序的性能表现也不至于大起大落。 

具体来说,GeForce GTX 580的每个SM阵列里面具 

备可扩展的PolyMorph Engine,共计16个,可以实现较 

高的三角形速率。每个PolyMorph Engine均拥有专属的 

顶点获取单元以及Tessellator,极大地提升了几何性能。 

另外,GFl10/l00还提供了768KB的一体化L2 

Cache,L2 Cache为所有的Load/Store以及纹理请求提 

供高速缓存。对所有的SM阵列来说,L2 Cache上的数据 

与之呼应的则是分别常驻于四个GPC里面的四个并行的 

Raster Engine,它们能够在每个时钟周期内设置最多四 

个三角形,并且在三角形Fetch、Tessellation以及光栅化 

都是连贯一致的,从L2 Cache上读取到的数据就是最新 

的数据。有了L2 Cache后,就能实现GPU高效横跨数据 

共享。对于那些无法预知数据地址的算法,例如物理解算 

器、光线追踪以及稀疏矩阵乘法都可以从GF110/100的内 

存层次设计中显著获益。而对于需要多个SM读取相同数 

据的滤镜以及卷积核(convolution kerne1)等算法同样能 

因为这个设计而获益 

操作方面具备很强的性能。 

这种专为DirectX l1而设计的图形架构与AMD最 

新的Barts图形架构有很大的区别。Bans是在Cypress基 

础上演变而来,仍然只具备1个曲面细分单元Tessllator 

Gen7。而Barts相对于Cypress,曲面细分性能有所提升 

的原因并不是因为增加了曲面细分单元的数量,而是来源 

于线程分配模块的增强。不过这只能治标,却无法治本。 

因此在高负荷曲面细分计算环境下,Barts的曲面细分性 

能会大幅下降,此时即使拥有增强的线程分配模块设计也 

起不了太大的作用,因为主要的瓶颈在曲面细分单元的数 

量和效率上。 

改进的ROP单元 

在GF1 10/100上,NVIDIA对ROP单元进行了全新设 

计,大幅提升了数据吞吐量与效率。GF1 10/100包含六个 

RoP分区,一个R0P分区包括了/ RoP单元,共计48个 

ROP单元(GT200具备八个ROP分区,并与八个 

64bit的显存控制器绑定,一个R0P分区包含四个 

RoP单元。)。一个I P单元能够在一个时钟周期 

内输出一个32bit整数像素。理论上,由于R0P的 

压缩效率和R0P单元数量的提升,GFl 10在8x抗 

锯齿下的性能会得到明显改善。 

此外,得益于更多的原子操作单元以及L2缓 

①Barts仍然只有一个曲面细分单元,但增加7ultra.Threaded Dispatch Process0r的数 

 

存,GFll0的原子内存操作性能相对以往的架构来 

量,一定程度提升7曲面细分的性能。

说得到了巨大的提升。对同—地址的原子内存操作,GFl1O 

当然,由于曲面细分很耗费GPU资源,现在游戏厂商 

在使用这项技术时相对比较谨慎。最初的一些DirectX l1 

游戏基本没有或者加入了很少的曲面细分技术,因为当时 

显卡的曲面细分性能并不算强。而现在随着显卡 面细分 

性能的增强,一些DirectX l1游戏会加入更多的曲面细分 

技术,GFll0的曲面细分优势会进一步体现出来。 

的运算速度是GT200的20倍,而对相邻内存区域的操作则 

达 ̄J7.5倍。 

完整的曲面细分单元设计 

我们知道,曲面细分作为DirecX 1】中的重要技术, 

GeForce GTX 580内部赏析 

上文我们说过,相I:LGeForce GTX 480,GeForce 

GTX 580在散热设计和功耗控制方面有诸多改进,下 

面我们就来看看这些设计和改进究竟是哪些?GeForce 

GTX 580使用了6相核心、2相晁存供电的设计,其中每相 

核心搭配了3个SO.8封装形式的MOSFET,每相核心搭 

配2个SO.8封装形式的MOSFET,全部使用贴片电感。而 

且相比GeForce GTX 480,GeForce GTX 580的接口全 

部经过了屏蔽处理,抗干扰效果更佳。 

Mc评测室] 融 

的画面,可以深度考查显卡的Tessellation性能。我们将 

选取“DirectX 1 l+Shader(High)+Tessellation(Extre 

me)”模式进行测试,这表示显卡运行在最高画质、极致 

Tessellation等级的DirectX ll模式下。此外,我们还将重 

点考察GF100系列的抗锯齿性能。 

CPU:AMD Phenom lI X6 1090T 

主板:华硕CR0SSHAIR IV EXTREME 

(D GeForce GTX 580不再采用传统的搭配热管的散热设计,而是使用了真空 

腔均热板(Vapor Chamber)技术 事实上,它和热管的散热原理是相似的, 

都是利用毛细和真空原理,通过液体的蒸发和冷凝来来迟到导热的目的 所 

不同的是,热管在进行导热时,工作方向相对是固定的.只能单向进行导热, 

而均热板底座的工作方向是发散的,即可以向四周进行导热。显然.腔均热 

板底座的导热效率会更高,可以更快地导热,将GPU热量传递到散热靖 并 

最终通过风扇将热量排除。 

内存:金邦DDR3 1600 2GB×2 

电源:航嘉X7 900W 

系统:Windows 7旗舰版 

GeForce GT×580 Vs GeFor ̄e G下X 480 

频率、流处理器数量、纹理单元数量等规格的提升 

著提升了GeForce GTX 580的性能,特别是在DirectX 

l1游戏中,这种性能增益幅度很明显。例如在 潜行者: 

普里皮亚季》、 地铁2033))、 异形大战铁血战士》, 

GeForce GTX 580的领先幅度分别达到了l5%、20% 

和19%,这部分游戏应用了较大幅度的曲面细分技术, 

①显存供电部分使用APN7O88芯片 

①核1 供电部分使用YCHIL8266芯片 

“主于PCB背面),可以控制两相供电。 

(位于PCB背面),可以控制6相供电。 

GeForce GTX 580的规格提升使其获得了非常明显的性 

能提升。 

GeForce GTX 580性能测试 

接下来我们将进入精彩的性能测试部分,你将了解到 

GeForce GTX 580真实的3D、曲面细分、PhysX方面的 

性能和功耗温度方面的表现,以及它和AMD Cypress、 

而在抗锯齿性能提升方面,GeForce GTX 580亦有 

不错的表现,例如在 潜行者:普里皮亚季》中,GeForce 

GTX 580在开启了四倍抗锯齿以后,性能下降幅度为 

28%,而GeForce GTX 480为33%;在((战地:叛逆连队 

2》,GeForce GTX 580在开启了四倍抗锯齿以后,性能 

Barts之间的对比。我们将组建基于AMD PhenomⅡX6 

下降幅度为3%,而GeForce GTX 480为8%;在《孤岛危 

机 ,GeForce GTX 580在开启了四倍抗锯齿以后,性能 

下降幅度为5%,而GeForce GTX 480为l1%。出现这种 

1090T的顶级游戏平台进行测试,告诉你最详细和真实的 

的测试结果。 

在DirectX 1o/10.1游戏和软件测试方面,我们会选取 

《3DMark Vantage))、《孤岛惊魂2 、 孤岛危机 等主 

流的DirectX 10/10.1的游戏和软件对GF1 10的DirectX 

10/10.1性能进行测试。而对于大家最关注的DirectX l1 

游戏性能,我们将选取 地铁2033))、 异形大战铁血战 

士》、 鹰击长空2》等多款DirectX ll游戏和软件重点考 

查GF1 10在DirectX l1游戏和软件中的性能,看看它的 

情况是因为GeForce GTX 580的频率等规格提升,也一定 

程度提升了它的抗锯齿性能。 

GeForce GTX 580 Vs.Radeon HD 5870 

在之前GeForce GTX 480的评测中,GeForce GTX 

480凭借更出色图形架构在综合性能方面超出Radeon 

HD 5870不少,而现在规格更强悍的GeForce GTX 

DirectX Il执行效率究竟有无明显提升?当然,所有游戏 

都运行在最高画质— 

GFll0在图形架构上专为DirectX l1做了优化,我们 

将通过 ̄Unigine Heaven Benchmark))这款DirectX 1 1 

580 ̄J进一步将这种优势提高,实现了全面的超越。在 

DirectX ll游戏测试中,GeForce GTX 580凭借专为 

DirectX l1优化的GFllO图形架构,整体领先幅度在 

lO%-109%。例如在 战地:叛逆连队2》、((地铁2033))、 

软件来重点验证它的曲面细分性能。((Unigine Heaven 

Benchmark))的测试场景中包含了大量基于Tessellation 

失落的星球2》、(《异形大战铁血战士》、《潜行者:普 

里皮亚季》和 鹰击长空2》等DirectX l1游戏测试中, 

GeForce GTX 580的领先幅度分别达到了10%、57%、 

80%、l7%、30%和91%,领先幅度非常巨大,这再次验证 

了GeForce GTX 580在新游戏中的优势。 

在DirectX 10游戏中,GeForce GTX 580和Radeon 

580的最大系统功耗,有一些遗憾。截至发稿前,有消息 

指出可以通过特别版的GPU—Z+FurMark软件检测出 

GeForce GTX 580的最大系统功耗,但这种测试方法可 

能会XCGeForce GTX 580造成硬件损伤。针对这个问题, 

HD 5870的差距被缩小,例如在《孤岛危机》和 孤岛惊 

魂2》游戏中,GeForce GTX 580的领先幅度分别为6%和 

l2%。这是因为这部分老游戏比较强调纹理贴图的性能, 

比如 孤岛危机 ,而Radeon HD 5870由于具备80个纹 

理单元,在纹理渲染方面仍有不错的表现。 

在((Unigine Heaven Benchmark ̄的曲面细分测试 

中,GeForce GTX 580凭借l6个专属的曲面细分单元,在 

本刊也将持续予以关注。 

GeForce GTX 580:单核心王者毋庸 

置疑 

就在我们一直猜测完整规格的GF100产品何时出现 

时,NVIDIA很低调地发布了GeForce GTX 580。从实际 

测试来看,GeForce GTX 580非常好地巩固了单核心王 

者的地位,不仅相对GeForce GTX 480有l 5%左右的性 

“DirectX 1 l+Shader(High)+Tessellation(Extreme1” 

模式下领先Radeon HD 5870达到了109%,令人刮目相 

能提升,更是全面超越Radeon HD 5870,单核心王者的 

地位毋庸置疑。 

从GeForce GTX 580的图形架构来说,它和GeForce 

看。而最新的DirectX 1 1大作((鹰击长空2》也加入了曲面 

细分技术,GeForce GTX 580在该游戏中的领先幅度也 

高达91%。 

GTX 480没有本质区别,甚至你可以认为他们是一样的: 

专为DirectX ll设计的图形架构、强悍的曲面细分性能、 

出色的反锯齿性能和优秀的综合表现。 

但GeForce GTX 580还是有那么一些值得我们思 

功耗和温度表现 

NVIDIA在GeForce GTX 580上做出了限制最大功 

耗和改进散热的设计,这的确有效地控制了它的功耗和发 

热量。在这种情况下,GeForce GTX 580的待机温度和满 

载温度分别只有38"C和79"C左右,待机系统功耗和满载系 

统功耗分别为l l0W和323W,相比GeForce GTX 480有 

明显的下降。 

考和注意的设计.它并不是简单的GF100完整规格版本, 

它通过改进工艺和优化晶体管的效率使显卡的效率得到 

提升,更高的频率使其拥有更强的性能,每秒能处理20 

亿个三角形便是例证。改进的散热设计解决了一直困扰 

GeForce GTX 480的散热问题。而这些设计和改进都是 

这种设计的确可以在很大程度上控制GeForce GTX 

580的功耗,毕竟在实际游戏中是很难达到软件测试的最 

大功耗。但另一方面,我们却无法检测出GeForce GTX 

在完善GeForce GTX 480的不足,目的是将GFI 10/100架 

构的最大性能发挥出来。从这个意义来说,GeForce GTX 

580是GeForce GTX 480的完善和更强的版本。类似这种 

r首批上市的GeForce GTX 580显卡 ● 

:I●I j删

核心频率:772MHz 

显存频率:4008MHz 

 

核心频率:772MHz 

流处理器频率:1544MHz 参考价格:3999元 

流处理器频率:蠢 詈 。 1洲 544MHz 参考价格.爹考价格: 3999元兀 

在上一代产 

品上进行小 

不过不同的是,在大量的测试中,AMD沿用多年的 

4D+lD架构已经开始露出疲态,暴力添JJ[ISPU的做法已 

经遇到了瓶颈,架构的潜力被消耗殆尽。特别是其较差的 幅提升和更 

改的设计和 

近年来AMD 

曲面细分性能在今后大量运用曲面细分的游戏中会更加 

捉襟见肘,因此AMD在下一代产品中很可能会全面更换 

图形架构。而NVIDIA这边,凭借新一代GFI 10/100图形 

架构,可以在未来走得更远,因此其未来的产品很有可能 

仍然是基于GF110/100而设计,并逐步完善。 

另据已知的消息来看,NVIDIA在接下来的时间内将 

陆续发布GeForce GTX 570/560,以完善整个GeForce 

的做法比较 

类似,就好 

比Barts是在 

CYPress基 

础上进行小 

幅修改是一 

个道理。这 

④GeForceGTX 580在待机状态下会自劝降频 

GTX 500系列产品线。据称,GeForce GTX 570的发布 

时间是今年12月初,而GeForce GTX 560 ̄1]可能要等到 

种没计可以 

明年第一季度上市,相信届时的DirectX II市场又会有一 

让新产品快速推出市场,获得更多的市场关注。 

表2:GeForce GTX 580与主流高端产品的的测试成绩对比 

GTX 580 GTX480 

番恶斗。口 

GTX 470 HD 5870 HD 5850 HD 6870 HD 6850  l

GPU SCCIRE ;12434 

9494 7497 8617 6916 7341 5805 

麓 黼躐  I

1920X1080 PhysX ON 

1920x1080 PhysX OFF 

1920×1080 

 l30 

}58 

40 

1o 

58 

38 

57 

31 

58 

39 

57 

34 

{58 

36 

 56 I

30 

豳翻麟嘲豳鞠 

1920×1080 8AA 80 68 65 59 63 55 

1920x1080 8AA 124 119 114 63 55 

63 

黧嘲嘲

1920x1080+DirectX 11+Shader(High) 

 

+Tessellation(Extrem8) 

45.8 39.1 34.2 22.3 18.8 24 21.1 

盼黼I Il爨畿酾盼0 0- 

1920×1080 

瀚雕

78 71 68 :56 59 47 

 

激落 瓿 

1920x1080 

薯《 

1 7 64 

68 

麓圈圈隔 

}77 63 67 56 

1920X1080 4AA 

≥ 

1920X1080 4AF 

1920×1080 4AA 4AF 

曩霎 銎 

! 

30 

74 

蕊 

53 

53 

{18  12 f

鋈 翌 54 

 17 l

48 蕊

22 

16 

 

! 

{25 21 

姆 蜘b瞬 -.一茗 

1920×1080 

墨瑟翌 

63 

互曩

49.1 

要要墨

41 

至至l

 37 j

 霪

:32 

=一

37 

隧黼豳豳 

: 

31 

1920X1080 4AA 

运 鳓濑蚓 

1920x1200 

警麓 

61 52 43 

109W 

296W 

:44 

104W 

35 

104W 

249W 

待机系统功耗 

满载系统功耗 

11OW 

323W 

1 

440W 368W 

110W 

304W 

288W 

92 

2024年10月12日发(作者:税怡乐)

GeForce GTX 580:弥 ̄I'TGTX 480 

『勺缺失,打造完美Fermi 

GeForce GTX 580和GeForce GTX 480是一脉相承 

前最强的Tessellation曲面细分性能。它改进了ROP单 

的效率,提升了抗锯齿的性能。它大幅度提升了双精度一 

算性能,其双精度计算性能甚至达到了单精度计算性能l 

1/2。此外,它还集成了一级高速缓存和二级缓存,大幅J 

9,要了解GeForce GTX 580。我们先对GeForce GTX 

80进行一次回顾。 

2010上半年,NVIDIA在众人翘首以盼的目光下终 

提升了CUDA应用程序的性能,甚至还可以运行为其编: 

的C++程序。 

=推出了基于DirectX I1的GeForce GTX 480,这款称 

上划时代的显卡。NVIDIA这一代DirectX l1显卡的 

℃号为我们熟知的Fermi,而GeForce GTX 480的核心 

GeForce GTX 480的综合性能在单核心显卡中是] 

强的,设计也是最超前的,受到了业界的赞许。但它并不: 

美,首先是因为良率和功耗的问题,它并没有开启全部5】 

个流处理器(GFIO0核心的完整规格),而是仅仅打开 

480个流处理器,屏蔽了-一组即32个流处理器。此外,由= 

它的图形设计非常复杂,晶体管数量达到了30亿个,再) 

上其存在核心漏电的问题,因此其功耗和发热量很高。 

E号则为GFIO0。就这款产品的架构设计而言,GeForce 

}TX 480堪称有史以来图形架构设计最复杂、改进最多 

EIDirectX l1性能最强的显卡。 

GeForce GTX 480拥有多达l5个多形体引擎,具备目 

Mc评测室]IMC评测室 _鼍 -ibst 

・ 

在运行特别是满载状态时,噪音很大。这些都是GeForce 

GTX 480显卡的不足之处,也是NVIDIA在后续产品中着 

力改善的地方。 

此外,GeForce GTX 580还优化了晶圆的使用率和 

PCB走线等,带来的直接好处就是提升了它的使用效率。 

根据NVIDIA给出的数据,在相同频率、相同规格(SP、 

纹理等数量保持一致)的情况下,GeForce GTX 580的性 

GeForce GTX 580:我不是“马甲” 

现在,你大致能推测出GeForce GTX 580的一些特 

点了吧。是的,它弥补了GeForce GTX 480显卡的最大 

遗憾一具备了完整的512个流处理器。可能有一些用户 

能要超出GeForce GTX 480 10%左右。 

下面,我们一起来看看GeForce GTX 580的主要 

规格。它的核心代号为GFll0,每秒能处理204L个三角 

形,具备30亿个晶体管、4个GPC、512个流处理器、64 

会觉得GeForce GTX 580就是512SP版本的GeForce 

GTX 480显卡,不能说不正确,但至少不完全正确,因为 

NVIDIA在GeForce GTX 580上做了一系列的改进。一则 

个纹理单元和48个光栅单元,最大浮点计算能力为2.37 

TFLOPs。其核心频率、显存频率和流处理器频率分别 

为772MHz、4008MHz和l544MHz。它的显存规格为 

1.5GB/GDDR5/384.bit。根据NVIDIA给出的数据, 

是针对功耗和发热量的改进,之前 

G e F O r c e 

GeForce GTX 580显卡的最大功耗为244W,甚至比 

GTX 480存在核 

心漏电的问题,导 

致GeForce GTX 

GeForce GTX 480还低。 

GF1 1 0图形架构一览 

GFl l 011 00图形架构关键词 

1.四个GPC图形处理器集群 

4 80的个体功耗 

差・异较大,即一 

些GeForce GTX 

480功耗较高,而 

2.16组SM阵列、512个流处理器INVIDIA称其为512个CUDA核心) 

3.16个PolyMorph Engine(多形体引擎).四个Raster Engine(光栅 

化引擎) 

4 64个纹理单元 48个光栅单元 

5.384-bit(6×64.bit)/GDDR5的显存控制器 

些产品却较低。 

:在GeForce GTX 

580上,NVIDIA 

改善了核心漏电 

的问题。NVIDIA 

(D GeForce GTX 580的GPU-z信息 

从图形架构层面来看,GeForce GTX 580和GeForce 

GTX 480最大的不同是流处理器数量、纹理单元数量等规 

格差异,但两者所采用的图形架构是一致的。下面,我们将 

在GeForce GTX 

580的PCB上设计了专门的电源监控模块,限制了该显卡 

的最大功耗(后文会详细进行说明)。针对GeForce GTX 

480温度较高和散热器噪音较大的问题,GeForce GTX 

580在散热器上做了较大的改进,使用了均腔热板技术 

(后文会详细进行说明)。 

以GF100的图形架构为例,来进一步认识GF110图形架构。 

从GFll0的图形架构可以看出,它主要包含了一个主接 

口(Host Interface)、一个GigaThread ̄I擎、四个GPC、 

六个显存控制器、六个RoP分区和一个大小为768KB的L2 

高速缓存。其中,ROP分区紧邻L2高速缓存。当GPU通过 

表1:GeForce GTX 580.GeForce GTX 400系列和Radeon HD 5800/6800系列的规格一览 

核心代号 

匍程工艺 

晶体管数量 

流处理器单元(流 

处理算术逻辑单 

纹理单元 

光瞄单元 

显存类型 

物蝴率 

等效显存频率 

流处理器频率 

浮点预算 

显存带宽 

最大功耗 

GF110 

40nm 

GF100 

40nm 

GF100 

40nm 

Cypress 

40nm 

Barts 

40nm 

304Z 

512个 

64个 

30亿 

480个 

3O亿 

448I" 

56个 

21.5亿 

288X5个 

1 7{乙 

192×5个 

48个 

 ,

1536M13/384 

_b诖/GDDR5 

772MHz 

 j

40I" 

1280MB『320 

bitIGDDR5 

607MHz 

3348MHz 

1215MHz 

1 633TFL0Ps 

134G队 

215W 

4008MHz 

1544MHz 

2.37TFLOPs 

192.4GB/s 

244W 

Host Interface来读取CPU指令时,GigaThread ̄I擎能够 

从系统内存中获取指定的数据并将其拷贝到显存中,然后 

是一个处理核心。但其实SP只是一个功能单元,真正比较 

接近于我们常说的内核则是SP的上一级单位:Streaming 

Multiprocess0r(即本文所说的“SM”)。因为目前只有 

会为各个SM阵列创建和分派线程块。单个SM阵列亦会将 

多个Warp(32个线程的群组)调度至多个流处理器以及其 

它执行单元。当图形流水线中出现工作膨胀现象时,例如 

在执行Tessellation以及光栅化操作之后,GigaThread ̄l 

在SM这一级才具备Program Counter(程序计数器)、调 

度资源以及分离的寄存器堆块,即才能进行CUDA计算。 

在AMD统一着色器架构的GPU中,类似SM等级的部件 

是SIMD Core,例如RV870拥有20个SIMD Core。 

擎还能够将工作重新分配至SM阵列。 

在GF1 10/100中,每个SP都有全流水线化的整数算 

术逻辑单元(ALU)和浮点单元(FPU)。ALU支持64bit 

和扩展指令,支持算术、shift(位移)、Boolean(布尔)、 

comparision(比较)以及move(数据传输或者赋值)。 

虽然GFll0的SM数量从GT200的30个下降为16个,但SP 

总数却达到了5l2个(GT200为30X 8=240个),实际的 

单周期理论性能则提升了近l倍甚至更多(例如双精度浮 

点运算)。另外,GFllO的一个SP每个周期可以实现一个 

Thread的一条浮点指令或者整数指令。 

不同以往的纹理单元设计 

在GF1 10/100中,每个SM配备了四个纹理单元,共计 

64个纹理单元。和上一代GT200以及竞争对手Cypress动 

①GF110/GF100' ̄"包含7四个GPC,每一个GPC甚至可以独立运行。 

辄80个纹理单元相比,GF1 10/100的纹理单元数量不但没 

有提升,反而下降。这是为什么昵? 

事实上,在GT200架构中,最多三个SM共享一个纹 

GFl10/100具备四 

组GPC,一个GPC由四 

组S M阵列组成,共计 

I 2 8个流处理器、四个 

PolyMorph Engine多形 

理引擎,该纹理引擎包括八个纹理定址单元和过滤单元。 

而G92 ̄q是两个SM共享一个纹理引擎。但NVIDIA认为 

单纯地添加纹理单元的数量并不能有效提升GPU的纹理 

贴图能力,甚至造成部分单元闲置浪费。因此在GF100中, 

NVIDIA通过将纹理单元移植到SM中的设计来提升纹 

理单元的使用效率和时钟频率一一每个SM都配备了四个 

专属的纹理单元和一个12KB的纹理高速缓存。一个纹理 

单元在一个时钟周期内能够计算一个纹理地址并获取四 

个纹理采样,可以支持包括双线性、三线性在内的各向异 

性过滤模式。总的来看,GF1 10/100打破了之前将纹理单 

体引擎、l6个SFU单元。 

其中,每一组SM阵列具 

备32个流处理器、一个 

PolyMorph Engine多形 

体引擎、16个Load/Store 

单元、四个SFU单元和 

纹理单元、两个WarpN 

度器和指令发送器、能 

配置为4 8KB Shared 

Memorv+l6KB Ll缓 

元设计在SM阵列之外的做法,将纹理单元整合在SM阵 

列里面,在一定程度上提升了纹理单元的效率。 

存或者l 6KB Sh a red 

Memory+48KB Ll缓存 

的共享内存/L1缓存。 

创新的Shared Memory ̄flL1/L2缓存 

在GF1 10/100中,每个SM阵列里面拥有一个容量很 

小的内存空间, ̄PShared Memory,可以用于数据交换, 

程序员可以方便自由使用。有了Shared Memory ̄,同一 

在C U D A的概念 

里,CUDA Core或者SP 

④和GF100一样,GFI j0的一纽sM 

阵列由32个流处理器组成。 

个Thread block内的线程可以共享数据,极大地提升了 

NVIDIA GPU在进行GPU Computing应用时的效率。 

虽然Shared Memory对许多计算都有帮助,但它并 

(Streaming Processor 

内核。简称“SP”)指的就 

Mc评测室]n st 

不适用于所有的问题。最佳化的内存层次架构方案就是 

同时提供Shared Memory和Cache,GFl 10/100就采用 

可以显著提升我们的游戏体验。但曲面细分会将特定帧 

中的三角形密度增加数十倍,给光栅化等串行化运算单元 

带来很大的压力,因此对图形流水线的优化就迫在眉睫。 

而GeForce GTX 480所采用的GF100图形架构就是专为 

了这样的设计。在G80和GT200中,每个SM都有16KB的 

Shared Memory。而在GFl 10/100中,每个SM拥有64KB 

的Shared Memory,能配置为48KB Shared Memory+ 

l6KB L1 Cache或者16KB Shared Memory+48KB Ll 

DirectX l1而设计,具备15个PolyMorph Engine(多形体 

引擎,又称之为曲面细分单元)和四个Raster Engine(光 

Cache的模式(G8O和GT200不具备L1/L2 Cache)。程 

序员可以自己编写一段小的程序,把Shared Memory当 

栅化引擎),因此在引入曲面细分设计的DirectX ll游戏 

中将会获得更大的优势(曲面细分设计越复杂,其优势会 

越明显)。而GeForce GTX 580采用的GF110核心,则具 

备完整的l6个PolyMorph Engine,在DirectX l1游戏的 

应用中会更加优秀。 

成Cache来使用,由软件负责实现数据的读写和一致性管 

理。而对那些不具备上述程序的应用程序来说,也可以直 

接自动从L1 Cache中受益,显著缩减运行CUDA程序的 

时间。过去,GPU的寄存器如果发生溢出的话,会大幅度 

地增加存取时延。有了LI Cache以后,即使临时寄存器使 

用量增加,程序的性能表现也不至于大起大落。 

具体来说,GeForce GTX 580的每个SM阵列里面具 

备可扩展的PolyMorph Engine,共计16个,可以实现较 

高的三角形速率。每个PolyMorph Engine均拥有专属的 

顶点获取单元以及Tessellator,极大地提升了几何性能。 

另外,GFl10/l00还提供了768KB的一体化L2 

Cache,L2 Cache为所有的Load/Store以及纹理请求提 

供高速缓存。对所有的SM阵列来说,L2 Cache上的数据 

与之呼应的则是分别常驻于四个GPC里面的四个并行的 

Raster Engine,它们能够在每个时钟周期内设置最多四 

个三角形,并且在三角形Fetch、Tessellation以及光栅化 

都是连贯一致的,从L2 Cache上读取到的数据就是最新 

的数据。有了L2 Cache后,就能实现GPU高效横跨数据 

共享。对于那些无法预知数据地址的算法,例如物理解算 

器、光线追踪以及稀疏矩阵乘法都可以从GF110/100的内 

存层次设计中显著获益。而对于需要多个SM读取相同数 

据的滤镜以及卷积核(convolution kerne1)等算法同样能 

因为这个设计而获益 

操作方面具备很强的性能。 

这种专为DirectX l1而设计的图形架构与AMD最 

新的Barts图形架构有很大的区别。Bans是在Cypress基 

础上演变而来,仍然只具备1个曲面细分单元Tessllator 

Gen7。而Barts相对于Cypress,曲面细分性能有所提升 

的原因并不是因为增加了曲面细分单元的数量,而是来源 

于线程分配模块的增强。不过这只能治标,却无法治本。 

因此在高负荷曲面细分计算环境下,Barts的曲面细分性 

能会大幅下降,此时即使拥有增强的线程分配模块设计也 

起不了太大的作用,因为主要的瓶颈在曲面细分单元的数 

量和效率上。 

改进的ROP单元 

在GF1 10/100上,NVIDIA对ROP单元进行了全新设 

计,大幅提升了数据吞吐量与效率。GF1 10/100包含六个 

RoP分区,一个R0P分区包括了/ RoP单元,共计48个 

ROP单元(GT200具备八个ROP分区,并与八个 

64bit的显存控制器绑定,一个R0P分区包含四个 

RoP单元。)。一个I P单元能够在一个时钟周期 

内输出一个32bit整数像素。理论上,由于R0P的 

压缩效率和R0P单元数量的提升,GFl 10在8x抗 

锯齿下的性能会得到明显改善。 

此外,得益于更多的原子操作单元以及L2缓 

①Barts仍然只有一个曲面细分单元,但增加7ultra.Threaded Dispatch Process0r的数 

 

存,GFll0的原子内存操作性能相对以往的架构来 

量,一定程度提升7曲面细分的性能。

说得到了巨大的提升。对同—地址的原子内存操作,GFl1O 

当然,由于曲面细分很耗费GPU资源,现在游戏厂商 

在使用这项技术时相对比较谨慎。最初的一些DirectX l1 

游戏基本没有或者加入了很少的曲面细分技术,因为当时 

显卡的曲面细分性能并不算强。而现在随着显卡 面细分 

性能的增强,一些DirectX l1游戏会加入更多的曲面细分 

技术,GFll0的曲面细分优势会进一步体现出来。 

的运算速度是GT200的20倍,而对相邻内存区域的操作则 

达 ̄J7.5倍。 

完整的曲面细分单元设计 

我们知道,曲面细分作为DirecX 1】中的重要技术, 

GeForce GTX 580内部赏析 

上文我们说过,相I:LGeForce GTX 480,GeForce 

GTX 580在散热设计和功耗控制方面有诸多改进,下 

面我们就来看看这些设计和改进究竟是哪些?GeForce 

GTX 580使用了6相核心、2相晁存供电的设计,其中每相 

核心搭配了3个SO.8封装形式的MOSFET,每相核心搭 

配2个SO.8封装形式的MOSFET,全部使用贴片电感。而 

且相比GeForce GTX 480,GeForce GTX 580的接口全 

部经过了屏蔽处理,抗干扰效果更佳。 

Mc评测室] 融 

的画面,可以深度考查显卡的Tessellation性能。我们将 

选取“DirectX 1 l+Shader(High)+Tessellation(Extre 

me)”模式进行测试,这表示显卡运行在最高画质、极致 

Tessellation等级的DirectX ll模式下。此外,我们还将重 

点考察GF100系列的抗锯齿性能。 

CPU:AMD Phenom lI X6 1090T 

主板:华硕CR0SSHAIR IV EXTREME 

(D GeForce GTX 580不再采用传统的搭配热管的散热设计,而是使用了真空 

腔均热板(Vapor Chamber)技术 事实上,它和热管的散热原理是相似的, 

都是利用毛细和真空原理,通过液体的蒸发和冷凝来来迟到导热的目的 所 

不同的是,热管在进行导热时,工作方向相对是固定的.只能单向进行导热, 

而均热板底座的工作方向是发散的,即可以向四周进行导热。显然.腔均热 

板底座的导热效率会更高,可以更快地导热,将GPU热量传递到散热靖 并 

最终通过风扇将热量排除。 

内存:金邦DDR3 1600 2GB×2 

电源:航嘉X7 900W 

系统:Windows 7旗舰版 

GeForce GT×580 Vs GeFor ̄e G下X 480 

频率、流处理器数量、纹理单元数量等规格的提升 

著提升了GeForce GTX 580的性能,特别是在DirectX 

l1游戏中,这种性能增益幅度很明显。例如在 潜行者: 

普里皮亚季》、 地铁2033))、 异形大战铁血战士》, 

GeForce GTX 580的领先幅度分别达到了l5%、20% 

和19%,这部分游戏应用了较大幅度的曲面细分技术, 

①显存供电部分使用APN7O88芯片 

①核1 供电部分使用YCHIL8266芯片 

“主于PCB背面),可以控制两相供电。 

(位于PCB背面),可以控制6相供电。 

GeForce GTX 580的规格提升使其获得了非常明显的性 

能提升。 

GeForce GTX 580性能测试 

接下来我们将进入精彩的性能测试部分,你将了解到 

GeForce GTX 580真实的3D、曲面细分、PhysX方面的 

性能和功耗温度方面的表现,以及它和AMD Cypress、 

而在抗锯齿性能提升方面,GeForce GTX 580亦有 

不错的表现,例如在 潜行者:普里皮亚季》中,GeForce 

GTX 580在开启了四倍抗锯齿以后,性能下降幅度为 

28%,而GeForce GTX 480为33%;在((战地:叛逆连队 

2》,GeForce GTX 580在开启了四倍抗锯齿以后,性能 

Barts之间的对比。我们将组建基于AMD PhenomⅡX6 

下降幅度为3%,而GeForce GTX 480为8%;在《孤岛危 

机 ,GeForce GTX 580在开启了四倍抗锯齿以后,性能 

下降幅度为5%,而GeForce GTX 480为l1%。出现这种 

1090T的顶级游戏平台进行测试,告诉你最详细和真实的 

的测试结果。 

在DirectX 1o/10.1游戏和软件测试方面,我们会选取 

《3DMark Vantage))、《孤岛惊魂2 、 孤岛危机 等主 

流的DirectX 10/10.1的游戏和软件对GF1 10的DirectX 

10/10.1性能进行测试。而对于大家最关注的DirectX l1 

游戏性能,我们将选取 地铁2033))、 异形大战铁血战 

士》、 鹰击长空2》等多款DirectX ll游戏和软件重点考 

查GF1 10在DirectX l1游戏和软件中的性能,看看它的 

情况是因为GeForce GTX 580的频率等规格提升,也一定 

程度提升了它的抗锯齿性能。 

GeForce GTX 580 Vs.Radeon HD 5870 

在之前GeForce GTX 480的评测中,GeForce GTX 

480凭借更出色图形架构在综合性能方面超出Radeon 

HD 5870不少,而现在规格更强悍的GeForce GTX 

DirectX Il执行效率究竟有无明显提升?当然,所有游戏 

都运行在最高画质— 

GFll0在图形架构上专为DirectX l1做了优化,我们 

将通过 ̄Unigine Heaven Benchmark))这款DirectX 1 1 

580 ̄J进一步将这种优势提高,实现了全面的超越。在 

DirectX ll游戏测试中,GeForce GTX 580凭借专为 

DirectX l1优化的GFllO图形架构,整体领先幅度在 

lO%-109%。例如在 战地:叛逆连队2》、((地铁2033))、 

软件来重点验证它的曲面细分性能。((Unigine Heaven 

Benchmark))的测试场景中包含了大量基于Tessellation 

失落的星球2》、(《异形大战铁血战士》、《潜行者:普 

里皮亚季》和 鹰击长空2》等DirectX l1游戏测试中, 

GeForce GTX 580的领先幅度分别达到了10%、57%、 

80%、l7%、30%和91%,领先幅度非常巨大,这再次验证 

了GeForce GTX 580在新游戏中的优势。 

在DirectX 10游戏中,GeForce GTX 580和Radeon 

580的最大系统功耗,有一些遗憾。截至发稿前,有消息 

指出可以通过特别版的GPU—Z+FurMark软件检测出 

GeForce GTX 580的最大系统功耗,但这种测试方法可 

能会XCGeForce GTX 580造成硬件损伤。针对这个问题, 

HD 5870的差距被缩小,例如在《孤岛危机》和 孤岛惊 

魂2》游戏中,GeForce GTX 580的领先幅度分别为6%和 

l2%。这是因为这部分老游戏比较强调纹理贴图的性能, 

比如 孤岛危机 ,而Radeon HD 5870由于具备80个纹 

理单元,在纹理渲染方面仍有不错的表现。 

在((Unigine Heaven Benchmark ̄的曲面细分测试 

中,GeForce GTX 580凭借l6个专属的曲面细分单元,在 

本刊也将持续予以关注。 

GeForce GTX 580:单核心王者毋庸 

置疑 

就在我们一直猜测完整规格的GF100产品何时出现 

时,NVIDIA很低调地发布了GeForce GTX 580。从实际 

测试来看,GeForce GTX 580非常好地巩固了单核心王 

者的地位,不仅相对GeForce GTX 480有l 5%左右的性 

“DirectX 1 l+Shader(High)+Tessellation(Extreme1” 

模式下领先Radeon HD 5870达到了109%,令人刮目相 

能提升,更是全面超越Radeon HD 5870,单核心王者的 

地位毋庸置疑。 

从GeForce GTX 580的图形架构来说,它和GeForce 

看。而最新的DirectX 1 1大作((鹰击长空2》也加入了曲面 

细分技术,GeForce GTX 580在该游戏中的领先幅度也 

高达91%。 

GTX 480没有本质区别,甚至你可以认为他们是一样的: 

专为DirectX ll设计的图形架构、强悍的曲面细分性能、 

出色的反锯齿性能和优秀的综合表现。 

但GeForce GTX 580还是有那么一些值得我们思 

功耗和温度表现 

NVIDIA在GeForce GTX 580上做出了限制最大功 

耗和改进散热的设计,这的确有效地控制了它的功耗和发 

热量。在这种情况下,GeForce GTX 580的待机温度和满 

载温度分别只有38"C和79"C左右,待机系统功耗和满载系 

统功耗分别为l l0W和323W,相比GeForce GTX 480有 

明显的下降。 

考和注意的设计.它并不是简单的GF100完整规格版本, 

它通过改进工艺和优化晶体管的效率使显卡的效率得到 

提升,更高的频率使其拥有更强的性能,每秒能处理20 

亿个三角形便是例证。改进的散热设计解决了一直困扰 

GeForce GTX 480的散热问题。而这些设计和改进都是 

这种设计的确可以在很大程度上控制GeForce GTX 

580的功耗,毕竟在实际游戏中是很难达到软件测试的最 

大功耗。但另一方面,我们却无法检测出GeForce GTX 

在完善GeForce GTX 480的不足,目的是将GFI 10/100架 

构的最大性能发挥出来。从这个意义来说,GeForce GTX 

580是GeForce GTX 480的完善和更强的版本。类似这种 

r首批上市的GeForce GTX 580显卡 ● 

:I●I j删

核心频率:772MHz 

显存频率:4008MHz 

 

核心频率:772MHz 

流处理器频率:1544MHz 参考价格:3999元 

流处理器频率:蠢 詈 。 1洲 544MHz 参考价格.爹考价格: 3999元兀 

在上一代产 

品上进行小 

不过不同的是,在大量的测试中,AMD沿用多年的 

4D+lD架构已经开始露出疲态,暴力添JJ[ISPU的做法已 

经遇到了瓶颈,架构的潜力被消耗殆尽。特别是其较差的 幅提升和更 

改的设计和 

近年来AMD 

曲面细分性能在今后大量运用曲面细分的游戏中会更加 

捉襟见肘,因此AMD在下一代产品中很可能会全面更换 

图形架构。而NVIDIA这边,凭借新一代GFI 10/100图形 

架构,可以在未来走得更远,因此其未来的产品很有可能 

仍然是基于GF110/100而设计,并逐步完善。 

另据已知的消息来看,NVIDIA在接下来的时间内将 

陆续发布GeForce GTX 570/560,以完善整个GeForce 

的做法比较 

类似,就好 

比Barts是在 

CYPress基 

础上进行小 

幅修改是一 

个道理。这 

④GeForceGTX 580在待机状态下会自劝降频 

GTX 500系列产品线。据称,GeForce GTX 570的发布 

时间是今年12月初,而GeForce GTX 560 ̄1]可能要等到 

种没计可以 

明年第一季度上市,相信届时的DirectX II市场又会有一 

让新产品快速推出市场,获得更多的市场关注。 

表2:GeForce GTX 580与主流高端产品的的测试成绩对比 

GTX 580 GTX480 

番恶斗。口 

GTX 470 HD 5870 HD 5850 HD 6870 HD 6850  l

GPU SCCIRE ;12434 

9494 7497 8617 6916 7341 5805 

麓 黼躐  I

1920X1080 PhysX ON 

1920x1080 PhysX OFF 

1920×1080 

 l30 

}58 

40 

1o 

58 

38 

57 

31 

58 

39 

57 

34 

{58 

36 

 56 I

30 

豳翻麟嘲豳鞠 

1920×1080 8AA 80 68 65 59 63 55 

1920x1080 8AA 124 119 114 63 55 

63 

黧嘲嘲

1920x1080+DirectX 11+Shader(High) 

 

+Tessellation(Extrem8) 

45.8 39.1 34.2 22.3 18.8 24 21.1 

盼黼I Il爨畿酾盼0 0- 

1920×1080 

瀚雕

78 71 68 :56 59 47 

 

激落 瓿 

1920x1080 

薯《 

1 7 64 

68 

麓圈圈隔 

}77 63 67 56 

1920X1080 4AA 

≥ 

1920X1080 4AF 

1920×1080 4AA 4AF 

曩霎 銎 

! 

30 

74 

蕊 

53 

53 

{18  12 f

鋈 翌 54 

 17 l

48 蕊

22 

16 

 

! 

{25 21 

姆 蜘b瞬 -.一茗 

1920×1080 

墨瑟翌 

63 

互曩

49.1 

要要墨

41 

至至l

 37 j

 霪

:32 

=一

37 

隧黼豳豳 

: 

31 

1920X1080 4AA 

运 鳓濑蚓 

1920x1200 

警麓 

61 52 43 

109W 

296W 

:44 

104W 

35 

104W 

249W 

待机系统功耗 

满载系统功耗 

11OW 

323W 

1 

440W 368W 

110W 

304W 

288W 

92 

发布评论

评论列表 (0)

  1. 暂无评论