王者Fermi,新君驾临 NVIDIA GeForce GTX 580 显卡评测-USB迷|专注于互联网分享

2024年10月12日发(作者：税怡乐)

ＧｅＦｏｒｃｅ　ＧＴＸ　５８０：弥￣Ｉ＇ＴＧＴＸ　４８０　

『勺缺失，打造完美Ｆｅｒｍｉ　

ＧｅＦｏｒｃｅ　ＧＴＸ　５８０和ＧｅＦｏｒｃｅ　ＧＴＸ　４８０是一脉相承　

前最强的Ｔｅｓｓｅｌｌａｔｉｏｎ曲面细分性能。它改进了ＲＯＰ单　

的效率，提升了抗锯齿的性能。它大幅度提升了双精度一　

算性能，其双精度计算性能甚至达到了单精度计算性能ｌ　

１／２。此外，它还集成了一级高速缓存和二级缓存，大幅Ｊ　

９，要了解ＧｅＦｏｒｃｅ　ＧＴＸ　５８０。我们先对ＧｅＦｏｒｃｅ　ＧＴＸ　

８０进行一次回顾。　

２０１０上半年，ＮＶＩＤＩＡ在众人翘首以盼的目光下终　

提升了ＣＵＤＡ应用程序的性能，甚至还可以运行为其编：　

的Ｃ＋＋程序。　

＝推出了基于ＤｉｒｅｃｔＸ　Ｉ１的ＧｅＦｏｒｃｅ　ＧＴＸ　４８０，这款称　

上划时代的显卡。ＮＶＩＤＩＡ这一代ＤｉｒｅｃｔＸ　ｌ１显卡的　

℃号为我们熟知的Ｆｅｒｍｉ，而ＧｅＦｏｒｃｅ　ＧＴＸ　４８０的核心　

ＧｅＦｏｒｃｅ　ＧＴＸ　４８０的综合性能在单核心显卡中是］　

强的，设计也是最超前的，受到了业界的赞许。但它并不：　

美，首先是因为良率和功耗的问题，它并没有开启全部５】　

个流处理器（ＧＦＩＯ０核心的完整规格），而是仅仅打开　

４８０个流处理器，屏蔽了－一组即３２个流处理器。此外，由＝　

它的图形设计非常复杂，晶体管数量达到了３０亿个，再）　

上其存在核心漏电的问题，因此其功耗和发热量很高。　

Ｅ号则为ＧＦＩＯ０。就这款产品的架构设计而言，ＧｅＦｏｒｃｅ　

｝ＴＸ　４８０堪称有史以来图形架构设计最复杂、改进最多　

ＥＩＤｉｒｅｃｔＸ　ｌ１性能最强的显卡。　

ＧｅＦｏｒｃｅ　ＧＴＸ　４８０拥有多达ｌ５个多形体引擎，具备目　

Ｍｃ评测室］ＩＭＣ评测室　＿鼍　－ｉｂｓｔ　

・　

在运行特别是满载状态时，噪音很大。这些都是ＧｅＦｏｒｃｅ　

ＧＴＸ　４８０显卡的不足之处，也是ＮＶＩＤＩＡ在后续产品中着　

力改善的地方。　

此外，ＧｅＦｏｒｃｅ　ＧＴＸ　５８０还优化了晶圆的使用率和　

ＰＣＢ走线等，带来的直接好处就是提升了它的使用效率。　

根据ＮＶＩＤＩＡ给出的数据，在相同频率、相同规格（ＳＰ、　

纹理等数量保持一致）的情况下，ＧｅＦｏｒｃｅ　ＧＴＸ　５８０的性　

ＧｅＦｏｒｃｅ　ＧＴＸ　５８０：我不是“马甲”　

现在，你大致能推测出ＧｅＦｏｒｃｅ　ＧＴＸ　５８０的一些特　

点了吧。是的，它弥补了ＧｅＦｏｒｃｅ　ＧＴＸ　４８０显卡的最大　

遗憾一具备了完整的５１２个流处理器。可能有一些用户　

能要超出ＧｅＦｏｒｃｅ　ＧＴＸ　４８０　１０％左右。　

下面，我们一起来看看ＧｅＦｏｒｃｅ　ＧＴＸ　５８０的主要　

规格。它的核心代号为ＧＦｌｌ０，每秒能处理２０４Ｌ个三角　

形，具备３０亿个晶体管、４个ＧＰＣ、５１２个流处理器、６４　

会觉得ＧｅＦｏｒｃｅ　ＧＴＸ　５８０就是５１２ＳＰ版本的ＧｅＦｏｒｃｅ　

ＧＴＸ　４８０显卡，不能说不正确，但至少不完全正确，因为　

ＮＶＩＤＩＡ在ＧｅＦｏｒｃｅ　ＧＴＸ　５８０上做了一系列的改进。一则　

个纹理单元和４８个光栅单元，最大浮点计算能力为２．３７　

ＴＦＬＯＰｓ。其核心频率、显存频率和流处理器频率分别　

为７７２ＭＨｚ、４００８ＭＨｚ和ｌ５４４ＭＨｚ。它的显存规格为　

１．５ＧＢ／ＧＤＤＲ５／３８４．ｂｉｔ。根据ＮＶＩＤＩＡ给出的数据，　

是针对功耗和发热量的改进，之前　

Ｇ　ｅ　Ｆ　Ｏ　ｒ　ｃ　ｅ　

ＧｅＦｏｒｃｅ　ＧＴＸ　５８０显卡的最大功耗为２４４Ｗ，甚至比　

ＧＴＸ　４８０存在核　

心漏电的问题，导　

致ＧｅＦｏｒｃｅ　ＧＴＸ　

ＧｅＦｏｒｃｅ　ＧＴＸ　４８０还低。　

ＧＦ１　１　０图形架构一览　

ＧＦｌ　ｌ　０１１　００图形架构关键词　

１．四个ＧＰＣ图形处理器集群　

４　８０的个体功耗　

差・异较大，即一　

些ＧｅＦｏｒｃｅ　ＧＴＸ　

４８０功耗较高，而　

一

２．１６组ＳＭ阵列、５１２个流处理器ＩＮＶＩＤＩＡ称其为５１２个ＣＵＤＡ核心）　

３．１６个ＰｏｌｙＭｏｒｐｈ　Ｅｎｇｉｎｅ（多形体引擎）．四个Ｒａｓｔｅｒ　Ｅｎｇｉｎｅ（光栅　

化引擎）　

４　６４个纹理单元　４８个光栅单元　

５．３８４－ｂｉｔ（６×６４．ｂｉｔ）／ＧＤＤＲ５的显存控制器　

些产品却较低。　

：在ＧｅＦｏｒｃｅ　ＧＴＸ　

５８０上，ＮＶＩＤＩＡ　

改善了核心漏电　

的问题。ＮＶＩＤＩＡ　

（Ｄ　ＧｅＦｏｒｃｅ　ＧＴＸ　５８０的ＧＰＵ－ｚ信息　

从图形架构层面来看，ＧｅＦｏｒｃｅ　ＧＴＸ　５８０和ＧｅＦｏｒｃｅ　

ＧＴＸ　４８０最大的不同是流处理器数量、纹理单元数量等规　

格差异，但两者所采用的图形架构是一致的。下面，我们将　

在ＧｅＦｏｒｃｅ　ＧＴＸ　

５８０的ＰＣＢ上设计了专门的电源监控模块，限制了该显卡　

的最大功耗（后文会详细进行说明）。针对ＧｅＦｏｒｃｅ　ＧＴＸ　

４８０温度较高和散热器噪音较大的问题，ＧｅＦｏｒｃｅ　ＧＴＸ　

５８０在散热器上做了较大的改进，使用了均腔热板技术　

（后文会详细进行说明）。　

以ＧＦ１００的图形架构为例，来进一步认识ＧＦ１１０图形架构。　

从ＧＦｌｌ０的图形架构可以看出，它主要包含了一个主接　

口（Ｈｏｓｔ　Ｉｎｔｅｒｆａｃｅ）、一个ＧｉｇａＴｈｒｅａｄ￣Ｉ擎、四个ＧＰＣ、　

六个显存控制器、六个ＲｏＰ分区和一个大小为７６８ＫＢ的Ｌ２　

高速缓存。其中，ＲＯＰ分区紧邻Ｌ２高速缓存。当ＧＰＵ通过　

表１：ＧｅＦｏｒｃｅ　ＧＴＸ　５８０．ＧｅＦｏｒｃｅ　ＧＴＸ　４００系列和Ｒａｄｅｏｎ　ＨＤ　５８００／６８００系列的规格一览　

核心代号　

匍程工艺　

晶体管数量　

流处理器单元（流　

处理算术逻辑单　

纹理单元　

光瞄单元　

显存类型　

物蝴率　

等效显存频率　

流处理器频率　

浮点预算　

显存带宽　

最大功耗　

ＧＦ１１０　

４０ｎｍ　

ＧＦ１００　

４０ｎｍ　

ＧＦ１００　

４０ｎｍ　

Ｃｙｐｒｅｓｓ　

４０ｎｍ　

Ｂａｒｔｓ　

４０ｎｍ　

３０４Ｚ　

５１２个　

６４个　

３０亿　

４８０个　

３Ｏ亿　

４４８Ｉ＂　

５６个　

２１．５亿　

２８８Ｘ５个　

１　７｛乙　

１９２×５个　

４８个　

　，

１５３６Ｍ１３／３８４　

＿ｂ诖／ＧＤＤＲ５　

７７２ＭＨｚ　

　ｊ

４０Ｉ＂　

１２８０ＭＢ『３２０　

．

ｂｉｔＩＧＤＤＲ５　

６０７ＭＨｚ　

３３４８ＭＨｚ　

１２１５ＭＨｚ　

１　６３３ＴＦＬ０Ｐｓ　

１３４Ｇ队　

２１５Ｗ　

４００８ＭＨｚ　

１５４４ＭＨｚ　

２．３７ＴＦＬＯＰｓ　

１９２．４ＧＢ／ｓ　

２４４Ｗ　

Ｈｏｓｔ　Ｉｎｔｅｒｆａｃｅ来读取ＣＰＵ指令时，ＧｉｇａＴｈｒｅａｄ￣Ｉ擎能够　

从系统内存中获取指定的数据并将其拷贝到显存中，然后　

是一个处理核心。但其实ＳＰ只是一个功能单元，真正比较　

接近于我们常说的内核则是ＳＰ的上一级单位：Ｓｔｒｅａｍｉｎｇ　

Ｍｕｌｔｉｐｒｏｃｅｓｓ０ｒ（即本文所说的“ＳＭ”）。因为目前只有　

会为各个ＳＭ阵列创建和分派线程块。单个ＳＭ阵列亦会将　

多个Ｗａｒｐ（３２个线程的群组）调度至多个流处理器以及其　

它执行单元。当图形流水线中出现工作膨胀现象时，例如　

在执行Ｔｅｓｓｅｌｌａｔｉｏｎ以及光栅化操作之后，ＧｉｇａＴｈｒｅａｄ￣ｌ　

在ＳＭ这一级才具备Ｐｒｏｇｒａｍ　Ｃｏｕｎｔｅｒ（程序计数器）、调　

度资源以及分离的寄存器堆块，即才能进行ＣＵＤＡ计算。　

在ＡＭＤ统一着色器架构的ＧＰＵ中，类似ＳＭ等级的部件　

是ＳＩＭＤ　Ｃｏｒｅ，例如ＲＶ８７０拥有２０个ＳＩＭＤ　Ｃｏｒｅ。　

擎还能够将工作重新分配至ＳＭ阵列。　

在ＧＦ１　１０／１００中，每个ＳＰ都有全流水线化的整数算　

术逻辑单元（ＡＬＵ）和浮点单元（ＦＰＵ）。ＡＬＵ支持６４ｂｉｔ　

和扩展指令，支持算术、ｓｈｉｆｔ（位移）、Ｂｏｏｌｅａｎ（布尔）、　

ｃｏｍｐａｒｉｓｉｏｎ（比较）以及ｍｏｖｅ（数据传输或者赋值）。　

虽然ＧＦｌｌ０的ＳＭ数量从ＧＴ２００的３０个下降为１６个，但ＳＰ　

总数却达到了５ｌ２个（ＧＴ２００为３０Ｘ　８＝２４０个），实际的　

单周期理论性能则提升了近ｌ倍甚至更多（例如双精度浮　

点运算）。另外，ＧＦｌｌＯ的一个ＳＰ每个周期可以实现一个　

Ｔｈｒｅａｄ的一条浮点指令或者整数指令。　

不同以往的纹理单元设计　

在ＧＦ１　１０／１００中，每个ＳＭ配备了四个纹理单元，共计　

６４个纹理单元。和上一代ＧＴ２００以及竞争对手Ｃｙｐｒｅｓｓ动　

①ＧＦ１１０／ＧＦ１００＇￣＂包含７四个ＧＰＣ，每一个ＧＰＣ甚至可以独立运行。　

辄８０个纹理单元相比，ＧＦ１　１０／１００的纹理单元数量不但没　

有提升，反而下降。这是为什么昵？　

事实上，在ＧＴ２００架构中，最多三个ＳＭ共享一个纹　

ＧＦｌ１０／１００具备四　

组ＧＰＣ，一个ＧＰＣ由四　

组Ｓ　Ｍ阵列组成，共计　

Ｉ　２　８个流处理器、四个　

ＰｏｌｙＭｏｒｐｈ　Ｅｎｇｉｎｅ多形　

理引擎，该纹理引擎包括八个纹理定址单元和过滤单元。　

而Ｇ９２￣ｑ是两个ＳＭ共享一个纹理引擎。但ＮＶＩＤＩＡ认为　

单纯地添加纹理单元的数量并不能有效提升ＧＰＵ的纹理　

贴图能力，甚至造成部分单元闲置浪费。因此在ＧＦ１００中，　

ＮＶＩＤＩＡ通过将纹理单元移植到ＳＭ中的设计来提升纹　

理单元的使用效率和时钟频率一一每个ＳＭ都配备了四个　

专属的纹理单元和一个１２ＫＢ的纹理高速缓存。一个纹理　

单元在一个时钟周期内能够计算一个纹理地址并获取四　

个纹理采样，可以支持包括双线性、三线性在内的各向异　

性过滤模式。总的来看，ＧＦ１　１０／１００打破了之前将纹理单　

体引擎、ｌ６个ＳＦＵ单元。　

其中，每一组ＳＭ阵列具　

备３２个流处理器、一个　

ＰｏｌｙＭｏｒｐｈ　Ｅｎｇｉｎｅ多形　

体引擎、１６个Ｌｏａｄ／Ｓｔｏｒｅ　

单元、四个ＳＦＵ单元和　

纹理单元、两个ＷａｒｐＮ　

度器和指令发送器、能　

配置为４　８ＫＢ　Ｓｈａｒｅｄ　

Ｍｅｍｏｒｖ＋ｌ６ＫＢ　Ｌｌ缓　

元设计在ＳＭ阵列之外的做法，将纹理单元整合在ＳＭ阵　

列里面，在一定程度上提升了纹理单元的效率。　

存或者ｌ　６ＫＢ　Ｓｈ　ａ　ｒｅｄ　

Ｍｅｍｏｒｙ＋４８ＫＢ　Ｌｌ缓存　

的共享内存／Ｌ１缓存。　

创新的Ｓｈａｒｅｄ　Ｍｅｍｏｒｙ￣ｆｌＬ１／Ｌ２缓存　

在ＧＦ１　１０／１００中，每个ＳＭ阵列里面拥有一个容量很　

小的内存空间，￣ＰＳｈａｒｅｄ　Ｍｅｍｏｒｙ，可以用于数据交换，　

程序员可以方便自由使用。有了Ｓｈａｒｅｄ　Ｍｅｍｏｒｙ￣，同一　

在Ｃ　Ｕ　Ｄ　Ａ的概念　

里，ＣＵＤＡ　Ｃｏｒｅ或者ＳＰ　

④和ＧＦ１００一样，ＧＦＩ　ｊ０的一纽ｓＭ　

阵列由３２个流处理器组成。　

个Ｔｈｒｅａｄ　ｂｌｏｃｋ内的线程可以共享数据，极大地提升了　

ＮＶＩＤＩＡ　ＧＰＵ在进行ＧＰＵ　Ｃｏｍｐｕｔｉｎｇ应用时的效率。　

虽然Ｓｈａｒｅｄ　Ｍｅｍｏｒｙ对许多计算都有帮助，但它并　

（Ｓｔｒｅａｍｉｎｇ　Ｐｒｏｃｅｓｓｏｒ　

内核。简称“ＳＰ”）指的就　

Ｍｃ评测室］ｎ　ｓｔ　

不适用于所有的问题。最佳化的内存层次架构方案就是　

同时提供Ｓｈａｒｅｄ　Ｍｅｍｏｒｙ和Ｃａｃｈｅ，ＧＦｌ　１０／１００就采用　

可以显著提升我们的游戏体验。但曲面细分会将特定帧　

中的三角形密度增加数十倍，给光栅化等串行化运算单元　

带来很大的压力，因此对图形流水线的优化就迫在眉睫。　

而ＧｅＦｏｒｃｅ　ＧＴＸ　４８０所采用的ＧＦ１００图形架构就是专为　

了这样的设计。在Ｇ８０和ＧＴ２００中，每个ＳＭ都有１６ＫＢ的　

Ｓｈａｒｅｄ　Ｍｅｍｏｒｙ。而在ＧＦｌ　１０／１００中，每个ＳＭ拥有６４ＫＢ　

的Ｓｈａｒｅｄ　Ｍｅｍｏｒｙ，能配置为４８ＫＢ　Ｓｈａｒｅｄ　Ｍｅｍｏｒｙ＋　

ｌ６ＫＢ　Ｌ１　Ｃａｃｈｅ或者１６ＫＢ　Ｓｈａｒｅｄ　Ｍｅｍｏｒｙ＋４８ＫＢ　Ｌｌ　

ＤｉｒｅｃｔＸ　ｌ１而设计，具备１５个ＰｏｌｙＭｏｒｐｈ　Ｅｎｇｉｎｅ（多形体　

引擎，又称之为曲面细分单元）和四个Ｒａｓｔｅｒ　Ｅｎｇｉｎｅ（光　

Ｃａｃｈｅ的模式（Ｇ８Ｏ和ＧＴ２００不具备Ｌ１／Ｌ２　Ｃａｃｈｅ）。程　

序员可以自己编写一段小的程序，把Ｓｈａｒｅｄ　Ｍｅｍｏｒｙ当　

栅化引擎），因此在引入曲面细分设计的ＤｉｒｅｃｔＸ　ｌｌ游戏　

中将会获得更大的优势（曲面细分设计越复杂，其优势会　

越明显）。而ＧｅＦｏｒｃｅ　ＧＴＸ　５８０采用的ＧＦ１１０核心，则具　

备完整的ｌ６个ＰｏｌｙＭｏｒｐｈ　Ｅｎｇｉｎｅ，在ＤｉｒｅｃｔＸ　ｌ１游戏的　

应用中会更加优秀。　

成Ｃａｃｈｅ来使用，由软件负责实现数据的读写和一致性管　

理。而对那些不具备上述程序的应用程序来说，也可以直　

接自动从Ｌ１　Ｃａｃｈｅ中受益，显著缩减运行ＣＵＤＡ程序的　

时间。过去，ＧＰＵ的寄存器如果发生溢出的话，会大幅度　

地增加存取时延。有了ＬＩ　Ｃａｃｈｅ以后，即使临时寄存器使　

用量增加，程序的性能表现也不至于大起大落。　

具体来说，ＧｅＦｏｒｃｅ　ＧＴＸ　５８０的每个ＳＭ阵列里面具　

备可扩展的ＰｏｌｙＭｏｒｐｈ　Ｅｎｇｉｎｅ，共计１６个，可以实现较　

高的三角形速率。每个ＰｏｌｙＭｏｒｐｈ　Ｅｎｇｉｎｅ均拥有专属的　

顶点获取单元以及Ｔｅｓｓｅｌｌａｔｏｒ，极大地提升了几何性能。　

另外，ＧＦｌ１０／ｌ００还提供了７６８ＫＢ的一体化Ｌ２　

Ｃａｃｈｅ，Ｌ２　Ｃａｃｈｅ为所有的Ｌｏａｄ／Ｓｔｏｒｅ以及纹理请求提　

供高速缓存。对所有的ＳＭ阵列来说，Ｌ２　Ｃａｃｈｅ上的数据　

与之呼应的则是分别常驻于四个ＧＰＣ里面的四个并行的　

Ｒａｓｔｅｒ　Ｅｎｇｉｎｅ，它们能够在每个时钟周期内设置最多四　

个三角形，并且在三角形Ｆｅｔｃｈ、Ｔｅｓｓｅｌｌａｔｉｏｎ以及光栅化　

都是连贯一致的，从Ｌ２　Ｃａｃｈｅ上读取到的数据就是最新　

的数据。有了Ｌ２　Ｃａｃｈｅ后，就能实现ＧＰＵ高效横跨数据　

共享。对于那些无法预知数据地址的算法，例如物理解算　

器、光线追踪以及稀疏矩阵乘法都可以从ＧＦ１１０／１００的内　

存层次设计中显著获益。而对于需要多个ＳＭ读取相同数　

据的滤镜以及卷积核（ｃｏｎｖｏｌｕｔｉｏｎ　ｋｅｒｎｅ１）等算法同样能　

因为这个设计而获益　

操作方面具备很强的性能。　

这种专为ＤｉｒｅｃｔＸ　ｌ１而设计的图形架构与ＡＭＤ最　

新的Ｂａｒｔｓ图形架构有很大的区别。Ｂａｎｓ是在Ｃｙｐｒｅｓｓ基　

础上演变而来，仍然只具备１个曲面细分单元Ｔｅｓｓｌｌａｔｏｒ　

Ｇｅｎ７。而Ｂａｒｔｓ相对于Ｃｙｐｒｅｓｓ，曲面细分性能有所提升　

的原因并不是因为增加了曲面细分单元的数量，而是来源　

于线程分配模块的增强。不过这只能治标，却无法治本。　

因此在高负荷曲面细分计算环境下，Ｂａｒｔｓ的曲面细分性　

能会大幅下降，此时即使拥有增强的线程分配模块设计也　

起不了太大的作用，因为主要的瓶颈在曲面细分单元的数　

量和效率上。　

改进的ＲＯＰ单元　

在ＧＦ１　１０／１００上，ＮＶＩＤＩＡ对ＲＯＰ单元进行了全新设　

计，大幅提升了数据吞吐量与效率。ＧＦ１　１０／１００包含六个　

ＲｏＰ分区，一个Ｒ０Ｐ分区包括了／　ＲｏＰ单元，共计４８个　

ＲＯＰ单元（ＧＴ２００具备八个ＲＯＰ分区，并与八个　

６４ｂｉｔ的显存控制器绑定，一个Ｒ０Ｐ分区包含四个　

ＲｏＰ单元。）。一个Ｉ　Ｐ单元能够在一个时钟周期　

内输出一个３２ｂｉｔ整数像素。理论上，由于Ｒ０Ｐ的　

压缩效率和Ｒ０Ｐ单元数量的提升，ＧＦｌ　１０在８ｘ抗　

锯齿下的性能会得到明显改善。　

此外，得益于更多的原子操作单元以及Ｌ２缓　

①Ｂａｒｔｓ仍然只有一个曲面细分单元，但增加７ｕｌｔｒａ．Ｔｈｒｅａｄｅｄ　Ｄｉｓｐａｔｃｈ　Ｐｒｏｃｅｓｓ０ｒ的数　

存，ＧＦｌｌ０的原子内存操作性能相对以往的架构来　

量，一定程度提升７曲面细分的性能。

说得到了巨大的提升。对同—地址的原子内存操作，ＧＦｌ１Ｏ　

当然，由于曲面细分很耗费ＧＰＵ资源，现在游戏厂商　

在使用这项技术时相对比较谨慎。最初的一些ＤｉｒｅｃｔＸ　ｌ１　

游戏基本没有或者加入了很少的曲面细分技术，因为当时　

显卡的曲面细分性能并不算强。而现在随着显卡　面细分　

性能的增强，一些ＤｉｒｅｃｔＸ　ｌ１游戏会加入更多的曲面细分　

技术，ＧＦｌｌ０的曲面细分优势会进一步体现出来。　

的运算速度是ＧＴ２００的２０倍，而对相邻内存区域的操作则　

达￣Ｊ７．５倍。　

完整的曲面细分单元设计　

我们知道，曲面细分作为ＤｉｒｅｃＸ　１】中的重要技术，　

ＧｅＦｏｒｃｅ　ＧＴＸ　５８０内部赏析　

上文我们说过，相Ｉ：ＬＧｅＦｏｒｃｅ　ＧＴＸ　４８０，ＧｅＦｏｒｃｅ　

ＧＴＸ　５８０在散热设计和功耗控制方面有诸多改进，下　

面我们就来看看这些设计和改进究竟是哪些？ＧｅＦｏｒｃｅ　

ＧＴＸ　５８０使用了６相核心、２相晁存供电的设计，其中每相　

核心搭配了３个ＳＯ．８封装形式的ＭＯＳＦＥＴ，每相核心搭　

配２个ＳＯ．８封装形式的ＭＯＳＦＥＴ，全部使用贴片电感。而　

且相比ＧｅＦｏｒｃｅ　ＧＴＸ　４８０，ＧｅＦｏｒｃｅ　ＧＴＸ　５８０的接口全　

部经过了屏蔽处理，抗干扰效果更佳。　

Ｍｃ评测室］　融　

的画面，可以深度考查显卡的Ｔｅｓｓｅｌｌａｔｉｏｎ性能。我们将　

选取“ＤｉｒｅｃｔＸ　１　ｌ＋Ｓｈａｄｅｒ（Ｈｉｇｈ）＋Ｔｅｓｓｅｌｌａｔｉｏｎ（Ｅｘｔｒｅ　

ｍｅ）”模式进行测试，这表示显卡运行在最高画质、极致　

Ｔｅｓｓｅｌｌａｔｉｏｎ等级的ＤｉｒｅｃｔＸ　ｌｌ模式下。此外，我们还将重　

点考察ＧＦ１００系列的抗锯齿性能。　

ＣＰＵ：ＡＭＤ　Ｐｈｅｎｏｍ　ｌＩ　Ｘ６　１０９０Ｔ　

主板：华硕ＣＲ０ＳＳＨＡＩＲ　ＩＶ　ＥＸＴＲＥＭＥ　

（Ｄ　ＧｅＦｏｒｃｅ　ＧＴＸ　５８０不再采用传统的搭配热管的散热设计，而是使用了真空　

腔均热板（Ｖａｐｏｒ　Ｃｈａｍｂｅｒ）技术　事实上，它和热管的散热原理是相似的，　

都是利用毛细和真空原理，通过液体的蒸发和冷凝来来迟到导热的目的　所　

不同的是，热管在进行导热时，工作方向相对是固定的．只能单向进行导热，　

而均热板底座的工作方向是发散的，即可以向四周进行导热。显然．腔均热　

板底座的导热效率会更高，可以更快地导热，将ＧＰＵ热量传递到散热靖　并　

最终通过风扇将热量排除。　

内存：金邦ＤＤＲ３　１６００　２ＧＢ×２　

电源：航嘉Ｘ７　９００Ｗ　

系统：Ｗｉｎｄｏｗｓ　７旗舰版　

ＧｅＦｏｒｃｅ　ＧＴ×５８０　Ｖｓ　ＧｅＦｏｒ￣ｅ　Ｇ下Ｘ　４８０　

频率、流处理器数量、纹理单元数量等规格的提升　

著提升了ＧｅＦｏｒｃｅ　ＧＴＸ　５８０的性能，特别是在ＤｉｒｅｃｔＸ　

ｌ１游戏中，这种性能增益幅度很明显。例如在　潜行者：　

普里皮亚季》、　地铁２０３３））、　异形大战铁血战士》，　

ＧｅＦｏｒｃｅ　ＧＴＸ　５８０的领先幅度分别达到了ｌ５％、２０％　

和１９％，这部分游戏应用了较大幅度的曲面细分技术，　

①显存供电部分使用ＡＰＮ７Ｏ８８芯片　

①核１　供电部分使用ＹＣＨＩＬ８２６６芯片　

“主于ＰＣＢ背面），可以控制两相供电。　

（位于ＰＣＢ背面），可以控制６相供电。　

ＧｅＦｏｒｃｅ　ＧＴＸ　５８０的规格提升使其获得了非常明显的性　

能提升。　

ＧｅＦｏｒｃｅ　ＧＴＸ　５８０性能测试　

接下来我们将进入精彩的性能测试部分，你将了解到　

ＧｅＦｏｒｃｅ　ＧＴＸ　５８０真实的３Ｄ、曲面细分、ＰｈｙｓＸ方面的　

性能和功耗温度方面的表现，以及它和ＡＭＤ　Ｃｙｐｒｅｓｓ、　

而在抗锯齿性能提升方面，ＧｅＦｏｒｃｅ　ＧＴＸ　５８０亦有　

不错的表现，例如在　潜行者：普里皮亚季》中，ＧｅＦｏｒｃｅ　

ＧＴＸ　５８０在开启了四倍抗锯齿以后，性能下降幅度为　

２８％，而ＧｅＦｏｒｃｅ　ＧＴＸ　４８０为３３％；在（（战地：叛逆连队　

２》，ＧｅＦｏｒｃｅ　ＧＴＸ　５８０在开启了四倍抗锯齿以后，性能　

Ｂａｒｔｓ之间的对比。我们将组建基于ＡＭＤ　ＰｈｅｎｏｍⅡＸ６　

下降幅度为３％，而ＧｅＦｏｒｃｅ　ＧＴＸ　４８０为８％；在《孤岛危　

机　，ＧｅＦｏｒｃｅ　ＧＴＸ　５８０在开启了四倍抗锯齿以后，性能　

下降幅度为５％，而ＧｅＦｏｒｃｅ　ＧＴＸ　４８０为ｌ１％。出现这种　

１０９０Ｔ的顶级游戏平台进行测试，告诉你最详细和真实的　

的测试结果。　

在ＤｉｒｅｃｔＸ　１ｏ／１０．１游戏和软件测试方面，我们会选取　

《３ＤＭａｒｋ　Ｖａｎｔａｇｅ））、《孤岛惊魂２　、　孤岛危机　等主　

流的ＤｉｒｅｃｔＸ　１０／１０．１的游戏和软件对ＧＦ１　１０的ＤｉｒｅｃｔＸ　

１０／１０．１性能进行测试。而对于大家最关注的ＤｉｒｅｃｔＸ　ｌ１　

游戏性能，我们将选取　地铁２０３３））、　异形大战铁血战　

士》、　鹰击长空２》等多款ＤｉｒｅｃｔＸ　ｌｌ游戏和软件重点考　

查ＧＦ１　１０在ＤｉｒｅｃｔＸ　ｌ１游戏和软件中的性能，看看它的　

情况是因为ＧｅＦｏｒｃｅ　ＧＴＸ　５８０的频率等规格提升，也一定　

程度提升了它的抗锯齿性能。　

ＧｅＦｏｒｃｅ　ＧＴＸ　５８０　Ｖｓ．Ｒａｄｅｏｎ　ＨＤ　５８７０　

在之前ＧｅＦｏｒｃｅ　ＧＴＸ　４８０的评测中，ＧｅＦｏｒｃｅ　ＧＴＸ　

４８０凭借更出色图形架构在综合性能方面超出Ｒａｄｅｏｎ　

ＨＤ　５８７０不少，而现在规格更强悍的ＧｅＦｏｒｃｅ　ＧＴＸ　

ＤｉｒｅｃｔＸ　Ｉｌ执行效率究竟有无明显提升？当然，所有游戏　

都运行在最高画质—　

ＧＦｌｌ０在图形架构上专为ＤｉｒｅｃｔＸ　ｌ１做了优化，我们　

将通过￣Ｕｎｉｇｉｎｅ　Ｈｅａｖｅｎ　Ｂｅｎｃｈｍａｒｋ））这款ＤｉｒｅｃｔＸ　１　１　

５８０￣Ｊ进一步将这种优势提高，实现了全面的超越。在　

ＤｉｒｅｃｔＸ　ｌｌ游戏测试中，ＧｅＦｏｒｃｅ　ＧＴＸ　５８０凭借专为　

ＤｉｒｅｃｔＸ　ｌ１优化的ＧＦｌｌＯ图形架构，整体领先幅度在　

ｌＯ％－１０９％。例如在　战地：叛逆连队２》、（（地铁２０３３））、　

软件来重点验证它的曲面细分性能。（（Ｕｎｉｇｉｎｅ　Ｈｅａｖｅｎ　

Ｂｅｎｃｈｍａｒｋ））的测试场景中包含了大量基于Ｔｅｓｓｅｌｌａｔｉｏｎ　

失落的星球２》、（《异形大战铁血战士》、《潜行者：普　

里皮亚季》和　鹰击长空２》等ＤｉｒｅｃｔＸ　ｌ１游戏测试中，　

ＧｅＦｏｒｃｅ　ＧＴＸ　５８０的领先幅度分别达到了１０％、５７％、　

８０％、ｌ７％、３０％和９１％，领先幅度非常巨大，这再次验证　

了ＧｅＦｏｒｃｅ　ＧＴＸ　５８０在新游戏中的优势。　

在ＤｉｒｅｃｔＸ　１０游戏中，ＧｅＦｏｒｃｅ　ＧＴＸ　５８０和Ｒａｄｅｏｎ　

５８０的最大系统功耗，有一些遗憾。截至发稿前，有消息　

指出可以通过特别版的ＧＰＵ—Ｚ＋ＦｕｒＭａｒｋ软件检测出　

ＧｅＦｏｒｃｅ　ＧＴＸ　５８０的最大系统功耗，但这种测试方法可　

能会ＸＣＧｅＦｏｒｃｅ　ＧＴＸ　５８０造成硬件损伤。针对这个问题，　

ＨＤ　５８７０的差距被缩小，例如在《孤岛危机》和　孤岛惊　

魂２》游戏中，ＧｅＦｏｒｃｅ　ＧＴＸ　５８０的领先幅度分别为６％和　

ｌ２％。这是因为这部分老游戏比较强调纹理贴图的性能，　

比如　孤岛危机　，而Ｒａｄｅｏｎ　ＨＤ　５８７０由于具备８０个纹　

理单元，在纹理渲染方面仍有不错的表现。　

在（（Ｕｎｉｇｉｎｅ　Ｈｅａｖｅｎ　Ｂｅｎｃｈｍａｒｋ￣的曲面细分测试　

中，ＧｅＦｏｒｃｅ　ＧＴＸ　５８０凭借ｌ６个专属的曲面细分单元，在　

本刊也将持续予以关注。　

ＧｅＦｏｒｃｅ　ＧＴＸ　５８０：单核心王者毋庸　

置疑　

就在我们一直猜测完整规格的ＧＦ１００产品何时出现　

时，ＮＶＩＤＩＡ很低调地发布了ＧｅＦｏｒｃｅ　ＧＴＸ　５８０。从实际　

测试来看，ＧｅＦｏｒｃｅ　ＧＴＸ　５８０非常好地巩固了单核心王　

者的地位，不仅相对ＧｅＦｏｒｃｅ　ＧＴＸ　４８０有ｌ　５％左右的性　

“ＤｉｒｅｃｔＸ　１　ｌ＋Ｓｈａｄｅｒ（Ｈｉｇｈ）＋Ｔｅｓｓｅｌｌａｔｉｏｎ（Ｅｘｔｒｅｍｅ１”　

模式下领先Ｒａｄｅｏｎ　ＨＤ　５８７０达到了１０９％，令人刮目相　

能提升，更是全面超越Ｒａｄｅｏｎ　ＨＤ　５８７０，单核心王者的　

地位毋庸置疑。　

从ＧｅＦｏｒｃｅ　ＧＴＸ　５８０的图形架构来说，它和ＧｅＦｏｒｃｅ　

看。而最新的ＤｉｒｅｃｔＸ　１　１大作（（鹰击长空２》也加入了曲面　

细分技术，ＧｅＦｏｒｃｅ　ＧＴＸ　５８０在该游戏中的领先幅度也　

高达９１％。　

ＧＴＸ　４８０没有本质区别，甚至你可以认为他们是一样的：　

专为ＤｉｒｅｃｔＸ　ｌｌ设计的图形架构、强悍的曲面细分性能、　

出色的反锯齿性能和优秀的综合表现。　

但ＧｅＦｏｒｃｅ　ＧＴＸ　５８０还是有那么一些值得我们思　

功耗和温度表现　

ＮＶＩＤＩＡ在ＧｅＦｏｒｃｅ　ＧＴＸ　５８０上做出了限制最大功　

耗和改进散热的设计，这的确有效地控制了它的功耗和发　

热量。在这种情况下，ＧｅＦｏｒｃｅ　ＧＴＸ　５８０的待机温度和满　

载温度分别只有３８＂Ｃ和７９＂Ｃ左右，待机系统功耗和满载系　

统功耗分别为ｌ　ｌ０Ｗ和３２３Ｗ，相比ＧｅＦｏｒｃｅ　ＧＴＸ　４８０有　

明显的下降。　

考和注意的设计．它并不是简单的ＧＦ１００完整规格版本，　

它通过改进工艺和优化晶体管的效率使显卡的效率得到　

提升，更高的频率使其拥有更强的性能，每秒能处理２０　

亿个三角形便是例证。改进的散热设计解决了一直困扰　

ＧｅＦｏｒｃｅ　ＧＴＸ　４８０的散热问题。而这些设计和改进都是　

这种设计的确可以在很大程度上控制ＧｅＦｏｒｃｅ　ＧＴＸ　

５８０的功耗，毕竟在实际游戏中是很难达到软件测试的最　

大功耗。但另一方面，我们却无法检测出ＧｅＦｏｒｃｅ　ＧＴＸ　

在完善ＧｅＦｏｒｃｅ　ＧＴＸ　４８０的不足，目的是将ＧＦＩ　１０／１００架　

构的最大性能发挥出来。从这个意义来说，ＧｅＦｏｒｃｅ　ＧＴＸ　

５８０是ＧｅＦｏｒｃｅ　ＧＴＸ　４８０的完善和更强的版本。类似这种　

ｒ首批上市的ＧｅＦｏｒｃｅ　ＧＴＸ　５８０显卡　●　

：Ｉ●Ｉ　ｊ删

核心频率：７７２ＭＨｚ　

显存频率：４００８ＭＨｚ　

核心频率：７７２ＭＨｚ　

流处理器频率：１５４４ＭＨｚ　参考价格：３９９９元　

流处理器频率：蠢　詈　。　１洲　５４４ＭＨｚ　参考价格．爹考价格：　３９９９元兀　

在上一代产　

品上进行小　

不过不同的是，在大量的测试中，ＡＭＤ沿用多年的　

４Ｄ＋ｌＤ架构已经开始露出疲态，暴力添ＪＪ［ＩＳＰＵ的做法已　

经遇到了瓶颈，架构的潜力被消耗殆尽。特别是其较差的　幅提升和更　

改的设计和　

近年来ＡＭＤ　

曲面细分性能在今后大量运用曲面细分的游戏中会更加　

捉襟见肘，因此ＡＭＤ在下一代产品中很可能会全面更换　

图形架构。而ＮＶＩＤＩＡ这边，凭借新一代ＧＦＩ　１０／１００图形　

架构，可以在未来走得更远，因此其未来的产品很有可能　

仍然是基于ＧＦ１１０／１００而设计，并逐步完善。　

另据已知的消息来看，ＮＶＩＤＩＡ在接下来的时间内将　

陆续发布ＧｅＦｏｒｃｅ　ＧＴＸ　５７０／５６０，以完善整个ＧｅＦｏｒｃｅ　

的做法比较　

类似，就好　

比Ｂａｒｔｓ是在　

ＣＹＰｒｅｓｓ基　

础上进行小　

幅修改是一　

个道理。这　

④ＧｅＦｏｒｃｅＧＴＸ　５８０在待机状态下会自劝降频　

ＧＴＸ　５００系列产品线。据称，ＧｅＦｏｒｃｅ　ＧＴＸ　５７０的发布　

时间是今年１２月初，而ＧｅＦｏｒｃｅ　ＧＴＸ　５６０￣１］可能要等到　

种没计可以　

明年第一季度上市，相信届时的ＤｉｒｅｃｔＸ　ＩＩ市场又会有一　

让新产品快速推出市场，获得更多的市场关注。　

表２：ＧｅＦｏｒｃｅ　ＧＴＸ　５８０与主流高端产品的的测试成绩对比　

ＧＴＸ　５８０　ＧＴＸ４８０　

番恶斗。口　

ＧＴＸ　４７０　ＨＤ　５８７０　ＨＤ　５８５０　ＨＤ　６８７０　ＨＤ　６８５０　　ｌ

ＧＰＵ　ＳＣＣＩＲＥ　；１２４３４　

９４９４　７４９７　８６１７　６９１６　７３４１　５８０５　

麓　黼躐　　Ｉ

１９２０Ｘ１０８０　ＰｈｙｓＸ　ＯＮ　

１９２０ｘ１０８０　ＰｈｙｓＸ　ＯＦＦ　

１９２０×１０８０　

　ｌ３０　

｝５８　

４０　

１ｏ　

５８　

３８　

５７　

３１　

５８　

３９　

５７　

３４　

｛５８　

３６　

　５６　Ｉ

３０　

豳翻麟嘲豳鞠　

１９２０×１０８０　８ＡＡ　８０　６８　６５　５９　６３　５５　

１９２０ｘ１０８０　８ＡＡ　１２４　１１９　１１４　６３　５５　

６３　

黧嘲嘲

１９２０ｘ１０８０＋ＤｉｒｅｃｔＸ　１１＋Ｓｈａｄｅｒ（Ｈｉｇｈ）　

＋Ｔｅｓｓｅｌｌａｔｉｏｎ（Ｅｘｔｒｅｍ８）　

４５．８　３９．１　３４．２　２２．３　１８．８　２４　２１．１　

盼黼Ｉ　Ｉｌ爨畿酾盼０　０－　

１９２０×１０８０　

瀚雕

７８　７１　６８　：５６　５９　４７　

激落　瓿　

１９２０ｘ１０８０　

薯《　

１　７　６４　

６８　

麓圈圈隔　

｝７７　６３　６７　５６　

１９２０Ｘ１０８０　４ＡＡ　

≥　

１９２０Ｘ１０８０　４ＡＦ　

１９２０×１０８０　４ＡＡ　４ＡＦ　

曩霎　銎　

！　

３０　

７４　

蕊　

５３　

｛１８　　１２　ｆ

鋈　翌　５４　

　１７　ｌ

４８　蕊

２２　

１６　

！　

｛２５　２１　

姆　蜘ｂ瞬　－．一茗　

１９２０×１０８０　

墨瑟翌　

６３　

互曩

４９．１　

要要墨

４１　

至至ｌ

　３７　ｊ

　霪

：３２　

＝一

３７　

隧黼豳豳　

：　

３１　

１９２０Ｘ１０８０　４ＡＡ　

运　鳓濑蚓　

１９２０ｘ１２００　

警麓　

６１　５２　４３　

１０９Ｗ　

２９６Ｗ　

：４４　

１０４Ｗ　

３５　

１０４Ｗ　

２４９Ｗ　

待机系统功耗　

满载系统功耗　

１１ＯＷ　

３２３Ｗ　

１　

４４０Ｗ　３６８Ｗ　

１１０Ｗ　

３０４Ｗ　

２８８Ｗ　

９２　

2024年10月12日发(作者：税怡乐)

ＧｅＦｏｒｃｅ　ＧＴＸ　５８０：弥￣Ｉ＇ＴＧＴＸ　４８０　

『勺缺失，打造完美Ｆｅｒｍｉ　

ＧｅＦｏｒｃｅ　ＧＴＸ　５８０和ＧｅＦｏｒｃｅ　ＧＴＸ　４８０是一脉相承　

前最强的Ｔｅｓｓｅｌｌａｔｉｏｎ曲面细分性能。它改进了ＲＯＰ单　

的效率，提升了抗锯齿的性能。它大幅度提升了双精度一　

算性能，其双精度计算性能甚至达到了单精度计算性能ｌ　

１／２。此外，它还集成了一级高速缓存和二级缓存，大幅Ｊ　

９，要了解ＧｅＦｏｒｃｅ　ＧＴＸ　５８０。我们先对ＧｅＦｏｒｃｅ　ＧＴＸ　

８０进行一次回顾。　

２０１０上半年，ＮＶＩＤＩＡ在众人翘首以盼的目光下终　

提升了ＣＵＤＡ应用程序的性能，甚至还可以运行为其编：　

的Ｃ＋＋程序。　

＝推出了基于ＤｉｒｅｃｔＸ　Ｉ１的ＧｅＦｏｒｃｅ　ＧＴＸ　４８０，这款称　

上划时代的显卡。ＮＶＩＤＩＡ这一代ＤｉｒｅｃｔＸ　ｌ１显卡的　

℃号为我们熟知的Ｆｅｒｍｉ，而ＧｅＦｏｒｃｅ　ＧＴＸ　４８０的核心　

ＧｅＦｏｒｃｅ　ＧＴＸ　４８０的综合性能在单核心显卡中是］　

强的，设计也是最超前的，受到了业界的赞许。但它并不：　

美，首先是因为良率和功耗的问题，它并没有开启全部５】　

个流处理器（ＧＦＩＯ０核心的完整规格），而是仅仅打开　

４８０个流处理器，屏蔽了－一组即３２个流处理器。此外，由＝　

它的图形设计非常复杂，晶体管数量达到了３０亿个，再）　

上其存在核心漏电的问题，因此其功耗和发热量很高。　

Ｅ号则为ＧＦＩＯ０。就这款产品的架构设计而言，ＧｅＦｏｒｃｅ　

｝ＴＸ　４８０堪称有史以来图形架构设计最复杂、改进最多　

ＥＩＤｉｒｅｃｔＸ　ｌ１性能最强的显卡。　

ＧｅＦｏｒｃｅ　ＧＴＸ　４８０拥有多达ｌ５个多形体引擎，具备目　

Ｍｃ评测室］ＩＭＣ评测室　＿鼍　－ｉｂｓｔ　

・　

在运行特别是满载状态时，噪音很大。这些都是ＧｅＦｏｒｃｅ　

ＧＴＸ　４８０显卡的不足之处，也是ＮＶＩＤＩＡ在后续产品中着　

力改善的地方。　

此外，ＧｅＦｏｒｃｅ　ＧＴＸ　５８０还优化了晶圆的使用率和　

ＰＣＢ走线等，带来的直接好处就是提升了它的使用效率。　

根据ＮＶＩＤＩＡ给出的数据，在相同频率、相同规格（ＳＰ、　

纹理等数量保持一致）的情况下，ＧｅＦｏｒｃｅ　ＧＴＸ　５８０的性　

ＧｅＦｏｒｃｅ　ＧＴＸ　５８０：我不是“马甲”　

现在，你大致能推测出ＧｅＦｏｒｃｅ　ＧＴＸ　５８０的一些特　

点了吧。是的，它弥补了ＧｅＦｏｒｃｅ　ＧＴＸ　４８０显卡的最大　

遗憾一具备了完整的５１２个流处理器。可能有一些用户　

能要超出ＧｅＦｏｒｃｅ　ＧＴＸ　４８０　１０％左右。　

下面，我们一起来看看ＧｅＦｏｒｃｅ　ＧＴＸ　５８０的主要　

规格。它的核心代号为ＧＦｌｌ０，每秒能处理２０４Ｌ个三角　

形，具备３０亿个晶体管、４个ＧＰＣ、５１２个流处理器、６４　

会觉得ＧｅＦｏｒｃｅ　ＧＴＸ　５８０就是５１２ＳＰ版本的ＧｅＦｏｒｃｅ　

ＧＴＸ　４８０显卡，不能说不正确，但至少不完全正确，因为　

ＮＶＩＤＩＡ在ＧｅＦｏｒｃｅ　ＧＴＸ　５８０上做了一系列的改进。一则　

个纹理单元和４８个光栅单元，最大浮点计算能力为２．３７　

ＴＦＬＯＰｓ。其核心频率、显存频率和流处理器频率分别　

为７７２ＭＨｚ、４００８ＭＨｚ和ｌ５４４ＭＨｚ。它的显存规格为　

１．５ＧＢ／ＧＤＤＲ５／３８４．ｂｉｔ。根据ＮＶＩＤＩＡ给出的数据，　

是针对功耗和发热量的改进，之前　

Ｇ　ｅ　Ｆ　Ｏ　ｒ　ｃ　ｅ　

ＧｅＦｏｒｃｅ　ＧＴＸ　５８０显卡的最大功耗为２４４Ｗ，甚至比　

ＧＴＸ　４８０存在核　

心漏电的问题，导　

致ＧｅＦｏｒｃｅ　ＧＴＸ　

ＧｅＦｏｒｃｅ　ＧＴＸ　４８０还低。　

ＧＦ１　１　０图形架构一览　

ＧＦｌ　ｌ　０１１　００图形架构关键词　

１．四个ＧＰＣ图形处理器集群　

４　８０的个体功耗　

差・异较大，即一　

些ＧｅＦｏｒｃｅ　ＧＴＸ　

４８０功耗较高，而　

一

２．１６组ＳＭ阵列、５１２个流处理器ＩＮＶＩＤＩＡ称其为５１２个ＣＵＤＡ核心）　

３．１６个ＰｏｌｙＭｏｒｐｈ　Ｅｎｇｉｎｅ（多形体引擎）．四个Ｒａｓｔｅｒ　Ｅｎｇｉｎｅ（光栅　

化引擎）　

４　６４个纹理单元　４８个光栅单元　

５．３８４－ｂｉｔ（６×６４．ｂｉｔ）／ＧＤＤＲ５的显存控制器　

些产品却较低。　

：在ＧｅＦｏｒｃｅ　ＧＴＸ　

５８０上，ＮＶＩＤＩＡ　

改善了核心漏电　

的问题。ＮＶＩＤＩＡ　

（Ｄ　ＧｅＦｏｒｃｅ　ＧＴＸ　５８０的ＧＰＵ－ｚ信息　

从图形架构层面来看，ＧｅＦｏｒｃｅ　ＧＴＸ　５８０和ＧｅＦｏｒｃｅ　

ＧＴＸ　４８０最大的不同是流处理器数量、纹理单元数量等规　

格差异，但两者所采用的图形架构是一致的。下面，我们将　

在ＧｅＦｏｒｃｅ　ＧＴＸ　

５８０的ＰＣＢ上设计了专门的电源监控模块，限制了该显卡　

的最大功耗（后文会详细进行说明）。针对ＧｅＦｏｒｃｅ　ＧＴＸ　

４８０温度较高和散热器噪音较大的问题，ＧｅＦｏｒｃｅ　ＧＴＸ　

５８０在散热器上做了较大的改进，使用了均腔热板技术　

（后文会详细进行说明）。　

以ＧＦ１００的图形架构为例，来进一步认识ＧＦ１１０图形架构。　

从ＧＦｌｌ０的图形架构可以看出，它主要包含了一个主接　

口（Ｈｏｓｔ　Ｉｎｔｅｒｆａｃｅ）、一个ＧｉｇａＴｈｒｅａｄ￣Ｉ擎、四个ＧＰＣ、　

六个显存控制器、六个ＲｏＰ分区和一个大小为７６８ＫＢ的Ｌ２　

高速缓存。其中，ＲＯＰ分区紧邻Ｌ２高速缓存。当ＧＰＵ通过　

表１：ＧｅＦｏｒｃｅ　ＧＴＸ　５８０．ＧｅＦｏｒｃｅ　ＧＴＸ　４００系列和Ｒａｄｅｏｎ　ＨＤ　５８００／６８００系列的规格一览　

核心代号　

匍程工艺　

晶体管数量　

流处理器单元（流　

处理算术逻辑单　

纹理单元　

光瞄单元　

显存类型　

物蝴率　

等效显存频率　

流处理器频率　

浮点预算　

显存带宽　

最大功耗　

ＧＦ１１０　

４０ｎｍ　

ＧＦ１００　

４０ｎｍ　

ＧＦ１００　

４０ｎｍ　

Ｃｙｐｒｅｓｓ　

４０ｎｍ　

Ｂａｒｔｓ　

４０ｎｍ　

３０４Ｚ　

５１２个　

６４个　

３０亿　

４８０个　

３Ｏ亿　

４４８Ｉ＂　

５６个　

２１．５亿　

２８８Ｘ５个　

１　７｛乙　

１９２×５个　

４８个　

　，

１５３６Ｍ１３／３８４　

＿ｂ诖／ＧＤＤＲ５　

７７２ＭＨｚ　

　ｊ

４０Ｉ＂　

１２８０ＭＢ『３２０　

．

ｂｉｔＩＧＤＤＲ５　

６０７ＭＨｚ　

３３４８ＭＨｚ　

１２１５ＭＨｚ　

１　６３３ＴＦＬ０Ｐｓ　

１３４Ｇ队　

２１５Ｗ　

４００８ＭＨｚ　

１５４４ＭＨｚ　

２．３７ＴＦＬＯＰｓ　

１９２．４ＧＢ／ｓ　

２４４Ｗ　

Ｈｏｓｔ　Ｉｎｔｅｒｆａｃｅ来读取ＣＰＵ指令时，ＧｉｇａＴｈｒｅａｄ￣Ｉ擎能够　

从系统内存中获取指定的数据并将其拷贝到显存中，然后　

是一个处理核心。但其实ＳＰ只是一个功能单元，真正比较　

接近于我们常说的内核则是ＳＰ的上一级单位：Ｓｔｒｅａｍｉｎｇ　

Ｍｕｌｔｉｐｒｏｃｅｓｓ０ｒ（即本文所说的“ＳＭ”）。因为目前只有　

会为各个ＳＭ阵列创建和分派线程块。单个ＳＭ阵列亦会将　

多个Ｗａｒｐ（３２个线程的群组）调度至多个流处理器以及其　

它执行单元。当图形流水线中出现工作膨胀现象时，例如　

在执行Ｔｅｓｓｅｌｌａｔｉｏｎ以及光栅化操作之后，ＧｉｇａＴｈｒｅａｄ￣ｌ　

在ＳＭ这一级才具备Ｐｒｏｇｒａｍ　Ｃｏｕｎｔｅｒ（程序计数器）、调　

度资源以及分离的寄存器堆块，即才能进行ＣＵＤＡ计算。　

在ＡＭＤ统一着色器架构的ＧＰＵ中，类似ＳＭ等级的部件　

是ＳＩＭＤ　Ｃｏｒｅ，例如ＲＶ８７０拥有２０个ＳＩＭＤ　Ｃｏｒｅ。　

擎还能够将工作重新分配至ＳＭ阵列。　

在ＧＦ１　１０／１００中，每个ＳＰ都有全流水线化的整数算　

术逻辑单元（ＡＬＵ）和浮点单元（ＦＰＵ）。ＡＬＵ支持６４ｂｉｔ　

和扩展指令，支持算术、ｓｈｉｆｔ（位移）、Ｂｏｏｌｅａｎ（布尔）、　

ｃｏｍｐａｒｉｓｉｏｎ（比较）以及ｍｏｖｅ（数据传输或者赋值）。　

虽然ＧＦｌｌ０的ＳＭ数量从ＧＴ２００的３０个下降为１６个，但ＳＰ　

总数却达到了５ｌ２个（ＧＴ２００为３０Ｘ　８＝２４０个），实际的　

单周期理论性能则提升了近ｌ倍甚至更多（例如双精度浮　

点运算）。另外，ＧＦｌｌＯ的一个ＳＰ每个周期可以实现一个　

Ｔｈｒｅａｄ的一条浮点指令或者整数指令。　

不同以往的纹理单元设计　

在ＧＦ１　１０／１００中，每个ＳＭ配备了四个纹理单元，共计　

６４个纹理单元。和上一代ＧＴ２００以及竞争对手Ｃｙｐｒｅｓｓ动　

①ＧＦ１１０／ＧＦ１００＇￣＂包含７四个ＧＰＣ，每一个ＧＰＣ甚至可以独立运行。　

辄８０个纹理单元相比，ＧＦ１　１０／１００的纹理单元数量不但没　

有提升，反而下降。这是为什么昵？　

事实上，在ＧＴ２００架构中，最多三个ＳＭ共享一个纹　

ＧＦｌ１０／１００具备四　

组ＧＰＣ，一个ＧＰＣ由四　

组Ｓ　Ｍ阵列组成，共计　

Ｉ　２　８个流处理器、四个　

ＰｏｌｙＭｏｒｐｈ　Ｅｎｇｉｎｅ多形　

理引擎，该纹理引擎包括八个纹理定址单元和过滤单元。　

而Ｇ９２￣ｑ是两个ＳＭ共享一个纹理引擎。但ＮＶＩＤＩＡ认为　

单纯地添加纹理单元的数量并不能有效提升ＧＰＵ的纹理　

贴图能力，甚至造成部分单元闲置浪费。因此在ＧＦ１００中，　

ＮＶＩＤＩＡ通过将纹理单元移植到ＳＭ中的设计来提升纹　

理单元的使用效率和时钟频率一一每个ＳＭ都配备了四个　

专属的纹理单元和一个１２ＫＢ的纹理高速缓存。一个纹理　

单元在一个时钟周期内能够计算一个纹理地址并获取四　

个纹理采样，可以支持包括双线性、三线性在内的各向异　

性过滤模式。总的来看，ＧＦ１　１０／１００打破了之前将纹理单　

体引擎、ｌ６个ＳＦＵ单元。　

其中，每一组ＳＭ阵列具　

备３２个流处理器、一个　

ＰｏｌｙＭｏｒｐｈ　Ｅｎｇｉｎｅ多形　

体引擎、１６个Ｌｏａｄ／Ｓｔｏｒｅ　

单元、四个ＳＦＵ单元和　

纹理单元、两个ＷａｒｐＮ　

度器和指令发送器、能　

配置为４　８ＫＢ　Ｓｈａｒｅｄ　

Ｍｅｍｏｒｖ＋ｌ６ＫＢ　Ｌｌ缓　

元设计在ＳＭ阵列之外的做法，将纹理单元整合在ＳＭ阵　

列里面，在一定程度上提升了纹理单元的效率。　

存或者ｌ　６ＫＢ　Ｓｈ　ａ　ｒｅｄ　

Ｍｅｍｏｒｙ＋４８ＫＢ　Ｌｌ缓存　

的共享内存／Ｌ１缓存。　

创新的Ｓｈａｒｅｄ　Ｍｅｍｏｒｙ￣ｆｌＬ１／Ｌ２缓存　

在ＧＦ１　１０／１００中，每个ＳＭ阵列里面拥有一个容量很　

小的内存空间，￣ＰＳｈａｒｅｄ　Ｍｅｍｏｒｙ，可以用于数据交换，　

程序员可以方便自由使用。有了Ｓｈａｒｅｄ　Ｍｅｍｏｒｙ￣，同一　

在Ｃ　Ｕ　Ｄ　Ａ的概念　

里，ＣＵＤＡ　Ｃｏｒｅ或者ＳＰ　

④和ＧＦ１００一样，ＧＦＩ　ｊ０的一纽ｓＭ　

阵列由３２个流处理器组成。　

个Ｔｈｒｅａｄ　ｂｌｏｃｋ内的线程可以共享数据，极大地提升了　

ＮＶＩＤＩＡ　ＧＰＵ在进行ＧＰＵ　Ｃｏｍｐｕｔｉｎｇ应用时的效率。　

虽然Ｓｈａｒｅｄ　Ｍｅｍｏｒｙ对许多计算都有帮助，但它并　

（Ｓｔｒｅａｍｉｎｇ　Ｐｒｏｃｅｓｓｏｒ　

内核。简称“ＳＰ”）指的就　

Ｍｃ评测室］ｎ　ｓｔ　

不适用于所有的问题。最佳化的内存层次架构方案就是　

同时提供Ｓｈａｒｅｄ　Ｍｅｍｏｒｙ和Ｃａｃｈｅ，ＧＦｌ　１０／１００就采用　

可以显著提升我们的游戏体验。但曲面细分会将特定帧　

中的三角形密度增加数十倍，给光栅化等串行化运算单元　

带来很大的压力，因此对图形流水线的优化就迫在眉睫。　

而ＧｅＦｏｒｃｅ　ＧＴＸ　４８０所采用的ＧＦ１００图形架构就是专为　

了这样的设计。在Ｇ８０和ＧＴ２００中，每个ＳＭ都有１６ＫＢ的　

Ｓｈａｒｅｄ　Ｍｅｍｏｒｙ。而在ＧＦｌ　１０／１００中，每个ＳＭ拥有６４ＫＢ　

的Ｓｈａｒｅｄ　Ｍｅｍｏｒｙ，能配置为４８ＫＢ　Ｓｈａｒｅｄ　Ｍｅｍｏｒｙ＋　

ｌ６ＫＢ　Ｌ１　Ｃａｃｈｅ或者１６ＫＢ　Ｓｈａｒｅｄ　Ｍｅｍｏｒｙ＋４８ＫＢ　Ｌｌ　

ＤｉｒｅｃｔＸ　ｌ１而设计，具备１５个ＰｏｌｙＭｏｒｐｈ　Ｅｎｇｉｎｅ（多形体　

引擎，又称之为曲面细分单元）和四个Ｒａｓｔｅｒ　Ｅｎｇｉｎｅ（光　

Ｃａｃｈｅ的模式（Ｇ８Ｏ和ＧＴ２００不具备Ｌ１／Ｌ２　Ｃａｃｈｅ）。程　

序员可以自己编写一段小的程序，把Ｓｈａｒｅｄ　Ｍｅｍｏｒｙ当　

栅化引擎），因此在引入曲面细分设计的ＤｉｒｅｃｔＸ　ｌｌ游戏　

中将会获得更大的优势（曲面细分设计越复杂，其优势会　

越明显）。而ＧｅＦｏｒｃｅ　ＧＴＸ　５８０采用的ＧＦ１１０核心，则具　

备完整的ｌ６个ＰｏｌｙＭｏｒｐｈ　Ｅｎｇｉｎｅ，在ＤｉｒｅｃｔＸ　ｌ１游戏的　

应用中会更加优秀。　

成Ｃａｃｈｅ来使用，由软件负责实现数据的读写和一致性管　

理。而对那些不具备上述程序的应用程序来说，也可以直　

接自动从Ｌ１　Ｃａｃｈｅ中受益，显著缩减运行ＣＵＤＡ程序的　

时间。过去，ＧＰＵ的寄存器如果发生溢出的话，会大幅度　

地增加存取时延。有了ＬＩ　Ｃａｃｈｅ以后，即使临时寄存器使　

用量增加，程序的性能表现也不至于大起大落。　

具体来说，ＧｅＦｏｒｃｅ　ＧＴＸ　５８０的每个ＳＭ阵列里面具　

备可扩展的ＰｏｌｙＭｏｒｐｈ　Ｅｎｇｉｎｅ，共计１６个，可以实现较　

高的三角形速率。每个ＰｏｌｙＭｏｒｐｈ　Ｅｎｇｉｎｅ均拥有专属的　

顶点获取单元以及Ｔｅｓｓｅｌｌａｔｏｒ，极大地提升了几何性能。　

另外，ＧＦｌ１０／ｌ００还提供了７６８ＫＢ的一体化Ｌ２　

Ｃａｃｈｅ，Ｌ２　Ｃａｃｈｅ为所有的Ｌｏａｄ／Ｓｔｏｒｅ以及纹理请求提　

供高速缓存。对所有的ＳＭ阵列来说，Ｌ２　Ｃａｃｈｅ上的数据　

与之呼应的则是分别常驻于四个ＧＰＣ里面的四个并行的　

Ｒａｓｔｅｒ　Ｅｎｇｉｎｅ，它们能够在每个时钟周期内设置最多四　

个三角形，并且在三角形Ｆｅｔｃｈ、Ｔｅｓｓｅｌｌａｔｉｏｎ以及光栅化　

都是连贯一致的，从Ｌ２　Ｃａｃｈｅ上读取到的数据就是最新　

的数据。有了Ｌ２　Ｃａｃｈｅ后，就能实现ＧＰＵ高效横跨数据　

共享。对于那些无法预知数据地址的算法，例如物理解算　

器、光线追踪以及稀疏矩阵乘法都可以从ＧＦ１１０／１００的内　

存层次设计中显著获益。而对于需要多个ＳＭ读取相同数　

据的滤镜以及卷积核（ｃｏｎｖｏｌｕｔｉｏｎ　ｋｅｒｎｅ１）等算法同样能　

因为这个设计而获益　

操作方面具备很强的性能。　

这种专为ＤｉｒｅｃｔＸ　ｌ１而设计的图形架构与ＡＭＤ最　

新的Ｂａｒｔｓ图形架构有很大的区别。Ｂａｎｓ是在Ｃｙｐｒｅｓｓ基　

础上演变而来，仍然只具备１个曲面细分单元Ｔｅｓｓｌｌａｔｏｒ　

Ｇｅｎ７。而Ｂａｒｔｓ相对于Ｃｙｐｒｅｓｓ，曲面细分性能有所提升　

的原因并不是因为增加了曲面细分单元的数量，而是来源　

于线程分配模块的增强。不过这只能治标，却无法治本。　

因此在高负荷曲面细分计算环境下，Ｂａｒｔｓ的曲面细分性　

能会大幅下降，此时即使拥有增强的线程分配模块设计也　

起不了太大的作用，因为主要的瓶颈在曲面细分单元的数　

量和效率上。　

改进的ＲＯＰ单元　

在ＧＦ１　１０／１００上，ＮＶＩＤＩＡ对ＲＯＰ单元进行了全新设　

计，大幅提升了数据吞吐量与效率。ＧＦ１　１０／１００包含六个　

ＲｏＰ分区，一个Ｒ０Ｐ分区包括了／　ＲｏＰ单元，共计４８个　

ＲＯＰ单元（ＧＴ２００具备八个ＲＯＰ分区，并与八个　

６４ｂｉｔ的显存控制器绑定，一个Ｒ０Ｐ分区包含四个　

ＲｏＰ单元。）。一个Ｉ　Ｐ单元能够在一个时钟周期　

内输出一个３２ｂｉｔ整数像素。理论上，由于Ｒ０Ｐ的　

压缩效率和Ｒ０Ｐ单元数量的提升，ＧＦｌ　１０在８ｘ抗　

锯齿下的性能会得到明显改善。　

此外，得益于更多的原子操作单元以及Ｌ２缓　

①Ｂａｒｔｓ仍然只有一个曲面细分单元，但增加７ｕｌｔｒａ．Ｔｈｒｅａｄｅｄ　Ｄｉｓｐａｔｃｈ　Ｐｒｏｃｅｓｓ０ｒ的数　

存，ＧＦｌｌ０的原子内存操作性能相对以往的架构来　

量，一定程度提升７曲面细分的性能。

说得到了巨大的提升。对同—地址的原子内存操作，ＧＦｌ１Ｏ　

当然，由于曲面细分很耗费ＧＰＵ资源，现在游戏厂商　

在使用这项技术时相对比较谨慎。最初的一些ＤｉｒｅｃｔＸ　ｌ１　

游戏基本没有或者加入了很少的曲面细分技术，因为当时　

显卡的曲面细分性能并不算强。而现在随着显卡　面细分　

性能的增强，一些ＤｉｒｅｃｔＸ　ｌ１游戏会加入更多的曲面细分　

技术，ＧＦｌｌ０的曲面细分优势会进一步体现出来。　

的运算速度是ＧＴ２００的２０倍，而对相邻内存区域的操作则　

达￣Ｊ７．５倍。　

完整的曲面细分单元设计　

我们知道，曲面细分作为ＤｉｒｅｃＸ　１】中的重要技术，　

ＧｅＦｏｒｃｅ　ＧＴＸ　５８０内部赏析　

上文我们说过，相Ｉ：ＬＧｅＦｏｒｃｅ　ＧＴＸ　４８０，ＧｅＦｏｒｃｅ　

ＧＴＸ　５８０在散热设计和功耗控制方面有诸多改进，下　

面我们就来看看这些设计和改进究竟是哪些？ＧｅＦｏｒｃｅ　

ＧＴＸ　５８０使用了６相核心、２相晁存供电的设计，其中每相　

核心搭配了３个ＳＯ．８封装形式的ＭＯＳＦＥＴ，每相核心搭　

配２个ＳＯ．８封装形式的ＭＯＳＦＥＴ，全部使用贴片电感。而　

且相比ＧｅＦｏｒｃｅ　ＧＴＸ　４８０，ＧｅＦｏｒｃｅ　ＧＴＸ　５８０的接口全　

部经过了屏蔽处理，抗干扰效果更佳。　

Ｍｃ评测室］　融　

的画面，可以深度考查显卡的Ｔｅｓｓｅｌｌａｔｉｏｎ性能。我们将　

选取“ＤｉｒｅｃｔＸ　１　ｌ＋Ｓｈａｄｅｒ（Ｈｉｇｈ）＋Ｔｅｓｓｅｌｌａｔｉｏｎ（Ｅｘｔｒｅ　

ｍｅ）”模式进行测试，这表示显卡运行在最高画质、极致　

Ｔｅｓｓｅｌｌａｔｉｏｎ等级的ＤｉｒｅｃｔＸ　ｌｌ模式下。此外，我们还将重　

点考察ＧＦ１００系列的抗锯齿性能。　

ＣＰＵ：ＡＭＤ　Ｐｈｅｎｏｍ　ｌＩ　Ｘ６　１０９０Ｔ　

主板：华硕ＣＲ０ＳＳＨＡＩＲ　ＩＶ　ＥＸＴＲＥＭＥ　

（Ｄ　ＧｅＦｏｒｃｅ　ＧＴＸ　５８０不再采用传统的搭配热管的散热设计，而是使用了真空　

腔均热板（Ｖａｐｏｒ　Ｃｈａｍｂｅｒ）技术　事实上，它和热管的散热原理是相似的，　

都是利用毛细和真空原理，通过液体的蒸发和冷凝来来迟到导热的目的　所　

不同的是，热管在进行导热时，工作方向相对是固定的．只能单向进行导热，　

而均热板底座的工作方向是发散的，即可以向四周进行导热。显然．腔均热　

板底座的导热效率会更高，可以更快地导热，将ＧＰＵ热量传递到散热靖　并　

最终通过风扇将热量排除。　

内存：金邦ＤＤＲ３　１６００　２ＧＢ×２　

电源：航嘉Ｘ７　９００Ｗ　

系统：Ｗｉｎｄｏｗｓ　７旗舰版　

ＧｅＦｏｒｃｅ　ＧＴ×５８０　Ｖｓ　ＧｅＦｏｒ￣ｅ　Ｇ下Ｘ　４８０　

频率、流处理器数量、纹理单元数量等规格的提升　

著提升了ＧｅＦｏｒｃｅ　ＧＴＸ　５８０的性能，特别是在ＤｉｒｅｃｔＸ　

ｌ１游戏中，这种性能增益幅度很明显。例如在　潜行者：　

普里皮亚季》、　地铁２０３３））、　异形大战铁血战士》，　

ＧｅＦｏｒｃｅ　ＧＴＸ　５８０的领先幅度分别达到了ｌ５％、２０％　

和１９％，这部分游戏应用了较大幅度的曲面细分技术，　

①显存供电部分使用ＡＰＮ７Ｏ８８芯片　

①核１　供电部分使用ＹＣＨＩＬ８２６６芯片　

“主于ＰＣＢ背面），可以控制两相供电。　

（位于ＰＣＢ背面），可以控制６相供电。　

ＧｅＦｏｒｃｅ　ＧＴＸ　５８０的规格提升使其获得了非常明显的性　

能提升。　

ＧｅＦｏｒｃｅ　ＧＴＸ　５８０性能测试　

接下来我们将进入精彩的性能测试部分，你将了解到　

ＧｅＦｏｒｃｅ　ＧＴＸ　５８０真实的３Ｄ、曲面细分、ＰｈｙｓＸ方面的　

性能和功耗温度方面的表现，以及它和ＡＭＤ　Ｃｙｐｒｅｓｓ、　

而在抗锯齿性能提升方面，ＧｅＦｏｒｃｅ　ＧＴＸ　５８０亦有　

不错的表现，例如在　潜行者：普里皮亚季》中，ＧｅＦｏｒｃｅ　

ＧＴＸ　５８０在开启了四倍抗锯齿以后，性能下降幅度为　

２８％，而ＧｅＦｏｒｃｅ　ＧＴＸ　４８０为３３％；在（（战地：叛逆连队　

２》，ＧｅＦｏｒｃｅ　ＧＴＸ　５８０在开启了四倍抗锯齿以后，性能　

Ｂａｒｔｓ之间的对比。我们将组建基于ＡＭＤ　ＰｈｅｎｏｍⅡＸ６　

下降幅度为３％，而ＧｅＦｏｒｃｅ　ＧＴＸ　４８０为８％；在《孤岛危　

机　，ＧｅＦｏｒｃｅ　ＧＴＸ　５８０在开启了四倍抗锯齿以后，性能　

下降幅度为５％，而ＧｅＦｏｒｃｅ　ＧＴＸ　４８０为ｌ１％。出现这种　

１０９０Ｔ的顶级游戏平台进行测试，告诉你最详细和真实的　

的测试结果。　

在ＤｉｒｅｃｔＸ　１ｏ／１０．１游戏和软件测试方面，我们会选取　

《３ＤＭａｒｋ　Ｖａｎｔａｇｅ））、《孤岛惊魂２　、　孤岛危机　等主　

流的ＤｉｒｅｃｔＸ　１０／１０．１的游戏和软件对ＧＦ１　１０的ＤｉｒｅｃｔＸ　

１０／１０．１性能进行测试。而对于大家最关注的ＤｉｒｅｃｔＸ　ｌ１　

游戏性能，我们将选取　地铁２０３３））、　异形大战铁血战　

士》、　鹰击长空２》等多款ＤｉｒｅｃｔＸ　ｌｌ游戏和软件重点考　

查ＧＦ１　１０在ＤｉｒｅｃｔＸ　ｌ１游戏和软件中的性能，看看它的　

情况是因为ＧｅＦｏｒｃｅ　ＧＴＸ　５８０的频率等规格提升，也一定　

程度提升了它的抗锯齿性能。　

ＧｅＦｏｒｃｅ　ＧＴＸ　５８０　Ｖｓ．Ｒａｄｅｏｎ　ＨＤ　５８７０　

在之前ＧｅＦｏｒｃｅ　ＧＴＸ　４８０的评测中，ＧｅＦｏｒｃｅ　ＧＴＸ　

４８０凭借更出色图形架构在综合性能方面超出Ｒａｄｅｏｎ　

ＨＤ　５８７０不少，而现在规格更强悍的ＧｅＦｏｒｃｅ　ＧＴＸ　

ＤｉｒｅｃｔＸ　Ｉｌ执行效率究竟有无明显提升？当然，所有游戏　

都运行在最高画质—　

ＧＦｌｌ０在图形架构上专为ＤｉｒｅｃｔＸ　ｌ１做了优化，我们　

将通过￣Ｕｎｉｇｉｎｅ　Ｈｅａｖｅｎ　Ｂｅｎｃｈｍａｒｋ））这款ＤｉｒｅｃｔＸ　１　１　

５８０￣Ｊ进一步将这种优势提高，实现了全面的超越。在　

ＤｉｒｅｃｔＸ　ｌｌ游戏测试中，ＧｅＦｏｒｃｅ　ＧＴＸ　５８０凭借专为　

ＤｉｒｅｃｔＸ　ｌ１优化的ＧＦｌｌＯ图形架构，整体领先幅度在　

ｌＯ％－１０９％。例如在　战地：叛逆连队２》、（（地铁２０３３））、　

软件来重点验证它的曲面细分性能。（（Ｕｎｉｇｉｎｅ　Ｈｅａｖｅｎ　

Ｂｅｎｃｈｍａｒｋ））的测试场景中包含了大量基于Ｔｅｓｓｅｌｌａｔｉｏｎ　

失落的星球２》、（《异形大战铁血战士》、《潜行者：普　

里皮亚季》和　鹰击长空２》等ＤｉｒｅｃｔＸ　ｌ１游戏测试中，　

ＧｅＦｏｒｃｅ　ＧＴＸ　５８０的领先幅度分别达到了１０％、５７％、　

８０％、ｌ７％、３０％和９１％，领先幅度非常巨大，这再次验证　

了ＧｅＦｏｒｃｅ　ＧＴＸ　５８０在新游戏中的优势。　

在ＤｉｒｅｃｔＸ　１０游戏中，ＧｅＦｏｒｃｅ　ＧＴＸ　５８０和Ｒａｄｅｏｎ　

５８０的最大系统功耗，有一些遗憾。截至发稿前，有消息　

指出可以通过特别版的ＧＰＵ—Ｚ＋ＦｕｒＭａｒｋ软件检测出　

ＧｅＦｏｒｃｅ　ＧＴＸ　５８０的最大系统功耗，但这种测试方法可　

能会ＸＣＧｅＦｏｒｃｅ　ＧＴＸ　５８０造成硬件损伤。针对这个问题，　

ＨＤ　５８７０的差距被缩小，例如在《孤岛危机》和　孤岛惊　

魂２》游戏中，ＧｅＦｏｒｃｅ　ＧＴＸ　５８０的领先幅度分别为６％和　

ｌ２％。这是因为这部分老游戏比较强调纹理贴图的性能，　

比如　孤岛危机　，而Ｒａｄｅｏｎ　ＨＤ　５８７０由于具备８０个纹　

理单元，在纹理渲染方面仍有不错的表现。　

在（（Ｕｎｉｇｉｎｅ　Ｈｅａｖｅｎ　Ｂｅｎｃｈｍａｒｋ￣的曲面细分测试　

中，ＧｅＦｏｒｃｅ　ＧＴＸ　５８０凭借ｌ６个专属的曲面细分单元，在　

本刊也将持续予以关注。　

ＧｅＦｏｒｃｅ　ＧＴＸ　５８０：单核心王者毋庸　

置疑　

就在我们一直猜测完整规格的ＧＦ１００产品何时出现　

时，ＮＶＩＤＩＡ很低调地发布了ＧｅＦｏｒｃｅ　ＧＴＸ　５８０。从实际　

测试来看，ＧｅＦｏｒｃｅ　ＧＴＸ　５８０非常好地巩固了单核心王　

者的地位，不仅相对ＧｅＦｏｒｃｅ　ＧＴＸ　４８０有ｌ　５％左右的性　

“ＤｉｒｅｃｔＸ　１　ｌ＋Ｓｈａｄｅｒ（Ｈｉｇｈ）＋Ｔｅｓｓｅｌｌａｔｉｏｎ（Ｅｘｔｒｅｍｅ１”　

模式下领先Ｒａｄｅｏｎ　ＨＤ　５８７０达到了１０９％，令人刮目相　

能提升，更是全面超越Ｒａｄｅｏｎ　ＨＤ　５８７０，单核心王者的　

地位毋庸置疑。　

从ＧｅＦｏｒｃｅ　ＧＴＸ　５８０的图形架构来说，它和ＧｅＦｏｒｃｅ　

看。而最新的ＤｉｒｅｃｔＸ　１　１大作（（鹰击长空２》也加入了曲面　

细分技术，ＧｅＦｏｒｃｅ　ＧＴＸ　５８０在该游戏中的领先幅度也　

高达９１％。　

ＧＴＸ　４８０没有本质区别，甚至你可以认为他们是一样的：　

专为ＤｉｒｅｃｔＸ　ｌｌ设计的图形架构、强悍的曲面细分性能、　

出色的反锯齿性能和优秀的综合表现。　

但ＧｅＦｏｒｃｅ　ＧＴＸ　５８０还是有那么一些值得我们思　

功耗和温度表现　

ＮＶＩＤＩＡ在ＧｅＦｏｒｃｅ　ＧＴＸ　５８０上做出了限制最大功　

耗和改进散热的设计，这的确有效地控制了它的功耗和发　

热量。在这种情况下，ＧｅＦｏｒｃｅ　ＧＴＸ　５８０的待机温度和满　

载温度分别只有３８＂Ｃ和７９＂Ｃ左右，待机系统功耗和满载系　

统功耗分别为ｌ　ｌ０Ｗ和３２３Ｗ，相比ＧｅＦｏｒｃｅ　ＧＴＸ　４８０有　

明显的下降。　

考和注意的设计．它并不是简单的ＧＦ１００完整规格版本，　

它通过改进工艺和优化晶体管的效率使显卡的效率得到　

提升，更高的频率使其拥有更强的性能，每秒能处理２０　

亿个三角形便是例证。改进的散热设计解决了一直困扰　

ＧｅＦｏｒｃｅ　ＧＴＸ　４８０的散热问题。而这些设计和改进都是　

这种设计的确可以在很大程度上控制ＧｅＦｏｒｃｅ　ＧＴＸ　

５８０的功耗，毕竟在实际游戏中是很难达到软件测试的最　

大功耗。但另一方面，我们却无法检测出ＧｅＦｏｒｃｅ　ＧＴＸ　

在完善ＧｅＦｏｒｃｅ　ＧＴＸ　４８０的不足，目的是将ＧＦＩ　１０／１００架　

构的最大性能发挥出来。从这个意义来说，ＧｅＦｏｒｃｅ　ＧＴＸ　

５８０是ＧｅＦｏｒｃｅ　ＧＴＸ　４８０的完善和更强的版本。类似这种　

ｒ首批上市的ＧｅＦｏｒｃｅ　ＧＴＸ　５８０显卡　●　

：Ｉ●Ｉ　ｊ删

核心频率：７７２ＭＨｚ　

显存频率：４００８ＭＨｚ　

核心频率：７７２ＭＨｚ　

流处理器频率：１５４４ＭＨｚ　参考价格：３９９９元　

流处理器频率：蠢　詈　。　１洲　５４４ＭＨｚ　参考价格．爹考价格：　３９９９元兀　

在上一代产　

品上进行小　

不过不同的是，在大量的测试中，ＡＭＤ沿用多年的　

４Ｄ＋ｌＤ架构已经开始露出疲态，暴力添ＪＪ［ＩＳＰＵ的做法已　

经遇到了瓶颈，架构的潜力被消耗殆尽。特别是其较差的　幅提升和更　

改的设计和　

近年来ＡＭＤ　

曲面细分性能在今后大量运用曲面细分的游戏中会更加　

捉襟见肘，因此ＡＭＤ在下一代产品中很可能会全面更换　

图形架构。而ＮＶＩＤＩＡ这边，凭借新一代ＧＦＩ　１０／１００图形　

架构，可以在未来走得更远，因此其未来的产品很有可能　

仍然是基于ＧＦ１１０／１００而设计，并逐步完善。　

另据已知的消息来看，ＮＶＩＤＩＡ在接下来的时间内将　

陆续发布ＧｅＦｏｒｃｅ　ＧＴＸ　５７０／５６０，以完善整个ＧｅＦｏｒｃｅ　

的做法比较　

类似，就好　

比Ｂａｒｔｓ是在　

ＣＹＰｒｅｓｓ基　

础上进行小　

幅修改是一　

个道理。这　

④ＧｅＦｏｒｃｅＧＴＸ　５８０在待机状态下会自劝降频　

ＧＴＸ　５００系列产品线。据称，ＧｅＦｏｒｃｅ　ＧＴＸ　５７０的发布　

时间是今年１２月初，而ＧｅＦｏｒｃｅ　ＧＴＸ　５６０￣１］可能要等到　

种没计可以　

明年第一季度上市，相信届时的ＤｉｒｅｃｔＸ　ＩＩ市场又会有一　

让新产品快速推出市场，获得更多的市场关注。　

表２：ＧｅＦｏｒｃｅ　ＧＴＸ　５８０与主流高端产品的的测试成绩对比　

ＧＴＸ　５８０　ＧＴＸ４８０　

番恶斗。口　

ＧＴＸ　４７０　ＨＤ　５８７０　ＨＤ　５８５０　ＨＤ　６８７０　ＨＤ　６８５０　　ｌ

ＧＰＵ　ＳＣＣＩＲＥ　；１２４３４　

９４９４　７４９７　８６１７　６９１６　７３４１　５８０５　

麓　黼躐　　Ｉ

１９２０Ｘ１０８０　ＰｈｙｓＸ　ＯＮ　

１９２０ｘ１０８０　ＰｈｙｓＸ　ＯＦＦ　

１９２０×１０８０　

　ｌ３０　

｝５８　

４０　

１ｏ　

５８　

３８　

５７　

３１　

５８　

３９　

５７　

３４　

｛５８　

３６　

　５６　Ｉ

３０　

豳翻麟嘲豳鞠　

１９２０×１０８０　８ＡＡ　８０　６８　６５　５９　６３　５５　

１９２０ｘ１０８０　８ＡＡ　１２４　１１９　１１４　６３　５５　

６３　

黧嘲嘲

１９２０ｘ１０８０＋ＤｉｒｅｃｔＸ　１１＋Ｓｈａｄｅｒ（Ｈｉｇｈ）　

＋Ｔｅｓｓｅｌｌａｔｉｏｎ（Ｅｘｔｒｅｍ８）　

４５．８　３９．１　３４．２　２２．３　１８．８　２４　２１．１　

盼黼Ｉ　Ｉｌ爨畿酾盼０　０－　

１９２０×１０８０　

瀚雕

７８　７１　６８　：５６　５９　４７　

激落　瓿　

１９２０ｘ１０８０　

薯《　

１　７　６４　

６８　

麓圈圈隔　

｝７７　６３　６７　５６　

１９２０Ｘ１０８０　４ＡＡ　

≥　

１９２０Ｘ１０８０　４ＡＦ　

１９２０×１０８０　４ＡＡ　４ＡＦ　

曩霎　銎　

！　

３０　

７４　

蕊　

５３　

｛１８　　１２　ｆ

鋈　翌　５４　

　１７　ｌ

４８　蕊

２２　

１６　

！　

｛２５　２１　

姆　蜘ｂ瞬　－．一茗　

１９２０×１０８０　

墨瑟翌　

６３　

互曩

４９．１　

要要墨

４１　

至至ｌ

　３７　ｊ

　霪

：３２　

＝一

３７　

隧黼豳豳　

：　

３１　

１９２０Ｘ１０８０　４ＡＡ　

运　鳓濑蚓　

１９２０ｘ１２００　

警麓　

６１　５２　４３　

１０９Ｗ　

２９６Ｗ　

：４４　

１０４Ｗ　

３５　

１０４Ｗ　

２４９Ｗ　

待机系统功耗　

满载系统功耗　

１１ＯＷ　

３２３Ｗ　

１　

４４０Ｗ　３６８Ｗ　

１１０Ｗ　

３０４Ｗ　

２８８Ｗ　

９２　

USB迷 | 专注于互联网分享

王者Fermi,新君驾临 NVIDIA GeForce GTX 580 显卡评测

与本文相关的文章

评论列表 (0)