2024年9月5日发(作者:隆康盛)
维普资讯
{tanh ̄arv 产品与评测
风景这边独好
NVI DIA GeForce4 MX抢鲜测试
NVIDIA公司一直以来都坚持六个月推出~款新产品的市场策
略 继2001年2月成功推出GeFO rce3系列显卡后 到目前为止
约一年时间都没有真正意义上的新产品闻世 因此.前期保密工
作做得非常好的G eFO rCe4系列芯片就更增添了几分神秘色彩
《微型计算机 评测室抢先取得了首轮发布的GeFo rce4 MX显卡
让我们一起来看看这位NVIDIA的新宠究竟有伺新的绝技…・・
文/图微型计算机评测室
NV1 7&NV25——迷雾中的期望
2001年2月推出的GeFor Ce3显卡以其强大的性能
于将自己的新产品
进行性能价格上的
仔细定位,使之适
Ge 。rce 产品线分布定位图f
nVlDI
VIDI
让虚拟3 D世界更加真实和流畅,也让业界其他公司对
NV1 D1 A的强大研发能力所叹服,当然,它也成为r历
合不同层次的用
户。同时,将上一
代产品的价格往下
压,以更为出众的
性能
糟VIDI^.
一
一
史上最为昂贵的家用游戏显卡之一。不过2 0 0 1年下半
年AT1 R200芯片的推出似乎掩盖了GeF0r Ce3的耀眼
光芒,它以更加优异的性能和画质博得r广大电脑爱
好者的青睐,而随后 ¨D1 A推出的“钛”系列产品并
未引起人们的太多关注,更多的目光则集中到2 0 0 2年
《
—
性价比吸引低端用
户,再加上其非常
快的更新周期,很
可能一款产品性能
还足以应付目前的
应用时便面临着被
主流
. I42oo
2月即将发布NV1 7和N、.25两款全新的产品上。这其中
的原因有二:一是人们认为“钛”系列产品不过是
N¨DIA提高GeForCe3芯片运行频率后的增强版,只是
为了对抗R 2 0 0临时启用的过渡性产品;二是由于多功
能媒体中心一直是A T I高档显卡的独有卖点,尽管有
部分厂家采用第三方辅助芯片生 出“A L L—I 一
W0 DER”GeF0r ce2 Mx显卡,但推广度并不是很高。
N V 1 7和N、f 2 5显卡在设计之初便放出消息说要将双头
显示、D V D回放等多种功能直接集成到芯片内,这将
一
淘汰的危险,这种
对市场的侵蚀方式
给其竞争对手以很
大的压力。A T 1公
司决定对第三方厂
低价
商供应R a d eo rl和
R 2 0 0等芯片的例
子正是其针对
改\、,1 Dl A产品只注重速度提升的旧形象。因此,对
升级选择何种显卡犹豫不决的观望者和众多N、lI D l A迷
对其期待度得到大大提升。
N¨DI A公司市场策略的反击措施。此次NV1 7和\v25
的高低搭配更为仔细,从最低端的GeFor ce4 MX420到
最顶级的GeFor Ce4 Ti4600,适合非常注意性价比的
低端用户和不计成本的疯狂3 D发烧友。
高低搭配、绚丽出击
似乎是从推出TNT2系列显卡开始,NV I Dl A就习惯
GeForce4系列芯片特性比较表
一—髓 瞳■●■Ⅲ__l_一■■_唧_____■啊哪啊____■∞■啊____一■啪Ⅲ ●嘲目。啊-_ 一
核心频率(MHZ) 300 275 240 175 300 270 250 250 200
整毽爨鼙§ I菱j
10.4
136
399
550
8、8
125
299
500
8
400
6.4
550
8.8
400
6 4
400
6、4
166(SDRAM)166(SDRAM)
2、7 2.7 内存带宽(GB/s)
I羹j翻津吲谤锄£皇》ll s》
多边形生成率
(H1111on Trlang1es/s)
4.8 . 4,4 0 96
N/A
34g
0.7
N/A
1g9
1,2
38
179
1 1
34
l4g
1
31
N,A
1
31
99
0.8
25
NIA 价格(¥)
42 NO.5,2002 New Hardware
f
维普资讯
产品与评测 Ne、lllard l
不知道大家有否注意到,N、I D I A此次对于
板,一样的正反贴片式S D R 、、】颗粒。由于不需要运行
Ge F0 r C e 4系列显卡的发布显得格外重视,在发布前很 存高频率下,因此PCB上的电路元件也精简了许多,这
早一幅“月下狼嚎”的图片就占据 页面上最醒目的
一
切都表明这是为人门级低端用户所设计的,重在以
位置,似乎意味着Ge F0 r C e 4系列来势汹汹。2月6日
便宜的价格提供足够的性能。
正式发布后,除了常规的游戏支持介绍、0 EⅥ厂商支 而Mx460却显得分外雍容华贵,硕大的涡轮风扇提
持介绍和参数列举以外,NV I D I A还别出心裁地与一个 供了强劲有力的散热能力,Ti n yBGA封装的四颗3.6纳
名为“ANARK”的合作网站推出了全3D的展示方式,以 秒显存分布于红色电路板的正反两面,它能够提供更
声、光一体化的全新3D WEB浏览模式展示GeF0 r Ce4 高的运行速度和更好的电气性能。
芯片的新特性。
测试平台
测试样品简介
●CPII:Penti Hill 4 2.2Gnz(Northwood)
●NVIDIA GeForce4 MX460
●主板:I13te1 D845BG(845D)
●内存:Ki rlginax PC27O0(DDR333)SDRAM 256MB
NV I D I A官方提
(CAS=2.5)
供的测试样品,用料
●硬盘:IBM 60GXP 40GB(支持ultra ATA 1O0)
扎实,PCB板上采用
●参照显卡:耕升GeForCe2 Ti、ELSA GeForce3
了比第三方厂家更
Ti200、MSI GeFOr"Ce3 Ti500
多的贴片元件。输出
●操作系统:英文Windows 2000 ProfesSional SP2
接口也更为完善,除
版+DirectX 8.1
了标准D—S u B和S—
●驱动程序:NVIDIA 2 7.20 Beta版本、I13tel
Vi d e o外,还提供了标准数字D vI接口,与此同时我
Chipset SoftWare I13stallati013 Utility 3.40版、
们发现,这款样品所采用的D—S U B接El明显长于普通
Iritel Applicati Oil Acceleratot"应用程序加速器2.0
产品,这样做的目的是为了对输出引脚加以屏蔽,减
多语言版
小电气干扰,提升输出图像的品质,以前这种接El元
●测试软件:Sysmark2000、winBench 99 2.0版、
件多见于MGA G系列显卡上。
CC wi13St0tie2002 1.0版、BUSitiess wi13St0tie 2001
1.0.2版本、
3DMark 200l 1.0
版本、Q U ake 11I
Te amAr e a13 3D
Wi13Be13 ch 2000
1 . 1 版本、
Viewperf 6.1.2
这三款产品除了P C B板的颜色略有不同外,元件
版、Dr 013eZ Mark测试、Aq Uamark测试2.2版本、
的排列和布局几乎完全一样。图形芯片上均清晰印有
GL
—
ExcesS 1.1a版本等
“NV1 7”的字样,很明显这应该是NVI DI A交付的最终 综合考虑到各方面因素,我们认为,要想真正展
成熟产品,而且连显存也不约而同地采用了S A M S u G 现被测试显卡的性能,首先必须尽量消除可能存在的
公司单颗容量为1 6MB、频率513 s的颗粒。稍有不同的
系统瓶颈。因此我们采用 目前频率最高的N0 rthw00 d
是,耕升的M x 4 4 0显卡采用了插件式电容,核心/显
P e13ti U m 4处理器,事实证明,我们的选择是正确的。
存频率为290Mn Z/400Mn Z;旌宇的Mx440则比较“老
细心的读者可能会发现,本次测试我们首次采用了
实”,核心和显存都运行在标准频率下。
B e t a版本的显卡驱动程序,按照《微型计算机》严格
的评测规范要求,理论上我们会尽量避免使用B e t a测
●MSl Geforce4 MX420、MX460
试版本的驱动程序,但本次情况较为特殊,只有2 7.X X
其实拿到M x 4 2 0的时候给每个人的第一感觉都是
版本的驱动程序能够正确识别GeF0 r C e4系列显卡,而
它像极了GeF0r Ce2 Mx的初期产品。一样小巧的电路
如果对参照显卡采用2 3.1 2版本的官方驱动程序有可
能会导致测试结果的不公平,所以,我们决定对所有
测试显卡均统一安装27.20 Beta版本驱动。除了一贯
使用的测试软件外,针对参测显卡日益强劲的性能,
我们还增添 三个最新的测试软件,Dr 013e z Ⅵa r k、
Aq uamark和GL—E×Ce s s,以便能够以更为复杂的测试
微型计算机2002年第5期 43
维普资讯
ewlt ̄lr(hvare 产赫与评
场景考验显卡在多特效、满负荷状态下的性能。由于
N、 2j芯片尚未正式发布,因此本次测试我们将目光锁
定在 1 7(也就是GeFoI'Ce4 Mx系列显卡上)。
贴图的方式,这就需要读取更多的数据完成对这个单
一
像索的渲染工作,这也就直接造成了数据传输量的
大大增加。如果开启全屏反锯齿功能,这个数据量还
将成倍增长,所以说,目前的G P 0几乎将所有的峰值
带宽都花费存像素渲染这个工序上了。所以我们会
说,内存带宽是阻碍图形性能提高的主要瓶颈之一。
N、’I DA采用六种新技术构成了其第二代光速内存架构。
1.交叉内存控制器(Crossbar Memory Controller)
以目前最为流行的内存控制器带宽为例,它们通
常都采用1 28bit接口,如果搭配DDR内存使用,一次
就可读取2j6 b t的数据,它将有利于单位时间内的大
量数据传输,而这种情况在El常使用中并不常见。举
个例子而言,任何3 D图形最终都是由无数个小三角形
构成的,最基本的3 D运用中,每个三角形可能仅有2
GeForce4显卡新特性测试
众所周知,Ge F0 r C e 2刚推出的时候并不具备双头
显示功能,而在稍后推出的同系列M x系列显卡才具备
了双头显示功能,这个改变给人的感觉似乎是为了顺
应潮流而添加的。但刚刚发布的Ge F0 r C e4系列芯片却
是个特殊的产品系列,N、1 7和\V 2j在功能上都有很
强的定位意识,各自支持的新特性并非以价格的高低
作为衡量标准,下面这张表就足以说明问题,表中打
“ ̄/ 的表示支持该特性。
个像素构成,按照前面的计算公式,每个像素采用
32bit色和32bit z模板缓冲,由于色彩数据和z值不
能在同一次读周期中完成,因此,两个像素的渲染过
程就需要两次读周期才能完成。第一个周期读出它们
的色彩值(3 2 b i t×2);第二个周期读出它们的z值
从表中我们清晰地发现,最先进的nfi ni teFXⅡ
特性只用于最高端的GeF0 r Ce4 Ti产品中,它用来产
生高质量多角度的真实感更强的头发和毛皮,这适用
于3 D游戏和虚拟3 D运用,因此它并不在本次评测报
告的讨论范围之内,我们将在稍后的 V25评测报告中
为您详细描述它的工作原理和方法。现在还是让我们
将目光转移到NV1 7(GeForCe4 MX)系列产品所具有的
特性上来。
(32bit×2),每个周期的数据传输量为64bit。本段
开始时我们说过,一个内存控制器一次可以读取
256 bit数据,而现在只需要64bit,也就是说,这次
读动作中75%的带宽被白白浪费掉。Gef0 r Ce4 Mx集
成了两个内存控制器,根据渲染时最有效率的方式灵
活地按照每周期64、1 28或者256bit的数据读取量访
问显存,有效提高了存储带宽的利用效率。
2.四组高速缓存(Quad cache)
顾名思义,Quad cache的工作就是在关键性数据写
入或是读取到本地显存时进行缓冲,降低图形处理器访
问本地缓存的次数,保持图形流水线的最高工作效能。
3.无损Z模板缓冲压缩(Lossless Z Compression)
前面我们提到z模板缓冲决定了一个像素的深度
或称为可见度,在像素被渲染的过程当中图形处理器
必须读取和写入z值,这项技术通过固化于G e F 0 r C e4
芯片内部的硬件执行功能将z模板缓冲所消耗的内存
带宽降低为原来的1/4,以提高显卡的执行效能。
●Lightspeed Memory Architecture【I一一
NVIDIA第二代光速内存架构
提升P C图形子系统性能的一个最关键因素就是内
存带宽的限制,内存总线接口会被像素回写、像素读
取.显示刷新、A G P总线数据传输以及纹理数据传递
等多种持续性高带宽传输所占用,当这些动作中有任
何一种成为内存接口的带宽瓶颈时,最直接的反应就
是显示性能的下降。以完成一个像素渲染为例,传统
的图形架构需要从图形内存不同的缓冲区内读取不同
的数据,这其中包括ARGB(A1 Pha通道和三原色通道)
色彩数据和用于描述该像素可见度的Z值,假设在
32bit色和32bit z模板缓冲的状态下对其渲染一次,
4.可视性子系统/Z模板闭塞图元剔除(Visibility
Subsystem/Z-Occlusion Culling)
那么它所需要的渲染数据量就是1 6 b Yt e s,计算公式
如下(最理想状况):
读取:A RG B数据(8 b i t×4)+z数据(3 2 b i t)
=64bit=8byteS;
简单地讲,由于角度的关系,在3 D场景中有些像
素是无法看见的,实际上完全不必对其进行渲染。但传
统的图形架构无法对之加以判别,只能按部就班地对每
个像素一一渲染。GeForce4 Mx芯片中采用的Vi Sibil—
ity Subsystem和z—OcClusion Cu11ing技术能够对被
写入:A RG B数据(8 b i t×4)+z数据(3 2 b i t)
=64bit=8bytes:
总共:1 6 b Yt e s。由于目前大部分的游戏为了提供
渲染区域进行可见性测试,智能地判定像素的可见性,
剔除无需渲染的闭塞像素,以节省宝贵的内存带宽。 更加精美的画面和更逼真的细节表现,都采用了多重
44 NO.5,2002 New Hardware
维普资讯
产品与评测 it|lni l
第二代光速内存架构测试成绩
_珊硼■■蛐呵硼■■目I哪瞳■啊■日邺舶硼H■目目I啊_■哪■■幽
款3 D显卡的重要指标之一。一幅即时生成
■啪■¨-___■姗
~
●瞳■嵋唧—一___咖_一___
的3D图像由于取样不足( ndersamp1 ing)
会在场景中物体的边缘色彩过渡线上出现
阶梯状的锯齿,任何人都可以通过将3 D画
面截屏放大后观察到这种瑕疵,它会对画
面质量产生相当大的影响。在传统的图形
结构中,主要采用高分辨率渲染和每像素
—_■■■■■啊
1024×768 x 32blt 6043 5787 4501 6649 4907
1024 x 76B x 1∞tt
1280 x 1024 x 32blt
6o63
4756
6052
4326
4966
2631.
6868
5137
5814
3496
1280》( O24交 l 黪{警 4955
Rendered FrdIlS A1『E(FPs】 27.01
444.62
4779
26.6
401.46
3525
21.24
319.82
5520
27.37
795.56
4845
24.61
372.19
多点取样的方式降低全屏锯齿现象。对于
用户来说,将3 D画面的分辨率设置得足够
高可以弥补这一缺陷,实现这一点对显示
器的要求相当高,因此,最为常见的还是
采用增加“有效分辨率”的方法,也就是
每个像素的颜色通过多点取样来完成。
T鼓 1ar略1 脏张 礤
∞en陵frlangles AVEIX/s)
448。05 405。69 323.18;803.94 376.o9
800 x 600 144.,3 133.9 82.4 145.2 107.1
o2毒 68、 l0 2
78..5
98.7
65.8
55.5
35
1.11.1
73.8
76.5
48.3 1280 x 1024
l6oo
萋
Vl ̄
2∞ j。 5 4
4719
47.2
4169
23..B
3180
52.7
4591
33.8
4459
个像素最终渲染出来的颜色是由图
形处理器对此像素覆盖的若干区域的颜色
一
GL Exce88 1.1a
进行取样和运算后得到的,被取样的点就
是为r增加“有效分辨率”所额外需要的
点,取样的方法就决定r相邻像素点的颜
色差异,如果算法优秀,相邻像素点之间
Rate Test -j毒 4407 - 3481
5461
22
2 067
2604
133f;
3g97
5465
2242
3737
5324
2065
Polygon Count Test
.Test _
4517
19R3
5.自动预加载(Auto Pre-Charge)
看过本刊2001年12期 好“龙”配“精”鞍一KT133A
主板横向测试》的朋友们肯定对里面的“I nter1eave”预
的过渡会非常平滑,从而匀平锯齿边缘。
目前全屏反锯齿最为常见的主要有两种取样方
法:“S u pe r sam p1 i n g”和“M u1ti s a113p1 i n g”。
充电技术记忆犹新,其实GeForce4、{x中Auto Pre--Charge
的工作原理与之大同小异,它能对即将使用的显存区块
进行预先激活,图形处理器可以直接从一个显存区域跳
到另一个显存区域进行数据存取,切换时无需等待内存
预激活,节约了宝贵的数据执行时间。
S uPer sa113p1 in g给入“杀鸡用牛刀”的感觉。假设最
终屏幕3 D画面的显示分辨率为8 0 0 x 6 0 0,
SupersamP】i ng会以】024 x 768或者更高的分辨率对
图像进行取样和渲染,由于分辨率提高,每个像素点
覆盖图像的面积就减小,精度也就更高,然后将得到
的高精度图像过滤缩小后输出。由于渲染了比实际显
示更多的像素,这种取样方法会造成显卡负担加重,
引起性能下降。理论上讲2x Supersamp1 i ng需要写入
帧缓存数据会提升为原来的两倍,而4 x
SuPer samp1 ing更是达到惊人的四倍,如此一来造成
显卡性能的急剧下降也就不足为奇了。
VIDIA从一开始就更偏向于采用Mu1ti sampling,
在G e F o r c e 4系列处理器中内置有“A c c u v i e w
M u l t i s a m P 1 i n g”(我们理解为“改进型的
Multisamp1ing”)。Mu1ti samp1ing通过在图形处理器
6。快速Z模板数据清零(Fast Z-Clear)
将z模板缓冲中的旧数据清除掉也会耗费相当部
分的显存带宽,GeForce4 Mx中的Fast Z-Clear技术
能够将数据清除时间大大缩短,提高显卡的工作效率。
不难看出,3DMark 2001中除了仅配备SDRAM显存
的MX4 2 0以外,MX4 6 0和MX44 0的成绩都明显高于
GeForce2 Ti,与Ti200的成绩相当接近,这充分说明
GeForce4 MX新架构所带来的威力。而DroneZMark仍
然由Ti200独占鳌头,MX440和MX460紧随其后,MX420
尽管成绩垫底,但表现不俗,居然逼近了G e F o r c e 2
Ti。在Quake Ill TeamArena测试中MX460更是表现神
中嵌入智能电路,专门用于处理“额外”的样本采集,
再配合前面我们提到的第二代光速内存架构,能够以
较小的性能牺牲换取更加精美的画面。从下面这几幅
示意图我们来看看Accuview Multi sampling所提供的
更优化取样方法。
勇,将T i 2 0 0抛到了脑后,这与其高频率高带宽密不
可分。G L Ex c e s s中我们针对填充率、多边形数量和
内存带宽作了专项测试,除了多边形数量一项外,其
余两者MX460都占据了第一,从性能上讲,GeFor ce4
Mx芯片与CeForce3 Ti200并不属于同一档次,MX460
取得的好成绩与其显存的高执行效率密不可分。
●NVIDIA Accuview技术一一高分辨率
一
传统2x和Quincunx AA取样模板(GeForce3中使用)
Antialiasing子系统
毋庸置疑,图像抗锯齿能力目前已经成为衡量一
微型计算机2002年第5期 45
维普资讯
㈧llard ̄ 产品与评测
传统的2 x模式每像素采用r 2个取样点, ~cc uv1ew Mu1 Li sampl ing的另一项重要功能就是
Ⅵulti sampl1ng的特性决定了点l和点2都取自同一个 Ani sotropi C Filtering(各向异性过滤)。通常情况
纹理元素的颜色,而这个纹理元素的色彩是以假设位
下,3 D场景内的物体与其表面纹理贴图理想大小比例
于像素的中心位置获取的,那么,点1的取样由于其 为1:l,这样每一个像素点都能对应一个纹理元素。但
位置的恰到好处是正确的,但点2所处的纹理色彩与
这只是理想状况,很多时候会出现物体表面小于纹理
其取样所得值并不一定相同,这就造成r最终渲染色
贴图或者反过来,这样会影响最终渲染画面的品质。
彩的偏差。以此类推,Q ui n c un x^、(五点梅花)也存 Ani sotropi c Fi l Le ri ng能够智能调节物体表面与纹
在相同的问题.。 理贴图之间大小的比例,通过它能够将一张很大的纹
理贴图强行放到一个很小物体的表面上,使最终画面
-■
品质更高、细节更加丰富。
这个单元的测试结果让我们非常满意,Q u a k e Ⅲ
TeamArena中随着分辨率的提高,MX460的成绩逐渐逼近
并超过n 2 0 0,这说明在采样点数量急剧增加的状态下,
Acc LIview Multisampling中的2x和Ouinc
■
LInx
Acc uview Multi sampling发挥出其“智能化”。的优点,
AA取样模板
再配合前面提到的第二代光速内存架构,将内存带宽的
Acc uv Jew Multj sampl ing的功劳在于将取样点的 运用发挥到极致,从而取得了优异的成绩。Aq uamark是
位置加以移动,使两者取样值与其所在位置的真实值
一
个较为特殊的测试软件,它能提供高达4 0 M B的纹理
更加接近,从而使渲染的结果更加精确。
数据,这在日常运用或者流行的3 D游戏中都是不常见
的。尽管高分辨率下MX460的执行效率要好于n200,但
一一
是由于不支持该测试中使用的Pix el Shade r特性仍然
造成其最终成绩的不理想,实在让人扼腕叹息。
●软硬结合的增强型nView技术
其实说到n V i e w技术大家应该都不陌生,在
GeForc e2 MX上通过它支持双头显示功能,如今在新推
独有的4 x S渲染模式演示画面
出的G e Fo r c e4系列芯片组中它得到了保存和发展。为
我们已经重复过多次,反锯齿的原理就是决定一 r使自己的多屏显示结构更加健壮,N V 1 D 1 A在
个像素最终色彩时采用多点取样的方法,取样点覆盖
G e F o r c e 4芯片中集成了更多的硬件组件,它们包括:
的范围越大,最后所得值的真实程度也就越高,4 x S
双35OMItz RAMDAC、双cRT流水线、集成的视频处理引
值与传统的4x相比提高丫50%的取样点覆盖率,因此,
擎、双LVDS传送器(驱动双路LCD显示面板)和TMSD传
它的画面会更加精美。可惜的是,目前4 x S渲染模式 送器(驱动平板显示器)等等。与此相对应,nVi ew软件
仅能用于D3D中,我们期望在不久的将来0p enGL游戏 也得到了很大程度的增强,它包括下面一些新特性:
也能展现出如此精美的画面。
通过向导方
高分辨率Antialiasing子系统性能测试成绩
便快捷地对多个
屏幕进行独立控
制,即便是新手
也容易使用。使
用多屏幕扩展显
示时,有可能出
现窗口位于两个
显示器之间,每
台显示器只能看
多屏显示设置向导
见窗口的一部分,
n V i e w能将窗口指定到您所需要的显示器上。而允许
nV j ew软件与视窗管理器紧密集成后用户只需要通过右键
点击视窗顶部标题栏即可完成多种不同的特别扩展功能。
我们不妨将多桌面功能视为单显示器用户的多屏
显示解决方案。如果用户需要在一个显示器上同时打
开数十个全屏化窗口并在其中进行切换无疑是非常痛
46 NO.5,2002 New Hardware
维普资讯
产品与评测 lrd
苦的事情,n、i ew
最多允许用户自
行定义32个桌面,
可以将特定的应
用程序指定到特
定的桌面上显示。
C JDecoDE l
用户还可以对这
些卓面进行有针
对性的命名和背
景个性化,要想看
到需要的内容只
需要在任务栏的
视窗管理器和应用程序管理器
n、i ew图标上用鼠
标加以切换即可,
这可是提高工作效率卓有成效的解决方法。
对于那些
觉得切换桌面
罢= S。- o 。S-^
VPE工作流程图
仍然麻烦的用
。苫。。z母}
户来说,透明化
所面临的视频运用机会是很少的。、P E给我们带来的
窗口是他们在
打开大量窗口
后迅速找到隐
桌面管理器
新特性主要有以下几点:
1.完全硬件MPEG2解码
用通俗的说法来讲,GeFor c e4将一台完整D、 D机
的功能全部集成到芯片里,除r常见的i D c T(反转余
弦变换)、MoLi on compensatj on(运动补偿)外,它将
原来由处理器担任的l nverse Quanti zation(反转量
子化)步骤也一并交由图形芯片处理,留给处理器做
藏内容的最便
捷方法,透明度
可以按照使用者的需要自行调节。
除了上面提到的这些功能以外,局部放大、功能
热键定义、数码明亮独立调节等一系列功能都可以简
单点击鼠标通过n V i e w软件实现。测试中我们不得不
为这些小巧灵活的功能拍手叫绝。看来,A T l公司引
以自豪的H y d r a、 i si on功能这次是碰上新对手了。
的仅仅是音频数据解码和图像c S S解密,很大程度上
降低了DV D播放对电脑硬件的要求。在我们的测试中,
播放同一段DVD片断时,Ge Fo r c e 2 Ti的处理器占用
通过透明化的窗口能够直接看到原本被遮盖住的画面
●Video Process Engine(VPE)一
视频处理引擎
NVIDIA
率为34%~37%左右,而GeFor c e4 MX440则降低为
28%~31%,、 PE功不可没。
请注意,VPE功能将只存在于G e F o r c e4 MX和
2.高级自适应反交错
现在我们的电脑显示器都是逐行扫描工作方式,当
显示隔行扫描图像时,有一半的扫描线会处于空闲状
GeFoFce4 Go芯片中,这是因为顶级的GeFor ce4 Ti
将针对点放到了顶级游戏发烧友和3 D爱好者身上,它
微型计算机2002年第5期47
维普资讯
1 产品与评涌
态,、P E会根据图像源来决定用何种反交错方式来显示
画面以填满这些空闲的扫描线位置。通常静态画面使用
统后对系统整体性能的影响。
传统测试的结果基本与我们事先预料的结果相符
合,GeForCe4 MX460与GeForCe3 Ti 200不分伯仲。
GeForCe4 MX全面替代GeF0rCe2 Ti已成定局,MX420
w e a v e一一即将相邻的两帧图像合为一帧显示;动态画
面使用B O b——即将每一帧图像在垂直方向上放大两倍。
3.高级缩放与过滤功能
VPE结合了水平5级和垂直3级的缩放引擎,可以
将视频非常平滑地放大和缩小,使不同分辨率的视频
吃亏于仅仅配备了普通S D R AⅥ显存,但良好的内存与
核心执行效率仍然起丁不小的作用,这为其与配备
DDR显存的GeF0 rC e2 Ti一争高低立下J,汗马功劳。
源可以以相同的最终分辨率输出高保真的视频画面,
这一点我们在VIDE02O00的Qua1jty Te st测试中深有
体会,各种缩放比例下图像中的线条都清晰可辨,一
改过去N V I DI A显卡图像缩放质量不高的通病。
一
测试结论
●GeForce4 MX—u-迈向多元化的第一步
在2002年2月6日以前,也许每个人都会说NVIDIA是
个只注重游戏FPS速度的狂热者,但GeForce4 MX的推出
却意味着N V l D l A已经意识到单纯提高显卡的速度并不是全
4.适合未来HDTV和高档电视的高清晰度分量输出
我们最常见的复合视频将亮度和色度信号合并为
一
个信号传输,从而导致颜色变化和模糊。S—V i d e o
面占领Pc市场的长远之计。GeForce4Ⅵx的高集成度让人
吃惊,它将ATI和M( A的优点融于一身,一次性跨越J,别人
需要几代产品才能走完的路,这种研发实力的确不容小
视,其完善的多媒体功能足以满足中低端消费者的需求。
的带宽将两者分开传送从而获得比较锐利的图像,但
由于s—Vi d e o的带宽只适合传送低分辨率的模拟信号,
于是分量视频应运而生,它使用一个亮度信号+两个
色度信号获得最大的带宽和高级视觉效果。V P E中集
成有1 024×768分辨率的电视机编码器,可将RGB格
式信号转换成电视广播中使用的Y P r P b格式,直接输
出到带分量输入端子的HDTV或TV上以获得更好的D、D
●低价的家庭媒体中心解决方案
从G eFO r C e4 Mx的定位中我们能够很清晰地分析
出NVI DI A的市场策略,Mx420尽管运行频率较低,但
芯片性能并没有缩水,其低廉的价格再搭配同样价格
低廉的SD RAM肯定能够获得0 E、1客户的青睐,能够卓
有成效地进一步巩固和拓宽\、1 I D I A在品牌机市场的占
有率。而M x44 0和M x4 60更适合囊中羞涩但又注重显
卡性能的中低端用户,它们的性能无疑让人激动,而
它们的售价也同样平易近人,在3 D游戏和多媒体创作
间取得了一个良好的平衡点,从这层意义上讲,
GeFOrC e4 Mx超越了NVIDI A以前发布的所有产品。
图像,由于本次送测的显卡并没有提供9针分量输出
线,因此我们无法完成相应测试。
除了上面着重谈到的几点外,V P E还拥有实时视
频捕获和回放的功能,这个概念在以前的评测报告中
已经得到详尽的解释,故不再多作说明。
传统项目测试
在这部分里我们主要采用了zD、SPEC等公司的一
些标准化测试软件,目的在于考察单独更换图形子系
传统项目 试
●激动中的遗憾
在3DMark2001和Aquamark的测试中,
我们发现G e F 0 r C e 4 M x显卡不支持
DirectX 8.1中包括PiXel Shader在内
CC、I1『lngIor薅j 幢 、32.8 32.5
297
61.62
30.73
22.26
34.3
295
58.O4
30.11
2O.4l
34.5
300
43.4l
32.2
293
85.Ol
麓
Sysmark2O0 O
Awadvs-04
鬣 囊 赣参2 薹 懈羹撬≯辣 一6o.毒
299
61.87
的多个特效,这导致它在某些测试中的
效果比不上Ge F0 r C e3 Ti 200,这也许是
本次测试中我们最为遗憾的一点,NV I D I A
将这些特效放到了GeForC e4 Ti中并重新
命名为“第二代nfi nit e Fx引擎”,此举
的目的是为了清晰地告诉大家未来的准
确市场定位,GeFor C e4 Mx只适合主流用
户使用,GeF0r C e4 Ti则是为那些骨灰级
鲫
Dx-06
HedMCAD-01
藕
30.6
21.88
蠢羲固 鞠
’ ?  ̄7掩2 - 您
13.酗
3.77
帮 两。
29.O2
27.O2
错
3O.18
22.26
翻 凌l 羹 8一. 43 4。8.103 8.04。4
12.
3.78
黟 }。 羹 。一
3D W1nBench 2000 Processor Test
13 31
3.81
13.29
3.75
17,35 .
3.74
玩家所准备的,尽管名字中都一个
G eF0 r C e4,但两者根本不能相提并论。从
我们的测试结果也可以看出,G e F 0 r C e 4
a I。I 20o0 194
696
170
~一一
98.4
652
2:00
_- _-__-__●-_●-
168
_●- -● --H_--一
Mx在性能上与GeForCe3 Ti系列仍然存在
一
Business 6ralYalcs WI ̄rK 99 702 678 707
定的差距,它仅仅被准确的定位于从
釉咖固_哇 酹瞳黼畴拍撩 黧 I235: 11250 x|12 30囊 12 —40 12502i
性能和功能上取代GeForce2 Ti。 田
48 NO.5,2002 New Hardware
2024年9月5日发(作者:隆康盛)
维普资讯
{tanh ̄arv 产品与评测
风景这边独好
NVI DIA GeForce4 MX抢鲜测试
NVIDIA公司一直以来都坚持六个月推出~款新产品的市场策
略 继2001年2月成功推出GeFO rce3系列显卡后 到目前为止
约一年时间都没有真正意义上的新产品闻世 因此.前期保密工
作做得非常好的G eFO rCe4系列芯片就更增添了几分神秘色彩
《微型计算机 评测室抢先取得了首轮发布的GeFo rce4 MX显卡
让我们一起来看看这位NVIDIA的新宠究竟有伺新的绝技…・・
文/图微型计算机评测室
NV1 7&NV25——迷雾中的期望
2001年2月推出的GeFor Ce3显卡以其强大的性能
于将自己的新产品
进行性能价格上的
仔细定位,使之适
Ge 。rce 产品线分布定位图f
nVlDI
VIDI
让虚拟3 D世界更加真实和流畅,也让业界其他公司对
NV1 D1 A的强大研发能力所叹服,当然,它也成为r历
合不同层次的用
户。同时,将上一
代产品的价格往下
压,以更为出众的
性能
糟VIDI^.
一
一
史上最为昂贵的家用游戏显卡之一。不过2 0 0 1年下半
年AT1 R200芯片的推出似乎掩盖了GeF0r Ce3的耀眼
光芒,它以更加优异的性能和画质博得r广大电脑爱
好者的青睐,而随后 ¨D1 A推出的“钛”系列产品并
未引起人们的太多关注,更多的目光则集中到2 0 0 2年
《
—
性价比吸引低端用
户,再加上其非常
快的更新周期,很
可能一款产品性能
还足以应付目前的
应用时便面临着被
主流
. I42oo
2月即将发布NV1 7和N、.25两款全新的产品上。这其中
的原因有二:一是人们认为“钛”系列产品不过是
N¨DIA提高GeForCe3芯片运行频率后的增强版,只是
为了对抗R 2 0 0临时启用的过渡性产品;二是由于多功
能媒体中心一直是A T I高档显卡的独有卖点,尽管有
部分厂家采用第三方辅助芯片生 出“A L L—I 一
W0 DER”GeF0r ce2 Mx显卡,但推广度并不是很高。
N V 1 7和N、f 2 5显卡在设计之初便放出消息说要将双头
显示、D V D回放等多种功能直接集成到芯片内,这将
一
淘汰的危险,这种
对市场的侵蚀方式
给其竞争对手以很
大的压力。A T 1公
司决定对第三方厂
低价
商供应R a d eo rl和
R 2 0 0等芯片的例
子正是其针对
改\、,1 Dl A产品只注重速度提升的旧形象。因此,对
升级选择何种显卡犹豫不决的观望者和众多N、lI D l A迷
对其期待度得到大大提升。
N¨DI A公司市场策略的反击措施。此次NV1 7和\v25
的高低搭配更为仔细,从最低端的GeFor ce4 MX420到
最顶级的GeFor Ce4 Ti4600,适合非常注意性价比的
低端用户和不计成本的疯狂3 D发烧友。
高低搭配、绚丽出击
似乎是从推出TNT2系列显卡开始,NV I Dl A就习惯
GeForce4系列芯片特性比较表
一—髓 瞳■●■Ⅲ__l_一■■_唧_____■啊哪啊____■∞■啊____一■啪Ⅲ ●嘲目。啊-_ 一
核心频率(MHZ) 300 275 240 175 300 270 250 250 200
整毽爨鼙§ I菱j
10.4
136
399
550
8、8
125
299
500
8
400
6.4
550
8.8
400
6 4
400
6、4
166(SDRAM)166(SDRAM)
2、7 2.7 内存带宽(GB/s)
I羹j翻津吲谤锄£皇》ll s》
多边形生成率
(H1111on Trlang1es/s)
4.8 . 4,4 0 96
N/A
34g
0.7
N/A
1g9
1,2
38
179
1 1
34
l4g
1
31
N,A
1
31
99
0.8
25
NIA 价格(¥)
42 NO.5,2002 New Hardware
f
维普资讯
产品与评测 Ne、lllard l
不知道大家有否注意到,N、I D I A此次对于
板,一样的正反贴片式S D R 、、】颗粒。由于不需要运行
Ge F0 r C e 4系列显卡的发布显得格外重视,在发布前很 存高频率下,因此PCB上的电路元件也精简了许多,这
早一幅“月下狼嚎”的图片就占据 页面上最醒目的
一
切都表明这是为人门级低端用户所设计的,重在以
位置,似乎意味着Ge F0 r C e 4系列来势汹汹。2月6日
便宜的价格提供足够的性能。
正式发布后,除了常规的游戏支持介绍、0 EⅥ厂商支 而Mx460却显得分外雍容华贵,硕大的涡轮风扇提
持介绍和参数列举以外,NV I D I A还别出心裁地与一个 供了强劲有力的散热能力,Ti n yBGA封装的四颗3.6纳
名为“ANARK”的合作网站推出了全3D的展示方式,以 秒显存分布于红色电路板的正反两面,它能够提供更
声、光一体化的全新3D WEB浏览模式展示GeF0 r Ce4 高的运行速度和更好的电气性能。
芯片的新特性。
测试平台
测试样品简介
●CPII:Penti Hill 4 2.2Gnz(Northwood)
●NVIDIA GeForce4 MX460
●主板:I13te1 D845BG(845D)
●内存:Ki rlginax PC27O0(DDR333)SDRAM 256MB
NV I D I A官方提
(CAS=2.5)
供的测试样品,用料
●硬盘:IBM 60GXP 40GB(支持ultra ATA 1O0)
扎实,PCB板上采用
●参照显卡:耕升GeForCe2 Ti、ELSA GeForce3
了比第三方厂家更
Ti200、MSI GeFOr"Ce3 Ti500
多的贴片元件。输出
●操作系统:英文Windows 2000 ProfesSional SP2
接口也更为完善,除
版+DirectX 8.1
了标准D—S u B和S—
●驱动程序:NVIDIA 2 7.20 Beta版本、I13tel
Vi d e o外,还提供了标准数字D vI接口,与此同时我
Chipset SoftWare I13stallati013 Utility 3.40版、
们发现,这款样品所采用的D—S U B接El明显长于普通
Iritel Applicati Oil Acceleratot"应用程序加速器2.0
产品,这样做的目的是为了对输出引脚加以屏蔽,减
多语言版
小电气干扰,提升输出图像的品质,以前这种接El元
●测试软件:Sysmark2000、winBench 99 2.0版、
件多见于MGA G系列显卡上。
CC wi13St0tie2002 1.0版、BUSitiess wi13St0tie 2001
1.0.2版本、
3DMark 200l 1.0
版本、Q U ake 11I
Te amAr e a13 3D
Wi13Be13 ch 2000
1 . 1 版本、
Viewperf 6.1.2
这三款产品除了P C B板的颜色略有不同外,元件
版、Dr 013eZ Mark测试、Aq Uamark测试2.2版本、
的排列和布局几乎完全一样。图形芯片上均清晰印有
GL
—
ExcesS 1.1a版本等
“NV1 7”的字样,很明显这应该是NVI DI A交付的最终 综合考虑到各方面因素,我们认为,要想真正展
成熟产品,而且连显存也不约而同地采用了S A M S u G 现被测试显卡的性能,首先必须尽量消除可能存在的
公司单颗容量为1 6MB、频率513 s的颗粒。稍有不同的
系统瓶颈。因此我们采用 目前频率最高的N0 rthw00 d
是,耕升的M x 4 4 0显卡采用了插件式电容,核心/显
P e13ti U m 4处理器,事实证明,我们的选择是正确的。
存频率为290Mn Z/400Mn Z;旌宇的Mx440则比较“老
细心的读者可能会发现,本次测试我们首次采用了
实”,核心和显存都运行在标准频率下。
B e t a版本的显卡驱动程序,按照《微型计算机》严格
的评测规范要求,理论上我们会尽量避免使用B e t a测
●MSl Geforce4 MX420、MX460
试版本的驱动程序,但本次情况较为特殊,只有2 7.X X
其实拿到M x 4 2 0的时候给每个人的第一感觉都是
版本的驱动程序能够正确识别GeF0 r C e4系列显卡,而
它像极了GeF0r Ce2 Mx的初期产品。一样小巧的电路
如果对参照显卡采用2 3.1 2版本的官方驱动程序有可
能会导致测试结果的不公平,所以,我们决定对所有
测试显卡均统一安装27.20 Beta版本驱动。除了一贯
使用的测试软件外,针对参测显卡日益强劲的性能,
我们还增添 三个最新的测试软件,Dr 013e z Ⅵa r k、
Aq uamark和GL—E×Ce s s,以便能够以更为复杂的测试
微型计算机2002年第5期 43
维普资讯
ewlt ̄lr(hvare 产赫与评
场景考验显卡在多特效、满负荷状态下的性能。由于
N、 2j芯片尚未正式发布,因此本次测试我们将目光锁
定在 1 7(也就是GeFoI'Ce4 Mx系列显卡上)。
贴图的方式,这就需要读取更多的数据完成对这个单
一
像索的渲染工作,这也就直接造成了数据传输量的
大大增加。如果开启全屏反锯齿功能,这个数据量还
将成倍增长,所以说,目前的G P 0几乎将所有的峰值
带宽都花费存像素渲染这个工序上了。所以我们会
说,内存带宽是阻碍图形性能提高的主要瓶颈之一。
N、’I DA采用六种新技术构成了其第二代光速内存架构。
1.交叉内存控制器(Crossbar Memory Controller)
以目前最为流行的内存控制器带宽为例,它们通
常都采用1 28bit接口,如果搭配DDR内存使用,一次
就可读取2j6 b t的数据,它将有利于单位时间内的大
量数据传输,而这种情况在El常使用中并不常见。举
个例子而言,任何3 D图形最终都是由无数个小三角形
构成的,最基本的3 D运用中,每个三角形可能仅有2
GeForce4显卡新特性测试
众所周知,Ge F0 r C e 2刚推出的时候并不具备双头
显示功能,而在稍后推出的同系列M x系列显卡才具备
了双头显示功能,这个改变给人的感觉似乎是为了顺
应潮流而添加的。但刚刚发布的Ge F0 r C e4系列芯片却
是个特殊的产品系列,N、1 7和\V 2j在功能上都有很
强的定位意识,各自支持的新特性并非以价格的高低
作为衡量标准,下面这张表就足以说明问题,表中打
“ ̄/ 的表示支持该特性。
个像素构成,按照前面的计算公式,每个像素采用
32bit色和32bit z模板缓冲,由于色彩数据和z值不
能在同一次读周期中完成,因此,两个像素的渲染过
程就需要两次读周期才能完成。第一个周期读出它们
的色彩值(3 2 b i t×2);第二个周期读出它们的z值
从表中我们清晰地发现,最先进的nfi ni teFXⅡ
特性只用于最高端的GeF0 r Ce4 Ti产品中,它用来产
生高质量多角度的真实感更强的头发和毛皮,这适用
于3 D游戏和虚拟3 D运用,因此它并不在本次评测报
告的讨论范围之内,我们将在稍后的 V25评测报告中
为您详细描述它的工作原理和方法。现在还是让我们
将目光转移到NV1 7(GeForCe4 MX)系列产品所具有的
特性上来。
(32bit×2),每个周期的数据传输量为64bit。本段
开始时我们说过,一个内存控制器一次可以读取
256 bit数据,而现在只需要64bit,也就是说,这次
读动作中75%的带宽被白白浪费掉。Gef0 r Ce4 Mx集
成了两个内存控制器,根据渲染时最有效率的方式灵
活地按照每周期64、1 28或者256bit的数据读取量访
问显存,有效提高了存储带宽的利用效率。
2.四组高速缓存(Quad cache)
顾名思义,Quad cache的工作就是在关键性数据写
入或是读取到本地显存时进行缓冲,降低图形处理器访
问本地缓存的次数,保持图形流水线的最高工作效能。
3.无损Z模板缓冲压缩(Lossless Z Compression)
前面我们提到z模板缓冲决定了一个像素的深度
或称为可见度,在像素被渲染的过程当中图形处理器
必须读取和写入z值,这项技术通过固化于G e F 0 r C e4
芯片内部的硬件执行功能将z模板缓冲所消耗的内存
带宽降低为原来的1/4,以提高显卡的执行效能。
●Lightspeed Memory Architecture【I一一
NVIDIA第二代光速内存架构
提升P C图形子系统性能的一个最关键因素就是内
存带宽的限制,内存总线接口会被像素回写、像素读
取.显示刷新、A G P总线数据传输以及纹理数据传递
等多种持续性高带宽传输所占用,当这些动作中有任
何一种成为内存接口的带宽瓶颈时,最直接的反应就
是显示性能的下降。以完成一个像素渲染为例,传统
的图形架构需要从图形内存不同的缓冲区内读取不同
的数据,这其中包括ARGB(A1 Pha通道和三原色通道)
色彩数据和用于描述该像素可见度的Z值,假设在
32bit色和32bit z模板缓冲的状态下对其渲染一次,
4.可视性子系统/Z模板闭塞图元剔除(Visibility
Subsystem/Z-Occlusion Culling)
那么它所需要的渲染数据量就是1 6 b Yt e s,计算公式
如下(最理想状况):
读取:A RG B数据(8 b i t×4)+z数据(3 2 b i t)
=64bit=8byteS;
简单地讲,由于角度的关系,在3 D场景中有些像
素是无法看见的,实际上完全不必对其进行渲染。但传
统的图形架构无法对之加以判别,只能按部就班地对每
个像素一一渲染。GeForce4 Mx芯片中采用的Vi Sibil—
ity Subsystem和z—OcClusion Cu11ing技术能够对被
写入:A RG B数据(8 b i t×4)+z数据(3 2 b i t)
=64bit=8bytes:
总共:1 6 b Yt e s。由于目前大部分的游戏为了提供
渲染区域进行可见性测试,智能地判定像素的可见性,
剔除无需渲染的闭塞像素,以节省宝贵的内存带宽。 更加精美的画面和更逼真的细节表现,都采用了多重
44 NO.5,2002 New Hardware
维普资讯
产品与评测 it|lni l
第二代光速内存架构测试成绩
_珊硼■■蛐呵硼■■目I哪瞳■啊■日邺舶硼H■目目I啊_■哪■■幽
款3 D显卡的重要指标之一。一幅即时生成
■啪■¨-___■姗
~
●瞳■嵋唧—一___咖_一___
的3D图像由于取样不足( ndersamp1 ing)
会在场景中物体的边缘色彩过渡线上出现
阶梯状的锯齿,任何人都可以通过将3 D画
面截屏放大后观察到这种瑕疵,它会对画
面质量产生相当大的影响。在传统的图形
结构中,主要采用高分辨率渲染和每像素
—_■■■■■啊
1024×768 x 32blt 6043 5787 4501 6649 4907
1024 x 76B x 1∞tt
1280 x 1024 x 32blt
6o63
4756
6052
4326
4966
2631.
6868
5137
5814
3496
1280》( O24交 l 黪{警 4955
Rendered FrdIlS A1『E(FPs】 27.01
444.62
4779
26.6
401.46
3525
21.24
319.82
5520
27.37
795.56
4845
24.61
372.19
多点取样的方式降低全屏锯齿现象。对于
用户来说,将3 D画面的分辨率设置得足够
高可以弥补这一缺陷,实现这一点对显示
器的要求相当高,因此,最为常见的还是
采用增加“有效分辨率”的方法,也就是
每个像素的颜色通过多点取样来完成。
T鼓 1ar略1 脏张 礤
∞en陵frlangles AVEIX/s)
448。05 405。69 323.18;803.94 376.o9
800 x 600 144.,3 133.9 82.4 145.2 107.1
o2毒 68、 l0 2
78..5
98.7
65.8
55.5
35
1.11.1
73.8
76.5
48.3 1280 x 1024
l6oo
萋
Vl ̄
2∞ j。 5 4
4719
47.2
4169
23..B
3180
52.7
4591
33.8
4459
个像素最终渲染出来的颜色是由图
形处理器对此像素覆盖的若干区域的颜色
一
GL Exce88 1.1a
进行取样和运算后得到的,被取样的点就
是为r增加“有效分辨率”所额外需要的
点,取样的方法就决定r相邻像素点的颜
色差异,如果算法优秀,相邻像素点之间
Rate Test -j毒 4407 - 3481
5461
22
2 067
2604
133f;
3g97
5465
2242
3737
5324
2065
Polygon Count Test
.Test _
4517
19R3
5.自动预加载(Auto Pre-Charge)
看过本刊2001年12期 好“龙”配“精”鞍一KT133A
主板横向测试》的朋友们肯定对里面的“I nter1eave”预
的过渡会非常平滑,从而匀平锯齿边缘。
目前全屏反锯齿最为常见的主要有两种取样方
法:“S u pe r sam p1 i n g”和“M u1ti s a113p1 i n g”。
充电技术记忆犹新,其实GeForce4、{x中Auto Pre--Charge
的工作原理与之大同小异,它能对即将使用的显存区块
进行预先激活,图形处理器可以直接从一个显存区域跳
到另一个显存区域进行数据存取,切换时无需等待内存
预激活,节约了宝贵的数据执行时间。
S uPer sa113p1 in g给入“杀鸡用牛刀”的感觉。假设最
终屏幕3 D画面的显示分辨率为8 0 0 x 6 0 0,
SupersamP】i ng会以】024 x 768或者更高的分辨率对
图像进行取样和渲染,由于分辨率提高,每个像素点
覆盖图像的面积就减小,精度也就更高,然后将得到
的高精度图像过滤缩小后输出。由于渲染了比实际显
示更多的像素,这种取样方法会造成显卡负担加重,
引起性能下降。理论上讲2x Supersamp1 i ng需要写入
帧缓存数据会提升为原来的两倍,而4 x
SuPer samp1 ing更是达到惊人的四倍,如此一来造成
显卡性能的急剧下降也就不足为奇了。
VIDIA从一开始就更偏向于采用Mu1ti sampling,
在G e F o r c e 4系列处理器中内置有“A c c u v i e w
M u l t i s a m P 1 i n g”(我们理解为“改进型的
Multisamp1ing”)。Mu1ti samp1ing通过在图形处理器
6。快速Z模板数据清零(Fast Z-Clear)
将z模板缓冲中的旧数据清除掉也会耗费相当部
分的显存带宽,GeForce4 Mx中的Fast Z-Clear技术
能够将数据清除时间大大缩短,提高显卡的工作效率。
不难看出,3DMark 2001中除了仅配备SDRAM显存
的MX4 2 0以外,MX4 6 0和MX44 0的成绩都明显高于
GeForce2 Ti,与Ti200的成绩相当接近,这充分说明
GeForce4 MX新架构所带来的威力。而DroneZMark仍
然由Ti200独占鳌头,MX440和MX460紧随其后,MX420
尽管成绩垫底,但表现不俗,居然逼近了G e F o r c e 2
Ti。在Quake Ill TeamArena测试中MX460更是表现神
中嵌入智能电路,专门用于处理“额外”的样本采集,
再配合前面我们提到的第二代光速内存架构,能够以
较小的性能牺牲换取更加精美的画面。从下面这几幅
示意图我们来看看Accuview Multi sampling所提供的
更优化取样方法。
勇,将T i 2 0 0抛到了脑后,这与其高频率高带宽密不
可分。G L Ex c e s s中我们针对填充率、多边形数量和
内存带宽作了专项测试,除了多边形数量一项外,其
余两者MX460都占据了第一,从性能上讲,GeFor ce4
Mx芯片与CeForce3 Ti200并不属于同一档次,MX460
取得的好成绩与其显存的高执行效率密不可分。
●NVIDIA Accuview技术一一高分辨率
一
传统2x和Quincunx AA取样模板(GeForce3中使用)
Antialiasing子系统
毋庸置疑,图像抗锯齿能力目前已经成为衡量一
微型计算机2002年第5期 45
维普资讯
㈧llard ̄ 产品与评测
传统的2 x模式每像素采用r 2个取样点, ~cc uv1ew Mu1 Li sampl ing的另一项重要功能就是
Ⅵulti sampl1ng的特性决定了点l和点2都取自同一个 Ani sotropi C Filtering(各向异性过滤)。通常情况
纹理元素的颜色,而这个纹理元素的色彩是以假设位
下,3 D场景内的物体与其表面纹理贴图理想大小比例
于像素的中心位置获取的,那么,点1的取样由于其 为1:l,这样每一个像素点都能对应一个纹理元素。但
位置的恰到好处是正确的,但点2所处的纹理色彩与
这只是理想状况,很多时候会出现物体表面小于纹理
其取样所得值并不一定相同,这就造成r最终渲染色
贴图或者反过来,这样会影响最终渲染画面的品质。
彩的偏差。以此类推,Q ui n c un x^、(五点梅花)也存 Ani sotropi c Fi l Le ri ng能够智能调节物体表面与纹
在相同的问题.。 理贴图之间大小的比例,通过它能够将一张很大的纹
理贴图强行放到一个很小物体的表面上,使最终画面
-■
品质更高、细节更加丰富。
这个单元的测试结果让我们非常满意,Q u a k e Ⅲ
TeamArena中随着分辨率的提高,MX460的成绩逐渐逼近
并超过n 2 0 0,这说明在采样点数量急剧增加的状态下,
Acc LIview Multisampling中的2x和Ouinc
■
LInx
Acc uview Multi sampling发挥出其“智能化”。的优点,
AA取样模板
再配合前面提到的第二代光速内存架构,将内存带宽的
Acc uv Jew Multj sampl ing的功劳在于将取样点的 运用发挥到极致,从而取得了优异的成绩。Aq uamark是
位置加以移动,使两者取样值与其所在位置的真实值
一
个较为特殊的测试软件,它能提供高达4 0 M B的纹理
更加接近,从而使渲染的结果更加精确。
数据,这在日常运用或者流行的3 D游戏中都是不常见
的。尽管高分辨率下MX460的执行效率要好于n200,但
一一
是由于不支持该测试中使用的Pix el Shade r特性仍然
造成其最终成绩的不理想,实在让人扼腕叹息。
●软硬结合的增强型nView技术
其实说到n V i e w技术大家应该都不陌生,在
GeForc e2 MX上通过它支持双头显示功能,如今在新推
独有的4 x S渲染模式演示画面
出的G e Fo r c e4系列芯片组中它得到了保存和发展。为
我们已经重复过多次,反锯齿的原理就是决定一 r使自己的多屏显示结构更加健壮,N V 1 D 1 A在
个像素最终色彩时采用多点取样的方法,取样点覆盖
G e F o r c e 4芯片中集成了更多的硬件组件,它们包括:
的范围越大,最后所得值的真实程度也就越高,4 x S
双35OMItz RAMDAC、双cRT流水线、集成的视频处理引
值与传统的4x相比提高丫50%的取样点覆盖率,因此,
擎、双LVDS传送器(驱动双路LCD显示面板)和TMSD传
它的画面会更加精美。可惜的是,目前4 x S渲染模式 送器(驱动平板显示器)等等。与此相对应,nVi ew软件
仅能用于D3D中,我们期望在不久的将来0p enGL游戏 也得到了很大程度的增强,它包括下面一些新特性:
也能展现出如此精美的画面。
通过向导方
高分辨率Antialiasing子系统性能测试成绩
便快捷地对多个
屏幕进行独立控
制,即便是新手
也容易使用。使
用多屏幕扩展显
示时,有可能出
现窗口位于两个
显示器之间,每
台显示器只能看
多屏显示设置向导
见窗口的一部分,
n V i e w能将窗口指定到您所需要的显示器上。而允许
nV j ew软件与视窗管理器紧密集成后用户只需要通过右键
点击视窗顶部标题栏即可完成多种不同的特别扩展功能。
我们不妨将多桌面功能视为单显示器用户的多屏
显示解决方案。如果用户需要在一个显示器上同时打
开数十个全屏化窗口并在其中进行切换无疑是非常痛
46 NO.5,2002 New Hardware
维普资讯
产品与评测 lrd
苦的事情,n、i ew
最多允许用户自
行定义32个桌面,
可以将特定的应
用程序指定到特
定的桌面上显示。
C JDecoDE l
用户还可以对这
些卓面进行有针
对性的命名和背
景个性化,要想看
到需要的内容只
需要在任务栏的
视窗管理器和应用程序管理器
n、i ew图标上用鼠
标加以切换即可,
这可是提高工作效率卓有成效的解决方法。
对于那些
觉得切换桌面
罢= S。- o 。S-^
VPE工作流程图
仍然麻烦的用
。苫。。z母}
户来说,透明化
所面临的视频运用机会是很少的。、P E给我们带来的
窗口是他们在
打开大量窗口
后迅速找到隐
桌面管理器
新特性主要有以下几点:
1.完全硬件MPEG2解码
用通俗的说法来讲,GeFor c e4将一台完整D、 D机
的功能全部集成到芯片里,除r常见的i D c T(反转余
弦变换)、MoLi on compensatj on(运动补偿)外,它将
原来由处理器担任的l nverse Quanti zation(反转量
子化)步骤也一并交由图形芯片处理,留给处理器做
藏内容的最便
捷方法,透明度
可以按照使用者的需要自行调节。
除了上面提到的这些功能以外,局部放大、功能
热键定义、数码明亮独立调节等一系列功能都可以简
单点击鼠标通过n V i e w软件实现。测试中我们不得不
为这些小巧灵活的功能拍手叫绝。看来,A T l公司引
以自豪的H y d r a、 i si on功能这次是碰上新对手了。
的仅仅是音频数据解码和图像c S S解密,很大程度上
降低了DV D播放对电脑硬件的要求。在我们的测试中,
播放同一段DVD片断时,Ge Fo r c e 2 Ti的处理器占用
通过透明化的窗口能够直接看到原本被遮盖住的画面
●Video Process Engine(VPE)一
视频处理引擎
NVIDIA
率为34%~37%左右,而GeFor c e4 MX440则降低为
28%~31%,、 PE功不可没。
请注意,VPE功能将只存在于G e F o r c e4 MX和
2.高级自适应反交错
现在我们的电脑显示器都是逐行扫描工作方式,当
显示隔行扫描图像时,有一半的扫描线会处于空闲状
GeFoFce4 Go芯片中,这是因为顶级的GeFor ce4 Ti
将针对点放到了顶级游戏发烧友和3 D爱好者身上,它
微型计算机2002年第5期47
维普资讯
1 产品与评涌
态,、P E会根据图像源来决定用何种反交错方式来显示
画面以填满这些空闲的扫描线位置。通常静态画面使用
统后对系统整体性能的影响。
传统测试的结果基本与我们事先预料的结果相符
合,GeForCe4 MX460与GeForCe3 Ti 200不分伯仲。
GeForCe4 MX全面替代GeF0rCe2 Ti已成定局,MX420
w e a v e一一即将相邻的两帧图像合为一帧显示;动态画
面使用B O b——即将每一帧图像在垂直方向上放大两倍。
3.高级缩放与过滤功能
VPE结合了水平5级和垂直3级的缩放引擎,可以
将视频非常平滑地放大和缩小,使不同分辨率的视频
吃亏于仅仅配备了普通S D R AⅥ显存,但良好的内存与
核心执行效率仍然起丁不小的作用,这为其与配备
DDR显存的GeF0 rC e2 Ti一争高低立下J,汗马功劳。
源可以以相同的最终分辨率输出高保真的视频画面,
这一点我们在VIDE02O00的Qua1jty Te st测试中深有
体会,各种缩放比例下图像中的线条都清晰可辨,一
改过去N V I DI A显卡图像缩放质量不高的通病。
一
测试结论
●GeForce4 MX—u-迈向多元化的第一步
在2002年2月6日以前,也许每个人都会说NVIDIA是
个只注重游戏FPS速度的狂热者,但GeForce4 MX的推出
却意味着N V l D l A已经意识到单纯提高显卡的速度并不是全
4.适合未来HDTV和高档电视的高清晰度分量输出
我们最常见的复合视频将亮度和色度信号合并为
一
个信号传输,从而导致颜色变化和模糊。S—V i d e o
面占领Pc市场的长远之计。GeForce4Ⅵx的高集成度让人
吃惊,它将ATI和M( A的优点融于一身,一次性跨越J,别人
需要几代产品才能走完的路,这种研发实力的确不容小
视,其完善的多媒体功能足以满足中低端消费者的需求。
的带宽将两者分开传送从而获得比较锐利的图像,但
由于s—Vi d e o的带宽只适合传送低分辨率的模拟信号,
于是分量视频应运而生,它使用一个亮度信号+两个
色度信号获得最大的带宽和高级视觉效果。V P E中集
成有1 024×768分辨率的电视机编码器,可将RGB格
式信号转换成电视广播中使用的Y P r P b格式,直接输
出到带分量输入端子的HDTV或TV上以获得更好的D、D
●低价的家庭媒体中心解决方案
从G eFO r C e4 Mx的定位中我们能够很清晰地分析
出NVI DI A的市场策略,Mx420尽管运行频率较低,但
芯片性能并没有缩水,其低廉的价格再搭配同样价格
低廉的SD RAM肯定能够获得0 E、1客户的青睐,能够卓
有成效地进一步巩固和拓宽\、1 I D I A在品牌机市场的占
有率。而M x44 0和M x4 60更适合囊中羞涩但又注重显
卡性能的中低端用户,它们的性能无疑让人激动,而
它们的售价也同样平易近人,在3 D游戏和多媒体创作
间取得了一个良好的平衡点,从这层意义上讲,
GeFOrC e4 Mx超越了NVIDI A以前发布的所有产品。
图像,由于本次送测的显卡并没有提供9针分量输出
线,因此我们无法完成相应测试。
除了上面着重谈到的几点外,V P E还拥有实时视
频捕获和回放的功能,这个概念在以前的评测报告中
已经得到详尽的解释,故不再多作说明。
传统项目测试
在这部分里我们主要采用了zD、SPEC等公司的一
些标准化测试软件,目的在于考察单独更换图形子系
传统项目 试
●激动中的遗憾
在3DMark2001和Aquamark的测试中,
我们发现G e F 0 r C e 4 M x显卡不支持
DirectX 8.1中包括PiXel Shader在内
CC、I1『lngIor薅j 幢 、32.8 32.5
297
61.62
30.73
22.26
34.3
295
58.O4
30.11
2O.4l
34.5
300
43.4l
32.2
293
85.Ol
麓
Sysmark2O0 O
Awadvs-04
鬣 囊 赣参2 薹 懈羹撬≯辣 一6o.毒
299
61.87
的多个特效,这导致它在某些测试中的
效果比不上Ge F0 r C e3 Ti 200,这也许是
本次测试中我们最为遗憾的一点,NV I D I A
将这些特效放到了GeForC e4 Ti中并重新
命名为“第二代nfi nit e Fx引擎”,此举
的目的是为了清晰地告诉大家未来的准
确市场定位,GeFor C e4 Mx只适合主流用
户使用,GeF0r C e4 Ti则是为那些骨灰级
鲫
Dx-06
HedMCAD-01
藕
30.6
21.88
蠢羲固 鞠
’ ?  ̄7掩2 - 您
13.酗
3.77
帮 两。
29.O2
27.O2
错
3O.18
22.26
翻 凌l 羹 8一. 43 4。8.103 8.04。4
12.
3.78
黟 }。 羹 。一
3D W1nBench 2000 Processor Test
13 31
3.81
13.29
3.75
17,35 .
3.74
玩家所准备的,尽管名字中都一个
G eF0 r C e4,但两者根本不能相提并论。从
我们的测试结果也可以看出,G e F 0 r C e 4
a I。I 20o0 194
696
170
~一一
98.4
652
2:00
_- _-__-__●-_●-
168
_●- -● --H_--一
Mx在性能上与GeForCe3 Ti系列仍然存在
一
Business 6ralYalcs WI ̄rK 99 702 678 707
定的差距,它仅仅被准确的定位于从
釉咖固_哇 酹瞳黼畴拍撩 黧 I235: 11250 x|12 30囊 12 —40 12502i
性能和功能上取代GeForce2 Ti。 田
48 NO.5,2002 New Hardware