2024年8月30日发(作者:仵文丽)
3DMark Vantage
对于游戏发烧友和评测者来说,3DMark无疑是最不
可或缺的测试软件及参考指标。而每一代3DMark测试软件,
都是同时期3D显卡的噩梦。出现这种情形,是因为它的故
意刁难,还是它过于前卫的展现未来?
当DirectX10随着微软2006年11月30日首发的
WindowsVista操作系统面世时,整个电脑游戏界似乎都还根
本?]有准备好迎接它的降临。在GPU方面,当时只有
NVODOA一家推出了唯一的G80核心GF8800GTX,在游戏
方面,所有声称支持DXl0的大作都不约而同的首先发布了
DX9版本,并将DX10升级补丁的发布时间做无限期延后。
这种规格、硬件、游戏之间磕磕绊绊的关系延续至今已有近
一年半之久。
令人感兴趣的是,即便像3DMark这个每次赶在规格最
前沿的3D游戏图像性能指标软件,这次也极有耐心的蛰伏
着,直到微软发布了Windows VistaSPl升级版后,2008年4
月28日,Futuremark才正式推出2DMark Vantage v1.00(以下
简称3DMarkV)。与以往采用年份标注版本号的方式不同的
是,它采用了“优势”一词来作为新版本的称谓。这也令人
不由自主的联想到微软的“远景”(Vlst8)。事实上,他们两
者之间的关系的确有些“暧昧”,3DMarkV的运行平台只支
持Windows Vista SP1。其具体运行环境要求如下:
-处理器 要求支持SSE2指令集,推荐双核处理器,性
能需相当于Intel Core 2 Duo E6600或AMD Athlan 64×
26000+;
-显卡:要求全面兼容DX10规格;
-显示器运行全部测试需1920×1200
-内存,最少1GB,推荐2GB或更多
-硬盘:1GB空闲空间
-系统:仅限WindowsVista SP1
注意,如果Vista没有升级到SPl版本,运行3DMarkV
将会出错退出。此外尽管WindowsVista SP1引入了D×10.1
规格,而且目前也得到了ATI的HD3800系列显卡的支持,
但Futuremark并未就D× 10.1的支持问题做明确表态,因
此它目前的版本应该还无法利用D×10.1的新特性。
新测试方式解析
3DMarkV在安装后的首次运行会弹出注册画面,根据输
入的授权码的不同,将自动激活不同的版本:(图1)
试用版Trial
通过点击版本图标,将连接到FutureMark的注册网页,
简单的输入你的有效电子邮件地址,即可通过邮箱获得相应
的试用授权码。它只提供单次测试的运行模式,测试相关的
各种选项也无法进行调整。
基础版Basic
这个版本仅授权给个人用户使用,通过点击版本图标,
将连接到FutureMark的付费购买网页,价格为695美元。它
提供了可选循环测试次数的功能,同时开放了性能级测试预
设模式。
高级版Advanced
这个版本同样仅授权给个人用户使用,但需要付费购
买,价格为19.95美元。这个版本可对所有测试及设置项进
行操作。专业版Professional
对于商业用户及相关用途,合法的授权版本是专业版,
同样需要付费购买,而价格则高达495美元,购买时可选择
下载版本或CD-ROM光盘版本。它在高级版的基础上特别
提供了高级测试脚本功能,此外还可获得测试软件相关的所
有功能及服务。网站版Site Ucense
这是为PC集成商或OEM厂商提供的专业版批量授权服
务,厂商可通过此种方式购买特定数量的批量授权,用于与
主板或整机产品进行捆绑销售。
在功能方面,高级版和专业版(网站版)是一样的,他们
相对于免费基础版来说开放了以下功能
-可选用所有预设选项
-可自行定制测试选项
-可执行所有特性测试
-无限制的循环测试次数
-专业的联网功能
很显然,上述功能说明也就是付费基础版所无法提供
的。
测试预设模式解析
与以往3DMark仅提供一个默认测试预设模式不同的
是,此次3DMarkV提供了四种测试预设模式,分别针对从
入门级到至尊级的不同硬件性能配置环境。那么他们在测试
特性上有怎样的具体差异呢?
入门级-Entry
入门级测试预设模式的特点是分辨率为1024×
768(4:3),这与3DMark05以前的预设相仿。材质过滤为“优
化”,其实就是初级的三线过滤,多重采样次数和各向异性
过滤为1,相当于关闭或无效果。(图2-1)
在材质、投影、投影分辨率、着色等渲染质量设置上都
设为最低的“入门级”。这对显卡的处理性能要求也是最低
的,当然,3D画质也较为普通。
在后期处理上,其处理比例为1:5。特性方面关闭了动
态模糊、景深和GPU模拟这三个选项。
性能级-Pedormance
入门级测试预设模式采用的是1280xt024(54)的分辨率,
这与前一代3DMark06一致。(图2-2)
它在渲染质量设置上都调整为高一档的“性能级”,实
际画质上会有明显提升,不过对显卡的性能要求也更高。
后期处理的比例被提高到12,处理量更大,而且开启了
所有后期特效处理,包括:
-Bloom(灿光)
-Streaks(条纹)
-AnamorphicFlare(变形强光)
-Lens Flare{强镜头光)
-LentichareHaod(凸镜光晕)
-Motion B0ur(动态模糊)
-DOF(景深)
-FOG(烟雾)
-Color Noise(色噪)
高级-Higb
这是3DMarkV引入的新测试预设模式。在分辨率上设
置为16:10宽屏,对应22英寸1680×1050分辨率。在多重
纹理取样次数上设置为2,同时将材质过滤设置为8倍各向
异性过滤,这将显著提升3D画面中斜向材质的质感和平顺
程度。它对GPU的性能需求有一定的提高。
在材质质量设置上再提高了一个档次到“高级”,可以
预期它将对显存容量和位宽有更高的要求,图像数据处理量
也会显著提升。
至尊级-Extreme
很抱歉,我们的测试系统中暂时没有准备它所要求的
1920×1200分辨率的显示设备,因此无法对其进行实际测
试。但可以肯定的是,它是针对FullHD全高清分辨率而设,
材质质量会继续提高一个档次到“至尊级”。 据此推测,
它会需要双GPU的显卡系统才能应对,诸如传统的SLl/CF
双卡并联,或使用单卡多GPU型号如GF9800GX2或
HD3870X2,他们的显存容量和位宽也因此加倍,可以提供
更高的数据处理能力。
除此之外,它还将多重纹理采样次数提高的4,各向异
性过滤提高到16,因此画质表现将更上一层楼。不过在后期
处理比例上,它降低为1:5。
性能测试项目解析
3DMarkV提供了两项图像测试、两项CPU测试,与包
括四项图像测试的3DMark06相比,此次3DMarkV在文件
容量上也-有一定的“瘦身”。接下来就让我们进行逐一剖析。
图像测试1-Jane Nash
GTl/Graphic Testl(图3-1)
多年来,NVODOA和ATI在各自的测试演示片中选用
的虚拟美女们,无疑让相关的技术和产品关注度获得了若干
倍的放大效应。此次3DMarkV终于从善如流的为发烧友们
带来了一位女主角珍妮,南希。
这个山洞逃离场景用于纯GPU游戏性能测试,它的特
点是引入了高精度的、基于物理特性的体积渲染,场景中拥
有大量静态物体,包括各向异性材质的金属、塑料和混凝土
等。此外在后期处理效应和GPU物理加速模拟方面,还提
供了包括具备反应效应的布??、物理粒子效果(图3-2),全新
的互动式水体模拟利用分层渲染的水面反射和折射,展现了
大幅度的波浪和水沫形态。(图3-3)
当然各位可能首先会更多的关注女主角的表现。在角色
动态细节方面,3DMarkV为珍妮。南希投注了不少精力,在
3D建模的细节方面表现足够到位(除了欧美风格传统的魔鬼
身材,面孔,也更接近“天使”了),而且后期处理特效让人
物拥有复杂的动态皮肤渲染效果,细节表现令人印象深刻。
(图3-4)
图像测试2-New CalicoGT2/Graphic Test 2(图4-1)
新凯利科行星上空演绎了一场情景极为:隆阔的太空入
侵战,Damocoes太空巡洋舰及太空战机在行星轨道上高密
度的小行星带险象环生,而3D显卡也碰上了前所未有的高
负载处理场景――场景的最大特点是拥有大量移动对象,成
千上万的陨石每一个都需要完整的3D物件渲染处理。(图
4-2)
这个场景同样针对纯GPU游戏性能来设计,它所引入
的特效包括针对飞船的过程材质以及针对陨石创建的过程
几何处理,而高级后期处理及GPU物理加速模拟将体现在
行星表面爆炸的冲击波、烈焰风暴及大气蒸发等特效。至于
处于远景的星云,则采用了最新的光线追踪技术。(图4-3)
CPU测试1-AOTest
CTl/CPUTest 1(图5-1)
为了体现CPU的游戏性能及实际游戏需求的最新进展,
3DMarkV在CPU测试中引入了新的测试模组。这个被称作
人工智能?y试的环节,将极度依赖CPU的多线程/多核心
处理能力,测试中的人工智能主要体现在针对3D寻路算法
的协助,同时提供了最顶尖的无锁死任务计划,将多核心
CPU的所有潜能榨取出来。
与之前3DMark06的CPU测试中改用640x480最低分辨
率以降低图像性能关联性的方式不同的是,此次CPU测试仍
保持特定测试预设模式的分辨率,但场景采用了固定的渲染
帧速率以确保图像负载的一致性。在这项测试中,每一架小
飞机都运用了独立的人工智能处理,帮助它穿越门洞并获得
行进路线,同时要避免碰撞。测试通过每秒可执行的操作数
OPS(Opera-tlons Per Second)来计算得分,CPU的性能表现更
多的依赖于处理线程/核心数而不是主频,这也预示着未来
游戏设计的发展方向。(图5-2)
CPU测试2-PhysicsC2/CPUTestN(图6-1)
这项CPU游戏性能测试集中于次世代的物理运算工作
量,包括流体、刚体、柔体、布料及融合等,目的是充分利
用多核心CPU的处理能力。
值得注意的是, 此次3DMarkV继续与物理加速技术公
司Ageia合作,同时打上了PhysX的Logo及安装了相关的
驱动程序。如果测试系统中安装了硬件物理加速芯片(PPU),
那么此项测试还将真正利用其物理运算加速功能。
测试首先会进入一个”预热”过程,然后开始正式测试。
这时每架小飞机都沿着各自的飞行路线前进,同时会发生一
些碰撞,碰撞后的小飞机会碎裂,这部分模拟了刚体碰撞的
效果。具备弹性的浮筒门也会在飞机残骸撞上它们时给予真
实的反应,这部分模拟的是布料之类柔性物体的碰撞效果。
测试的得分同样来自于每秒可处理的操作次数。(图6-2)
显示特性测试
3DMarkV引入了六项显示特性测试(Feature Tests),虽然
他们的测试结果并不计入3DMarkV的最终测试成绩得分,
但从中可以了解自己的3D显卡是否可以支持或运行好这里
引入的全新3D特性。
Test1/Texture Fill
材质填充测试体现出GPU的材质填充率,直接反映了
游戏在高画质设定下的硬性图像数据处理能力,具体来说,
就是在DXl0统一渲染架构的显卡中渲染单元(Shader)的性能
如何。测试中的颜色值从一个小纹理中读出,同时利用了多
纹理协作功能。这项测试也对应着DX9.0C规格之前非统 渲
染架构下的Pixe6Shader和Vetex Shader测试。(图7-1)
Test2/Color Fill
色彩填充测试体现出GPU的色彩填充率,色彩输出采
用a1-pha混合方式。这项测试的意义在于,渲染管线在实际
运作中需要将顶点、纹理像素、光照、物体表面材质反射光
等来源的颜色进行混合并生成显示颜色,但各颜色的比例是
需要运算的。这项测试也对应着DX9.0C之前非统渲染架构
下的Pixel Shader和VetexShader测试。(图7-2)
Test3/GPU POM
光线追踪测试通过一幅高分辨率高差地形图,通过像素
着色器来进行光线追踪渲染,多光源照射下也将生成复杂的
阴影效果。这是之前3DMark测试软件从未出现过的一项全
新测试,而光线追踪技术虽然早已出现,在限于硬件性能一
直没有实时渲染的可实现性,而今则成为最热门的图像渲染
技术。从测试中可以看到,在这项技术的实现下,地形可以
显示出真实的立体感。(图7-3)
Test4/GPU cloth
通过GPU的几何着色器来模拟物理加速运算,测试画
面中 的旗帜被风吹动后会显示出平顺自然的卷曲飘动布
料效果。我们知道Ageia的PhysX物理加速技术其实是软件
编程界面与硬件运算加速芯片组合的产物,不过其运算其实
可以借助CPU或GPU来完成,只是原来的运算速度或效率
无法像专门设计的PPU来的高。不过目前GPU的发展突飞
猛进,特别是Ageia已经被NVIDIA收购,因此未来GPU
的物理加速运算技术很可能会得到迅猛发展。(图7-4)
Test5/GPU/Particles
粒子系统可模拟无规则的自然景观现象,例如雨雪效果
等。这些运算在传统上需要占用大量的CPU资源,而在这项
测试中则借助GPU的浮点运算能力来进行粒子系统的生成
测试。测试画面中可以看到,由动态粒子构成的人体形态不
断变化角度。而据此前一些测试对比,GPU的粒子运算效率
要远远高于通用CPU的运算效率。(图7-5)
Test6/GPU Perlin Noise
Perlin Noise(柏林噪声)是由Ken Per师发明的一种噪声
函数,它能很好地模拟火焰、云彩、奇形怪状的岩石,以及
树木和大理石表面等。在3DMark06中就引入了此项测试。
(图7-6)
分值计算方法及实测
3DMark测试的结果通常都是由一个总分及若干子系统
得分构成,查询详情还可以看到各独立测试项的成绩。这些
分值是根据特定的公式及独立测试项的结果计算而来。(图
8-1)
3DMarkV中由于引入了不同的测试预设模式,因此在此
次的总分分值前会加注一个字母,代表相应的?y试模式,即
入门级(Entry)、性能级P(Performance)、高级H(High)、至尊
级×(eXtreme)。
GPU得分是通过图像测试成绩的计算公式得出,其中
“C”为固定比值,“F”,为图像测试中的平均画面帧数率
(FPS,Frame PerSecond)。
CPU得分是通过相应的CPU测试成绩的计算公式得出,
其中“C”为固定比值,“O”为每秒执行操作数(Operation Per
Sec-ond)。
最后的总分通过另外一个总分公式计算而来。其中“W”
为对应不同测试预设模式的比例系数,入门级与性能级的比
例系数为GPU/0.75、CLU/0.25;高级的比例系数为GPU/0.85、
CPU/0.15、至尊级的系数为GPU/0.95、CPU/0.05。可以看到,
随着测试预设模式级别的提升,CPU的比重逐步下降,GPU
的比重则同步上升。这充分表明3DmarkV认为高画质下的
游戏性能表现中,GPU的重要性会越来越大于CPU。此外,
不同测试预设模式下得出的分数只适用相同模式下的成绩
横比,交叉对比没有意义。
以下测试范例基于Q6700@3GHz及GF9600G7的系统
进行,然后在第二次测试中再添加一块Ageia PhysX100物理
加速卡。对比两者的成绩,可以发现在CPU Test2中的物理
运算步数,通过物理加速卡的辅助而提升了约76%。要知道
我们在测试中使用的四核酷睿2处理器已经超频运行在
3GHz,而一片售价不到千元的PPU卡竟然可以带来如此惊
人的物理运算性能提升。(图8-2、3)
结语
在3DMarkV发布后不久,第一个HotFix补丁版本1.0.1.1
就推出了。此版本的主要变动是为高级版增加了离线查看保
存的测试记录的功能,同时去掉了测试软件中的一些内置广
告,估计是因为这些内容影响到商业批量授权。而得分标准
方面并没有任何影响,与1.00版兼容。
由于3DMarkV所展现的游戏图像表现如此惊人,很多
玩家也在探问这个引擎是否会用于游戏。目前Futuremark还
没有对这个引擎有太多说明,不过今年年初该公司已经宣布
将会涉足游戏开发领域,看起来不久之后这些惊人的画面特
效将不仅仅局限在测试软件中了。3DMarkV引擎与目前业界
知名的UE3、Cryengine2、Source等的最大区别,是它完全
支持原生DX10特性, 甚至有可能是DX10.1规格,这从它
无法运行在除Vista SP1之外的系统平台上或许有所佐证。
不过,正如本文开关所说,3DMark无论是有意还是无
心,它都是同时代3D图像硬件的性能噩梦。要想将它引以
为傲的图像引擎应用到游戏中,除了充分发挥特效所能带来
的图像魅力之外,如何优化引擎确保主流硬件能获得流畅的
画面表现,那将是一条需要付出更多努力的路。
2024年8月30日发(作者:仵文丽)
3DMark Vantage
对于游戏发烧友和评测者来说,3DMark无疑是最不
可或缺的测试软件及参考指标。而每一代3DMark测试软件,
都是同时期3D显卡的噩梦。出现这种情形,是因为它的故
意刁难,还是它过于前卫的展现未来?
当DirectX10随着微软2006年11月30日首发的
WindowsVista操作系统面世时,整个电脑游戏界似乎都还根
本?]有准备好迎接它的降临。在GPU方面,当时只有
NVODOA一家推出了唯一的G80核心GF8800GTX,在游戏
方面,所有声称支持DXl0的大作都不约而同的首先发布了
DX9版本,并将DX10升级补丁的发布时间做无限期延后。
这种规格、硬件、游戏之间磕磕绊绊的关系延续至今已有近
一年半之久。
令人感兴趣的是,即便像3DMark这个每次赶在规格最
前沿的3D游戏图像性能指标软件,这次也极有耐心的蛰伏
着,直到微软发布了Windows VistaSPl升级版后,2008年4
月28日,Futuremark才正式推出2DMark Vantage v1.00(以下
简称3DMarkV)。与以往采用年份标注版本号的方式不同的
是,它采用了“优势”一词来作为新版本的称谓。这也令人
不由自主的联想到微软的“远景”(Vlst8)。事实上,他们两
者之间的关系的确有些“暧昧”,3DMarkV的运行平台只支
持Windows Vista SP1。其具体运行环境要求如下:
-处理器 要求支持SSE2指令集,推荐双核处理器,性
能需相当于Intel Core 2 Duo E6600或AMD Athlan 64×
26000+;
-显卡:要求全面兼容DX10规格;
-显示器运行全部测试需1920×1200
-内存,最少1GB,推荐2GB或更多
-硬盘:1GB空闲空间
-系统:仅限WindowsVista SP1
注意,如果Vista没有升级到SPl版本,运行3DMarkV
将会出错退出。此外尽管WindowsVista SP1引入了D×10.1
规格,而且目前也得到了ATI的HD3800系列显卡的支持,
但Futuremark并未就D× 10.1的支持问题做明确表态,因
此它目前的版本应该还无法利用D×10.1的新特性。
新测试方式解析
3DMarkV在安装后的首次运行会弹出注册画面,根据输
入的授权码的不同,将自动激活不同的版本:(图1)
试用版Trial
通过点击版本图标,将连接到FutureMark的注册网页,
简单的输入你的有效电子邮件地址,即可通过邮箱获得相应
的试用授权码。它只提供单次测试的运行模式,测试相关的
各种选项也无法进行调整。
基础版Basic
这个版本仅授权给个人用户使用,通过点击版本图标,
将连接到FutureMark的付费购买网页,价格为695美元。它
提供了可选循环测试次数的功能,同时开放了性能级测试预
设模式。
高级版Advanced
这个版本同样仅授权给个人用户使用,但需要付费购
买,价格为19.95美元。这个版本可对所有测试及设置项进
行操作。专业版Professional
对于商业用户及相关用途,合法的授权版本是专业版,
同样需要付费购买,而价格则高达495美元,购买时可选择
下载版本或CD-ROM光盘版本。它在高级版的基础上特别
提供了高级测试脚本功能,此外还可获得测试软件相关的所
有功能及服务。网站版Site Ucense
这是为PC集成商或OEM厂商提供的专业版批量授权服
务,厂商可通过此种方式购买特定数量的批量授权,用于与
主板或整机产品进行捆绑销售。
在功能方面,高级版和专业版(网站版)是一样的,他们
相对于免费基础版来说开放了以下功能
-可选用所有预设选项
-可自行定制测试选项
-可执行所有特性测试
-无限制的循环测试次数
-专业的联网功能
很显然,上述功能说明也就是付费基础版所无法提供
的。
测试预设模式解析
与以往3DMark仅提供一个默认测试预设模式不同的
是,此次3DMarkV提供了四种测试预设模式,分别针对从
入门级到至尊级的不同硬件性能配置环境。那么他们在测试
特性上有怎样的具体差异呢?
入门级-Entry
入门级测试预设模式的特点是分辨率为1024×
768(4:3),这与3DMark05以前的预设相仿。材质过滤为“优
化”,其实就是初级的三线过滤,多重采样次数和各向异性
过滤为1,相当于关闭或无效果。(图2-1)
在材质、投影、投影分辨率、着色等渲染质量设置上都
设为最低的“入门级”。这对显卡的处理性能要求也是最低
的,当然,3D画质也较为普通。
在后期处理上,其处理比例为1:5。特性方面关闭了动
态模糊、景深和GPU模拟这三个选项。
性能级-Pedormance
入门级测试预设模式采用的是1280xt024(54)的分辨率,
这与前一代3DMark06一致。(图2-2)
它在渲染质量设置上都调整为高一档的“性能级”,实
际画质上会有明显提升,不过对显卡的性能要求也更高。
后期处理的比例被提高到12,处理量更大,而且开启了
所有后期特效处理,包括:
-Bloom(灿光)
-Streaks(条纹)
-AnamorphicFlare(变形强光)
-Lens Flare{强镜头光)
-LentichareHaod(凸镜光晕)
-Motion B0ur(动态模糊)
-DOF(景深)
-FOG(烟雾)
-Color Noise(色噪)
高级-Higb
这是3DMarkV引入的新测试预设模式。在分辨率上设
置为16:10宽屏,对应22英寸1680×1050分辨率。在多重
纹理取样次数上设置为2,同时将材质过滤设置为8倍各向
异性过滤,这将显著提升3D画面中斜向材质的质感和平顺
程度。它对GPU的性能需求有一定的提高。
在材质质量设置上再提高了一个档次到“高级”,可以
预期它将对显存容量和位宽有更高的要求,图像数据处理量
也会显著提升。
至尊级-Extreme
很抱歉,我们的测试系统中暂时没有准备它所要求的
1920×1200分辨率的显示设备,因此无法对其进行实际测
试。但可以肯定的是,它是针对FullHD全高清分辨率而设,
材质质量会继续提高一个档次到“至尊级”。 据此推测,
它会需要双GPU的显卡系统才能应对,诸如传统的SLl/CF
双卡并联,或使用单卡多GPU型号如GF9800GX2或
HD3870X2,他们的显存容量和位宽也因此加倍,可以提供
更高的数据处理能力。
除此之外,它还将多重纹理采样次数提高的4,各向异
性过滤提高到16,因此画质表现将更上一层楼。不过在后期
处理比例上,它降低为1:5。
性能测试项目解析
3DMarkV提供了两项图像测试、两项CPU测试,与包
括四项图像测试的3DMark06相比,此次3DMarkV在文件
容量上也-有一定的“瘦身”。接下来就让我们进行逐一剖析。
图像测试1-Jane Nash
GTl/Graphic Testl(图3-1)
多年来,NVODOA和ATI在各自的测试演示片中选用
的虚拟美女们,无疑让相关的技术和产品关注度获得了若干
倍的放大效应。此次3DMarkV终于从善如流的为发烧友们
带来了一位女主角珍妮,南希。
这个山洞逃离场景用于纯GPU游戏性能测试,它的特
点是引入了高精度的、基于物理特性的体积渲染,场景中拥
有大量静态物体,包括各向异性材质的金属、塑料和混凝土
等。此外在后期处理效应和GPU物理加速模拟方面,还提
供了包括具备反应效应的布??、物理粒子效果(图3-2),全新
的互动式水体模拟利用分层渲染的水面反射和折射,展现了
大幅度的波浪和水沫形态。(图3-3)
当然各位可能首先会更多的关注女主角的表现。在角色
动态细节方面,3DMarkV为珍妮。南希投注了不少精力,在
3D建模的细节方面表现足够到位(除了欧美风格传统的魔鬼
身材,面孔,也更接近“天使”了),而且后期处理特效让人
物拥有复杂的动态皮肤渲染效果,细节表现令人印象深刻。
(图3-4)
图像测试2-New CalicoGT2/Graphic Test 2(图4-1)
新凯利科行星上空演绎了一场情景极为:隆阔的太空入
侵战,Damocoes太空巡洋舰及太空战机在行星轨道上高密
度的小行星带险象环生,而3D显卡也碰上了前所未有的高
负载处理场景――场景的最大特点是拥有大量移动对象,成
千上万的陨石每一个都需要完整的3D物件渲染处理。(图
4-2)
这个场景同样针对纯GPU游戏性能来设计,它所引入
的特效包括针对飞船的过程材质以及针对陨石创建的过程
几何处理,而高级后期处理及GPU物理加速模拟将体现在
行星表面爆炸的冲击波、烈焰风暴及大气蒸发等特效。至于
处于远景的星云,则采用了最新的光线追踪技术。(图4-3)
CPU测试1-AOTest
CTl/CPUTest 1(图5-1)
为了体现CPU的游戏性能及实际游戏需求的最新进展,
3DMarkV在CPU测试中引入了新的测试模组。这个被称作
人工智能?y试的环节,将极度依赖CPU的多线程/多核心
处理能力,测试中的人工智能主要体现在针对3D寻路算法
的协助,同时提供了最顶尖的无锁死任务计划,将多核心
CPU的所有潜能榨取出来。
与之前3DMark06的CPU测试中改用640x480最低分辨
率以降低图像性能关联性的方式不同的是,此次CPU测试仍
保持特定测试预设模式的分辨率,但场景采用了固定的渲染
帧速率以确保图像负载的一致性。在这项测试中,每一架小
飞机都运用了独立的人工智能处理,帮助它穿越门洞并获得
行进路线,同时要避免碰撞。测试通过每秒可执行的操作数
OPS(Opera-tlons Per Second)来计算得分,CPU的性能表现更
多的依赖于处理线程/核心数而不是主频,这也预示着未来
游戏设计的发展方向。(图5-2)
CPU测试2-PhysicsC2/CPUTestN(图6-1)
这项CPU游戏性能测试集中于次世代的物理运算工作
量,包括流体、刚体、柔体、布料及融合等,目的是充分利
用多核心CPU的处理能力。
值得注意的是, 此次3DMarkV继续与物理加速技术公
司Ageia合作,同时打上了PhysX的Logo及安装了相关的
驱动程序。如果测试系统中安装了硬件物理加速芯片(PPU),
那么此项测试还将真正利用其物理运算加速功能。
测试首先会进入一个”预热”过程,然后开始正式测试。
这时每架小飞机都沿着各自的飞行路线前进,同时会发生一
些碰撞,碰撞后的小飞机会碎裂,这部分模拟了刚体碰撞的
效果。具备弹性的浮筒门也会在飞机残骸撞上它们时给予真
实的反应,这部分模拟的是布料之类柔性物体的碰撞效果。
测试的得分同样来自于每秒可处理的操作次数。(图6-2)
显示特性测试
3DMarkV引入了六项显示特性测试(Feature Tests),虽然
他们的测试结果并不计入3DMarkV的最终测试成绩得分,
但从中可以了解自己的3D显卡是否可以支持或运行好这里
引入的全新3D特性。
Test1/Texture Fill
材质填充测试体现出GPU的材质填充率,直接反映了
游戏在高画质设定下的硬性图像数据处理能力,具体来说,
就是在DXl0统一渲染架构的显卡中渲染单元(Shader)的性能
如何。测试中的颜色值从一个小纹理中读出,同时利用了多
纹理协作功能。这项测试也对应着DX9.0C规格之前非统 渲
染架构下的Pixe6Shader和Vetex Shader测试。(图7-1)
Test2/Color Fill
色彩填充测试体现出GPU的色彩填充率,色彩输出采
用a1-pha混合方式。这项测试的意义在于,渲染管线在实际
运作中需要将顶点、纹理像素、光照、物体表面材质反射光
等来源的颜色进行混合并生成显示颜色,但各颜色的比例是
需要运算的。这项测试也对应着DX9.0C之前非统渲染架构
下的Pixel Shader和VetexShader测试。(图7-2)
Test3/GPU POM
光线追踪测试通过一幅高分辨率高差地形图,通过像素
着色器来进行光线追踪渲染,多光源照射下也将生成复杂的
阴影效果。这是之前3DMark测试软件从未出现过的一项全
新测试,而光线追踪技术虽然早已出现,在限于硬件性能一
直没有实时渲染的可实现性,而今则成为最热门的图像渲染
技术。从测试中可以看到,在这项技术的实现下,地形可以
显示出真实的立体感。(图7-3)
Test4/GPU cloth
通过GPU的几何着色器来模拟物理加速运算,测试画
面中 的旗帜被风吹动后会显示出平顺自然的卷曲飘动布
料效果。我们知道Ageia的PhysX物理加速技术其实是软件
编程界面与硬件运算加速芯片组合的产物,不过其运算其实
可以借助CPU或GPU来完成,只是原来的运算速度或效率
无法像专门设计的PPU来的高。不过目前GPU的发展突飞
猛进,特别是Ageia已经被NVIDIA收购,因此未来GPU
的物理加速运算技术很可能会得到迅猛发展。(图7-4)
Test5/GPU/Particles
粒子系统可模拟无规则的自然景观现象,例如雨雪效果
等。这些运算在传统上需要占用大量的CPU资源,而在这项
测试中则借助GPU的浮点运算能力来进行粒子系统的生成
测试。测试画面中可以看到,由动态粒子构成的人体形态不
断变化角度。而据此前一些测试对比,GPU的粒子运算效率
要远远高于通用CPU的运算效率。(图7-5)
Test6/GPU Perlin Noise
Perlin Noise(柏林噪声)是由Ken Per师发明的一种噪声
函数,它能很好地模拟火焰、云彩、奇形怪状的岩石,以及
树木和大理石表面等。在3DMark06中就引入了此项测试。
(图7-6)
分值计算方法及实测
3DMark测试的结果通常都是由一个总分及若干子系统
得分构成,查询详情还可以看到各独立测试项的成绩。这些
分值是根据特定的公式及独立测试项的结果计算而来。(图
8-1)
3DMarkV中由于引入了不同的测试预设模式,因此在此
次的总分分值前会加注一个字母,代表相应的?y试模式,即
入门级(Entry)、性能级P(Performance)、高级H(High)、至尊
级×(eXtreme)。
GPU得分是通过图像测试成绩的计算公式得出,其中
“C”为固定比值,“F”,为图像测试中的平均画面帧数率
(FPS,Frame PerSecond)。
CPU得分是通过相应的CPU测试成绩的计算公式得出,
其中“C”为固定比值,“O”为每秒执行操作数(Operation Per
Sec-ond)。
最后的总分通过另外一个总分公式计算而来。其中“W”
为对应不同测试预设模式的比例系数,入门级与性能级的比
例系数为GPU/0.75、CLU/0.25;高级的比例系数为GPU/0.85、
CPU/0.15、至尊级的系数为GPU/0.95、CPU/0.05。可以看到,
随着测试预设模式级别的提升,CPU的比重逐步下降,GPU
的比重则同步上升。这充分表明3DmarkV认为高画质下的
游戏性能表现中,GPU的重要性会越来越大于CPU。此外,
不同测试预设模式下得出的分数只适用相同模式下的成绩
横比,交叉对比没有意义。
以下测试范例基于Q6700@3GHz及GF9600G7的系统
进行,然后在第二次测试中再添加一块Ageia PhysX100物理
加速卡。对比两者的成绩,可以发现在CPU Test2中的物理
运算步数,通过物理加速卡的辅助而提升了约76%。要知道
我们在测试中使用的四核酷睿2处理器已经超频运行在
3GHz,而一片售价不到千元的PPU卡竟然可以带来如此惊
人的物理运算性能提升。(图8-2、3)
结语
在3DMarkV发布后不久,第一个HotFix补丁版本1.0.1.1
就推出了。此版本的主要变动是为高级版增加了离线查看保
存的测试记录的功能,同时去掉了测试软件中的一些内置广
告,估计是因为这些内容影响到商业批量授权。而得分标准
方面并没有任何影响,与1.00版兼容。
由于3DMarkV所展现的游戏图像表现如此惊人,很多
玩家也在探问这个引擎是否会用于游戏。目前Futuremark还
没有对这个引擎有太多说明,不过今年年初该公司已经宣布
将会涉足游戏开发领域,看起来不久之后这些惊人的画面特
效将不仅仅局限在测试软件中了。3DMarkV引擎与目前业界
知名的UE3、Cryengine2、Source等的最大区别,是它完全
支持原生DX10特性, 甚至有可能是DX10.1规格,这从它
无法运行在除Vista SP1之外的系统平台上或许有所佐证。
不过,正如本文开关所说,3DMark无论是有意还是无
心,它都是同时代3D图像硬件的性能噩梦。要想将它引以
为傲的图像引擎应用到游戏中,除了充分发挥特效所能带来
的图像魅力之外,如何优化引擎确保主流硬件能获得流畅的
画面表现,那将是一条需要付出更多努力的路。