最新消息: USBMI致力于为网友们分享Windows、安卓、IOS等主流手机系统相关的资讯以及评测、同时提供相关教程、应用、软件下载等服务。

nVIDIA SLI技术解析

IT圈 admin 19浏览 0评论

2024年3月7日发(作者:濯旎旎)

nVIDIA SLI技术解析

SLI技术是实现了两款显卡同时出现在一块主板上,构成一套SLI双显卡并行系统,这一技术的应用更大程度的满足了用户对高品质画质的需求。

SLI桥接器。

通过SLI桥接器连接的两片GeForce 7950 GX2显卡。

如图所示,我们可以看到,nVIDIA的SLI互连不再是和Voodoo2一样借助线缆,而是使用一块两端有“MIO”接口的PCB连接子卡。卡上的接口有点儿类似PCI Express×1,而在显卡的顶部位置则预留了对应的接口。这样,该SLI连接卡就可以将两块nVIDIA显卡连接起来,实现SLI并行运作。nVIDIA官方表示,选择PCB卡连接可充分保证信号通讯的质

量与速度,显卡间的数据传输采用数字形式进行,这样可有效防止因信号干扰而导致画面不同步的弊端(nVIDIA已经公布了可用驱动支持nVIDIA GeForce 6600标准版组建SLI系统,而这种新型的SLi系统无需通过连接卡便能实现)。Voodoo2所采用的技术是模拟传输方式,数字信号先被转换为模拟信号后才进行合成,因为干扰的影响,在某些时候会出现数据不匹配的问题,导致合成后的画面往往难以同步或出现其他问题,这也是Voodoo2 SLI技术的主要缺陷。而改用数字信号传输,显然就不存在这个问题,显卡处理完的帧数据被集合起来合成,然后才转为模拟信号输出,从而确保画面的完整性。

NV40核心内的SLI功能控制逻辑

nVIDIA将SLI控制功能直接的集成到在显卡的GPU芯片内部,从上图的芯片的逻辑图中可以很容易的看到,在显示核心的左侧左侧偏下的位置有一个很小的区域专门负责SLI运作,该区域所掌管的职能包括两块显卡的连接、通讯,渲染任务的指派以及画面的合成等等。由于指令的传输工作相对简单,在芯片的FCBGA封装中也只有极少几根针脚用于SLI模式。但由于别的GPU并没有集成这一控制逻辑,所以别的显卡并不支持这一技术,但由于特殊的原理的所以SLI技术并不支持AGP总线,SLI技术只可运行在PCI-E模式下,对主板提出了新的要求。不过最令人称奇的还是它的并行能力,nVIDIA的研发专家声称,SLI技术最多可以支持8块GPU并行运作,虽然在消费市场没有什么意义,但在工作站领域,8块GPU并行意味着可获得超高的渲染效率。

以上介绍的只是SLI最表象的特征,真正的关键在于这套系统的运作机制。SLI的两款显卡地位并不是对等的,一块显卡作为主卡(Master),另一块则作为副卡(Slave)。其中主卡负责任务指派、渲染、后期合成、输出等运算和控制工作,而副卡只是接收来自主卡的任务进行相关处理,然后将结果传送回主卡。这里,我们需要明确数据传送的两个途径。两块显卡都是通过PCI Express接口与主板连接,而这两块卡之间还有一个通讯的PCB卡。其中,连接两块显卡的PCB卡用于任务指派指令以及后期处理结果的传送,这部分的数据量不会很大,所以PCB卡所使用的接口和自身结构都较为简单。但是,显卡在渲染过程中必须

调用大量的数据,这部分数据只能通过PCI Express接口从系统中获取。换言之,在SLI系统中有两部分不同的数据流向,一部分为主卡将任务指令通过PCB连接卡传送给副卡,副卡将渲染完毕的结果数据返回给主卡合成,另一部分为处理过程中从PCI Express接口得到的原始数据。

Voodoo2的传统奇偶分工方式

Voodoo2的SLI技术采用帧线方式划分任务:一幅渲染的画面被分成奇数渲染帧和偶数渲染帧两个部分,然后交给两块显卡分别渲染,完毕之后再统一合成。虽然nVIDIA继续沿用了“Scalable Link Interface”的名号,但工作的方式已经有本质性的不同。在nVIDIA的SLI系统中,一幅渲染的画面被划分为上下两个部分,主显卡完成上部分画面,副显卡则完成下半部分的画面,然后副显卡将渲染完毕的画面传输给主显卡,主显卡再将它与自己渲染的上半部分画面合成为一幅完整的画面。这样,一个完整的SLI并行渲染任务就完成了。同理,倘若有四块GPU并行运作,那么画面会被分成四个部分分别渲染,8个GPU并行也是如此。

nVIDIA SLI的智能分工方式

传统的多GPU技术多半采用任务均分的方式,两块显卡完成的渲染任务量完全均等,Voodoo2的SLI及之后的Voodoo 5系列都是如此,ATi的MAXX显卡和XGI的Volari Duo系列产品也是采纳类似的思想。但这种任务均等分派的设计并不科学:首先,主显卡或主GPU必须承担额外的控制、任务分配、画面合成和输出等工作,用于渲染的运算资源较少,但它必须完成与副卡一样多的任务。结果自然是,副卡率先将任务完成,把结果数据回传后便处于等待状态,直到主卡将本批次任务处理完毕之后才可以继续进行任务指派;第二,同一幅画面不同区域的复杂度并不相同,所需的运算量也不一样,如果使用Voodoo2的帧线划分方式那也没什么,但nVIDIA的SLI采用划分上下画面的方式,如在常见的赛车游戏中,画面上半部分几乎是静态的,而下半部分就非常复杂,需要处理的数据量很大,如果单纯将画面作均等的划分也不科学。

为此,nVIDIA另行开发了一套动态负载平衡技术,画面的上下划分并不是按照固定的一半一半方式,而是根据画面的复杂情况进行划分,如可能为4:5或3:2等非均等的模式。这样的分配并不是为了保证工作量在两块卡间的绝对平均分配,而是要将两块显卡完成渲染任务的时间保持一致,以此达到效能的最优化。考虑到主显卡需要承担额外的控制任务,用于实际渲染运算的资源较少,动态负载平衡算法就可以根据这一前提,将任务量适当多给副卡分担。这样,nVIDIA所构建的SLI系统就可以保证两块显卡都工作在最佳效率条件下。要提到的是,这项动态负载平衡算法并不是集成在GPU芯片内部,而是在驱动程序中整合,nVIDIA可以方便对其进行修改,以提供更佳的性能。

以下是这种动态负载平衡技术进行均衡的多种渲染的过程:

1.待渲染的画面被分成上下两部份

2.渲染完毕后统一交给主卡进行合成

3.主卡将合成后的画面输出到显示器

但是,这种动态平衡技术并非万能的,nVIDIA SLI的无法支持在不同的显卡间构建并行系统,而两块显卡协同工作时上下两部分画面的V-Sync(垂直同步)也是一个问题,如果打开该功能势必会对游戏性能产生一定的影响,不过nVIDIA表示已采用缓存技术来解决这个问题,另外建立SLI工作模式后的两块显卡也都支持超频,但必须使两块显卡的频率完全保持一致。

nVIDIA在推出SLI技术时就受到了人们的关注,客观上地说,Multi-GPU的确是一项可以切实提升图形显示性能的技术,它通过双卡并联输出,其理论图形性能可得到将近一倍的提升,游戏爱好者可以充分体验到这种速度提升快感,而对于专业设计人员来说,SLI也将带来效率的翻倍也使得渲染工作的时间几乎可缩短一半。

通过这种先进的SLI技术我们可以得到几乎翻倍的图形显示性能,把它引入实际应用也不再不切实际了,它不再像以前组建Voodoo2 SLI那样昂贵,普通消费者也可以轻易体现到这种先进的技术,这一方面是因为受到ATi Crossfire带来的压力,而对于长远来说,nVIDIA可以在负载平衡算法以及核心开发上下功夫,这种SLI技术和市场定位也要不断演变,让更多的消费者都能轻易组建自己的SLI系统,例如使新旧显卡一起工作在SLI模式下,用户升级时不用抛弃旧显卡而只需购买一张更快的显卡来构建SLI系统。SLI的发展前景是光明的,要是能使SLI普及化,将会对整个显卡市场产生深远的影响。

不过,在nVIDIA刚推出这种双卡并联技术时,作为普通消费者的我们是可望不可及的,因为早期支持开启SLI模式只有Geforce 6800等高端显卡,另外支持SLI亦要使用唯一的nForce4 SLI芯片组平台,整套配置成本上是相当昂贵的。因为高姿态的SLI技术对于一般应用实在是不切实际,所以在SLI面世一年后,来自各方面的压力,NV终于走下神台,通过更新驱动,SLI双卡模式在中低端的显卡产品上都能实现,SLI从此普及起来。

在SLI推出初期,硬件上实现SLI其实并不是问题,但是对于当时来说,对应支持双卡加强输出的大型图形处理软件和游戏等都屈指可数,软件未能普及支持SLI技术也是阻碍SLI前进的一大关键因素,直到进入2005年下半年,业界才逐渐推出针对SLI优化的程序和游戏,如经典的3DMark06、Quake4、F.E.A.R等都是可对应SLI加速的软体和游戏,而到如今2007年,支持SLI技术的软体不断增多,SLI也越来越普及了。

[技术] SLI常见问题及答案

SLI是什么?其工作原理是什么?

SLI(可灵活伸缩的连接接口)是一项旨在实现高性能的技术,让用户可以通过在一套系统中配置多颗nVIDIA GPU,巧妙地组合并提升图形芯片的性能。SLI的工作原理是以一种智能化的方式提高两颗GPU的几何和填充率性能。

该技术与3dfx的SLI有何不同?

nVIDIA SLI在许多方面都与其大不相同。第一,3dfx SLI是在基于PCI架构的共享总线上实现的。PCI总线的总线吞吐量约为100MB/s,而PCI Express则是一种点到点接口,可提供约60倍于PCI总线的总带宽。第二,3dfx SLI执行隔行扫描,属于模拟应用,因此可能由于数模转换差异和其他因素等造成图像质量欠佳。此外,3dfx Voodoo技术仅执行三角形设置,需要由CPU完成几何运算,因此3dfx SLI只能提高简单纹理填充率的性能,并且该技术利用的是帧间灵活伸缩性。nVIDIA SLI技术则是基于PCI Express技术,采用一种完全数字化的帧组合方法,对图像质量无任何影响,可提高几何性能,支持多种实现灵活伸缩性的算法,能够根据应用需要选用最有效的方法来实现灵活伸缩性。

SLI技术是否支持AGP架构?

不。SLI技术是专门针对PCI Express架构而设计的。这种新的总线拥有更高带宽(为AGP 8X的两倍至四倍),支持同步数据传输,并可驱动多台高速图形处理装置。而AGP 8X则仅可驱动一台高速图形处理装置,因此不太适用于SLI。

SLI 桥接器的功能是什么?

SLI 桥接器是GPU 之间的专用连接工具,可传输同步、显示和像素数据。SLI 桥接器可使GPU之间的通讯速率最高达到1GB/s, 同时不会占用PCI Express 总线的带宽。SLI 桥接器适用于GeForce 6600 GT 以及更高版本的产品。对于其他所有SLI-Ready 图形显卡,GPU 之间的数据通讯都是通过PCI-Express 总线,而不是通过SLI 桥接器。对于这些主流GPU,PCI-Express 总线通常有足够的带宽来对额外的通讯进行有效地管理。功能更强的GPU

(GeForce 6600 GT 以及更高版本的产品)需要SLI 桥接器来实现最佳的缩放效果。

SLI 技术可支持哪些操作系统?

SLI技术可支持32位和64位Windows XP/vista以及32位和64位Linux操作系统(IA-32

和 AMD-64/EM64T)。

SLI 技术可支持哪些应用程序?

SLI 可支持所有游戏程序,包括OpenGL 和Direct3D 游戏程序。SLI 能使用SLI 交替渲染(AFR)或分屏渲染(SFR)实现3D 伸缩性能,或能使用SLI 反锯齿模式实现增强的视觉效果。

为什么不是所有的游戏都通过SLI得到效能提升?

使用SLI 技术后,图形芯片所运行的应用程序的性能可得到空前的提高,最高可达以前的两倍。当今最热门的游戏和新一代游戏都属于此范围。然而,有些应用程序、典型的老一代应用程序受到图形芯片处理能力之外的因素限制。

最常见的限制是受CPU 束缚的应用程序。如果应用程序受到CPU 束缚,增强图形处理能力也无法提高性能。在1024x786 低分辨率下,无其他功能开启,此情况最为常见。打开反锯齿和各向异性过滤器,或切换到更高的分辨率,常常可以让瓶颈回到GPU 上。

对于受CPU 性能影响较大的应用程序,nVIDIA 提供一种新的SLI 渲染模式,即SLI 反锯齿。此渲染模式可使客户激活SLI8x 或SLI 16x 反锯齿,并增强所有游戏程序的视觉效果。

什么是SLI抗锯齿技术?

SLI抗锯齿技术是一种全新的独立式渲染模式,通过由两片显卡分担抗锯齿处理任务,将抗锯齿性能提升至两倍。启用后,SLI抗锯齿可提供2种全新抗锯齿设置:SLI8x 和

SLI16x。

基于SLI的系统是否支持输出至电视机或高清电视机?

支持。SLI系统可将信号输出至标清电视机和高清电视机。

在SLI 模式下,屏幕上出现的绿线是为什么?

如果屏幕上出现纵向或横向的绿线,表明激活了nVIDIA 显示控制面板中的“显示GPU

负载平衡”。激活此选项后,将显示您的GPU 如何分配图像负载。对于使用AFR(交替渲染)进行渲染的游戏,纵向线条将根据缩放的总量变粗或变细。对于使用SFR(分屏渲染)进行渲染的游戏,横向线条将上下移动,以显示负载如何在各个GPU 之间获得平衡。如果屏幕的上半部分和下半部分情况相似,横向线条将保持在屏幕中间位置。注意:如果同时启用了Vsynch,则可能不会显示这些线条(并不表示未启用SLI模式)。

不同品牌的图形显卡是否能在SLI模式下兼容?

当前的nVIDIA 驱动程序已经可以在SLI 模式下支持两个不同品牌的图形显卡,客户需要匹配GPU 模式类型。

能否将一片由制造商进行了超频的显卡与标准显卡进行混合配置?

可以。

能否混合配置显存规格不同的显卡?

虽然建议用户最好不要这样配置,nVIDIA支持用户借助Coolbits实现这种配置。在购置第二片显卡时,用户应当尽量选择与已有显卡具备相同规格显存的显卡,以便获得最佳价值和最优性能。例如,如果原有的显卡是GeForce 8600 GT 256MB,那么新买的显卡最好也是GeForce 8600 GT 256MB。不过,利用Coolbits,用户可以将两片显卡均设置为使用其中规格较低的显存并以SLI模式运行。

SLI能不能支持两片以上显卡?

SLI 技术并不局限于只使用两片GPU,在CES 2006展会上,nVIDIA已经展出了支持4颗而不是1颗、2颗或3颗GPU的四重SLI技术,而3-way SLI和混合SLI技术也将在近期公布。

[回顾] 从曙光女神到交叉火力

ATi的Rage Fury MAXX显卡。

其实不只是3dfx与后来收购它的nVIDIA才有双卡互联技术,ATi的Rage FURY MAXX也是有关类似的方案的。资深一些的DIYer一定对当年ATi的Rage Fury MAXX记忆犹新,这款显卡在一块PCB板上采用两块Rage 128 pro芯片协同工作。虽然它是一种单显卡形态,但与Voodoo2 SLI、metebyte PGC方案并没有本质性区别,都是两颗芯片“分工合作”实现性能大幅提升。不过在具体的任务指派机制上,Rage FURY MAXX又有不同:它没有采用画面分割、分别渲染、合成的套路,而是让一颗Rage 128 Pro芯片渲染第一幅画面,另一颗Rage 128 Pro芯片渲染第二幅画面,完成之后第一颗芯片再渲染第三幅画面,依此类推。相比前两者,Rage FURY MAXX的好处是只需用到一条AGP槽,但付出的代价是单块显卡高昂的价格!

在开发之时,Rage Fury MAXX被ATi寄以厚望用以与GeForce 256进行对抗,这一点从其名字中就可以看出来——“MAXX(曙光女神)”是美国空军秘密研发的高超音速侦察机的名字,据说它采用一种全新的推进技术,可以在6万多米的高空上以8马赫(8倍音速)的速度飞行。ATi认为他的新显卡将没有对手,采用这个名称名副其实。Rage Fury MAXX可以说开创了单PCB双核芯的先河,但是由于市场的不成熟,还有Rage Fury MAXX上复杂的AGP桥接架构,以及当时操作系统和软件支持上的不足,Rage Fury Maxx在双核心市场中也只是昙花一现而已。

simFUSION 6000工作站显卡,采用双PCB,每个PCB上集成2个Radeon 9800芯片。

2003年,正是ATi的Radeon 9800系列风光无限的时候,但是他在多卡互联的探索并没有停止,上图的这款产品,就是ATi连同Evan & Sutherlands的推出的simFUSION 6000工作站显卡,集成了多达四颗Radeon 9800芯片,采用双PCB连接、每个PCB上集成2个核心,后期甚至还推出过采用四颗Radeon 9800 XT芯片的类似产品。在同一年,Sapphire(蓝宝)也展示过一片采用Radeon 9800 Pro芯片的单PCB双GPU的的工程版显示卡。

在多卡互联的探索上,ATi的脚步并不比其他厂商落后,只是限于技术和市场的接受程度,ATi早期很少在家用市场涉及类似的产品。随着近年来对3D图形性能需求的快速发展以及GPU发展遭遇瓶颈,并且加上竞争对手nVIDIA的SLI技术带来的巨大压力,ATi终于在2005年6月发布了名为CrossFire(也就是所谓的“交叉火力”简称“交火”)的双卡互联技术。

ATi的第一代CrossFire。

第一代CrossFire应用在Radeon X800或者X850显卡上,对应的Radeon Xpress 200

CrossFire主板拥有2个PCI Express X16插槽连接两块显卡,两块显卡将会通过专用的数据线通过DVI-I接口连接到一起,然后从属显卡的数据将会输出到另一块主显卡上,最终合成并输出到显示屏,一些多GPU渲染模式也会被相应实现。

ATi第二代的Radeon X1900 CrossFire。

为了解决第一代CrossFire高分辩率限制的问题,ATi把新一代Radeon中低端显卡家族的CrossFire技术改良了,并不需要采用Compositing引擎,也就是说不通过专门的信号通道,而是直接通过主板的PCI-E带宽传送数据实现CrossFire。而在高端显卡的CrossFire方面则通过改进Compositing引擎来将最高分辨率提升至2048x1536。

目前第三代的CrossFire已经取消主副卡之分,两片显卡通过交火连接桥进行连接。

在经历过两代CrossFire后,ATi从RV570开始将双卡互联引擎集成到图形核心内(也就是原生CrossFire),也从这一代的交火技术中,不再有主副卡之分,通过交火连接桥将两片显卡顶部交火接口的金手指连接起来,ATI的两个桥接器可以实现24bit(12bit×2)、350MHz的传输速率,另外要注意的是,ATI留有了两个交火金手指接口,单独只插一个桥接器不能够组建CrossFire。新的交火技术不仅为我们带来了更加简便的连接方式,同时在成本、性能方面都有了不小的改善。

2024年3月7日发(作者:濯旎旎)

nVIDIA SLI技术解析

SLI技术是实现了两款显卡同时出现在一块主板上,构成一套SLI双显卡并行系统,这一技术的应用更大程度的满足了用户对高品质画质的需求。

SLI桥接器。

通过SLI桥接器连接的两片GeForce 7950 GX2显卡。

如图所示,我们可以看到,nVIDIA的SLI互连不再是和Voodoo2一样借助线缆,而是使用一块两端有“MIO”接口的PCB连接子卡。卡上的接口有点儿类似PCI Express×1,而在显卡的顶部位置则预留了对应的接口。这样,该SLI连接卡就可以将两块nVIDIA显卡连接起来,实现SLI并行运作。nVIDIA官方表示,选择PCB卡连接可充分保证信号通讯的质

量与速度,显卡间的数据传输采用数字形式进行,这样可有效防止因信号干扰而导致画面不同步的弊端(nVIDIA已经公布了可用驱动支持nVIDIA GeForce 6600标准版组建SLI系统,而这种新型的SLi系统无需通过连接卡便能实现)。Voodoo2所采用的技术是模拟传输方式,数字信号先被转换为模拟信号后才进行合成,因为干扰的影响,在某些时候会出现数据不匹配的问题,导致合成后的画面往往难以同步或出现其他问题,这也是Voodoo2 SLI技术的主要缺陷。而改用数字信号传输,显然就不存在这个问题,显卡处理完的帧数据被集合起来合成,然后才转为模拟信号输出,从而确保画面的完整性。

NV40核心内的SLI功能控制逻辑

nVIDIA将SLI控制功能直接的集成到在显卡的GPU芯片内部,从上图的芯片的逻辑图中可以很容易的看到,在显示核心的左侧左侧偏下的位置有一个很小的区域专门负责SLI运作,该区域所掌管的职能包括两块显卡的连接、通讯,渲染任务的指派以及画面的合成等等。由于指令的传输工作相对简单,在芯片的FCBGA封装中也只有极少几根针脚用于SLI模式。但由于别的GPU并没有集成这一控制逻辑,所以别的显卡并不支持这一技术,但由于特殊的原理的所以SLI技术并不支持AGP总线,SLI技术只可运行在PCI-E模式下,对主板提出了新的要求。不过最令人称奇的还是它的并行能力,nVIDIA的研发专家声称,SLI技术最多可以支持8块GPU并行运作,虽然在消费市场没有什么意义,但在工作站领域,8块GPU并行意味着可获得超高的渲染效率。

以上介绍的只是SLI最表象的特征,真正的关键在于这套系统的运作机制。SLI的两款显卡地位并不是对等的,一块显卡作为主卡(Master),另一块则作为副卡(Slave)。其中主卡负责任务指派、渲染、后期合成、输出等运算和控制工作,而副卡只是接收来自主卡的任务进行相关处理,然后将结果传送回主卡。这里,我们需要明确数据传送的两个途径。两块显卡都是通过PCI Express接口与主板连接,而这两块卡之间还有一个通讯的PCB卡。其中,连接两块显卡的PCB卡用于任务指派指令以及后期处理结果的传送,这部分的数据量不会很大,所以PCB卡所使用的接口和自身结构都较为简单。但是,显卡在渲染过程中必须

调用大量的数据,这部分数据只能通过PCI Express接口从系统中获取。换言之,在SLI系统中有两部分不同的数据流向,一部分为主卡将任务指令通过PCB连接卡传送给副卡,副卡将渲染完毕的结果数据返回给主卡合成,另一部分为处理过程中从PCI Express接口得到的原始数据。

Voodoo2的传统奇偶分工方式

Voodoo2的SLI技术采用帧线方式划分任务:一幅渲染的画面被分成奇数渲染帧和偶数渲染帧两个部分,然后交给两块显卡分别渲染,完毕之后再统一合成。虽然nVIDIA继续沿用了“Scalable Link Interface”的名号,但工作的方式已经有本质性的不同。在nVIDIA的SLI系统中,一幅渲染的画面被划分为上下两个部分,主显卡完成上部分画面,副显卡则完成下半部分的画面,然后副显卡将渲染完毕的画面传输给主显卡,主显卡再将它与自己渲染的上半部分画面合成为一幅完整的画面。这样,一个完整的SLI并行渲染任务就完成了。同理,倘若有四块GPU并行运作,那么画面会被分成四个部分分别渲染,8个GPU并行也是如此。

nVIDIA SLI的智能分工方式

传统的多GPU技术多半采用任务均分的方式,两块显卡完成的渲染任务量完全均等,Voodoo2的SLI及之后的Voodoo 5系列都是如此,ATi的MAXX显卡和XGI的Volari Duo系列产品也是采纳类似的思想。但这种任务均等分派的设计并不科学:首先,主显卡或主GPU必须承担额外的控制、任务分配、画面合成和输出等工作,用于渲染的运算资源较少,但它必须完成与副卡一样多的任务。结果自然是,副卡率先将任务完成,把结果数据回传后便处于等待状态,直到主卡将本批次任务处理完毕之后才可以继续进行任务指派;第二,同一幅画面不同区域的复杂度并不相同,所需的运算量也不一样,如果使用Voodoo2的帧线划分方式那也没什么,但nVIDIA的SLI采用划分上下画面的方式,如在常见的赛车游戏中,画面上半部分几乎是静态的,而下半部分就非常复杂,需要处理的数据量很大,如果单纯将画面作均等的划分也不科学。

为此,nVIDIA另行开发了一套动态负载平衡技术,画面的上下划分并不是按照固定的一半一半方式,而是根据画面的复杂情况进行划分,如可能为4:5或3:2等非均等的模式。这样的分配并不是为了保证工作量在两块卡间的绝对平均分配,而是要将两块显卡完成渲染任务的时间保持一致,以此达到效能的最优化。考虑到主显卡需要承担额外的控制任务,用于实际渲染运算的资源较少,动态负载平衡算法就可以根据这一前提,将任务量适当多给副卡分担。这样,nVIDIA所构建的SLI系统就可以保证两块显卡都工作在最佳效率条件下。要提到的是,这项动态负载平衡算法并不是集成在GPU芯片内部,而是在驱动程序中整合,nVIDIA可以方便对其进行修改,以提供更佳的性能。

以下是这种动态负载平衡技术进行均衡的多种渲染的过程:

1.待渲染的画面被分成上下两部份

2.渲染完毕后统一交给主卡进行合成

3.主卡将合成后的画面输出到显示器

但是,这种动态平衡技术并非万能的,nVIDIA SLI的无法支持在不同的显卡间构建并行系统,而两块显卡协同工作时上下两部分画面的V-Sync(垂直同步)也是一个问题,如果打开该功能势必会对游戏性能产生一定的影响,不过nVIDIA表示已采用缓存技术来解决这个问题,另外建立SLI工作模式后的两块显卡也都支持超频,但必须使两块显卡的频率完全保持一致。

nVIDIA在推出SLI技术时就受到了人们的关注,客观上地说,Multi-GPU的确是一项可以切实提升图形显示性能的技术,它通过双卡并联输出,其理论图形性能可得到将近一倍的提升,游戏爱好者可以充分体验到这种速度提升快感,而对于专业设计人员来说,SLI也将带来效率的翻倍也使得渲染工作的时间几乎可缩短一半。

通过这种先进的SLI技术我们可以得到几乎翻倍的图形显示性能,把它引入实际应用也不再不切实际了,它不再像以前组建Voodoo2 SLI那样昂贵,普通消费者也可以轻易体现到这种先进的技术,这一方面是因为受到ATi Crossfire带来的压力,而对于长远来说,nVIDIA可以在负载平衡算法以及核心开发上下功夫,这种SLI技术和市场定位也要不断演变,让更多的消费者都能轻易组建自己的SLI系统,例如使新旧显卡一起工作在SLI模式下,用户升级时不用抛弃旧显卡而只需购买一张更快的显卡来构建SLI系统。SLI的发展前景是光明的,要是能使SLI普及化,将会对整个显卡市场产生深远的影响。

不过,在nVIDIA刚推出这种双卡并联技术时,作为普通消费者的我们是可望不可及的,因为早期支持开启SLI模式只有Geforce 6800等高端显卡,另外支持SLI亦要使用唯一的nForce4 SLI芯片组平台,整套配置成本上是相当昂贵的。因为高姿态的SLI技术对于一般应用实在是不切实际,所以在SLI面世一年后,来自各方面的压力,NV终于走下神台,通过更新驱动,SLI双卡模式在中低端的显卡产品上都能实现,SLI从此普及起来。

在SLI推出初期,硬件上实现SLI其实并不是问题,但是对于当时来说,对应支持双卡加强输出的大型图形处理软件和游戏等都屈指可数,软件未能普及支持SLI技术也是阻碍SLI前进的一大关键因素,直到进入2005年下半年,业界才逐渐推出针对SLI优化的程序和游戏,如经典的3DMark06、Quake4、F.E.A.R等都是可对应SLI加速的软体和游戏,而到如今2007年,支持SLI技术的软体不断增多,SLI也越来越普及了。

[技术] SLI常见问题及答案

SLI是什么?其工作原理是什么?

SLI(可灵活伸缩的连接接口)是一项旨在实现高性能的技术,让用户可以通过在一套系统中配置多颗nVIDIA GPU,巧妙地组合并提升图形芯片的性能。SLI的工作原理是以一种智能化的方式提高两颗GPU的几何和填充率性能。

该技术与3dfx的SLI有何不同?

nVIDIA SLI在许多方面都与其大不相同。第一,3dfx SLI是在基于PCI架构的共享总线上实现的。PCI总线的总线吞吐量约为100MB/s,而PCI Express则是一种点到点接口,可提供约60倍于PCI总线的总带宽。第二,3dfx SLI执行隔行扫描,属于模拟应用,因此可能由于数模转换差异和其他因素等造成图像质量欠佳。此外,3dfx Voodoo技术仅执行三角形设置,需要由CPU完成几何运算,因此3dfx SLI只能提高简单纹理填充率的性能,并且该技术利用的是帧间灵活伸缩性。nVIDIA SLI技术则是基于PCI Express技术,采用一种完全数字化的帧组合方法,对图像质量无任何影响,可提高几何性能,支持多种实现灵活伸缩性的算法,能够根据应用需要选用最有效的方法来实现灵活伸缩性。

SLI技术是否支持AGP架构?

不。SLI技术是专门针对PCI Express架构而设计的。这种新的总线拥有更高带宽(为AGP 8X的两倍至四倍),支持同步数据传输,并可驱动多台高速图形处理装置。而AGP 8X则仅可驱动一台高速图形处理装置,因此不太适用于SLI。

SLI 桥接器的功能是什么?

SLI 桥接器是GPU 之间的专用连接工具,可传输同步、显示和像素数据。SLI 桥接器可使GPU之间的通讯速率最高达到1GB/s, 同时不会占用PCI Express 总线的带宽。SLI 桥接器适用于GeForce 6600 GT 以及更高版本的产品。对于其他所有SLI-Ready 图形显卡,GPU 之间的数据通讯都是通过PCI-Express 总线,而不是通过SLI 桥接器。对于这些主流GPU,PCI-Express 总线通常有足够的带宽来对额外的通讯进行有效地管理。功能更强的GPU

(GeForce 6600 GT 以及更高版本的产品)需要SLI 桥接器来实现最佳的缩放效果。

SLI 技术可支持哪些操作系统?

SLI技术可支持32位和64位Windows XP/vista以及32位和64位Linux操作系统(IA-32

和 AMD-64/EM64T)。

SLI 技术可支持哪些应用程序?

SLI 可支持所有游戏程序,包括OpenGL 和Direct3D 游戏程序。SLI 能使用SLI 交替渲染(AFR)或分屏渲染(SFR)实现3D 伸缩性能,或能使用SLI 反锯齿模式实现增强的视觉效果。

为什么不是所有的游戏都通过SLI得到效能提升?

使用SLI 技术后,图形芯片所运行的应用程序的性能可得到空前的提高,最高可达以前的两倍。当今最热门的游戏和新一代游戏都属于此范围。然而,有些应用程序、典型的老一代应用程序受到图形芯片处理能力之外的因素限制。

最常见的限制是受CPU 束缚的应用程序。如果应用程序受到CPU 束缚,增强图形处理能力也无法提高性能。在1024x786 低分辨率下,无其他功能开启,此情况最为常见。打开反锯齿和各向异性过滤器,或切换到更高的分辨率,常常可以让瓶颈回到GPU 上。

对于受CPU 性能影响较大的应用程序,nVIDIA 提供一种新的SLI 渲染模式,即SLI 反锯齿。此渲染模式可使客户激活SLI8x 或SLI 16x 反锯齿,并增强所有游戏程序的视觉效果。

什么是SLI抗锯齿技术?

SLI抗锯齿技术是一种全新的独立式渲染模式,通过由两片显卡分担抗锯齿处理任务,将抗锯齿性能提升至两倍。启用后,SLI抗锯齿可提供2种全新抗锯齿设置:SLI8x 和

SLI16x。

基于SLI的系统是否支持输出至电视机或高清电视机?

支持。SLI系统可将信号输出至标清电视机和高清电视机。

在SLI 模式下,屏幕上出现的绿线是为什么?

如果屏幕上出现纵向或横向的绿线,表明激活了nVIDIA 显示控制面板中的“显示GPU

负载平衡”。激活此选项后,将显示您的GPU 如何分配图像负载。对于使用AFR(交替渲染)进行渲染的游戏,纵向线条将根据缩放的总量变粗或变细。对于使用SFR(分屏渲染)进行渲染的游戏,横向线条将上下移动,以显示负载如何在各个GPU 之间获得平衡。如果屏幕的上半部分和下半部分情况相似,横向线条将保持在屏幕中间位置。注意:如果同时启用了Vsynch,则可能不会显示这些线条(并不表示未启用SLI模式)。

不同品牌的图形显卡是否能在SLI模式下兼容?

当前的nVIDIA 驱动程序已经可以在SLI 模式下支持两个不同品牌的图形显卡,客户需要匹配GPU 模式类型。

能否将一片由制造商进行了超频的显卡与标准显卡进行混合配置?

可以。

能否混合配置显存规格不同的显卡?

虽然建议用户最好不要这样配置,nVIDIA支持用户借助Coolbits实现这种配置。在购置第二片显卡时,用户应当尽量选择与已有显卡具备相同规格显存的显卡,以便获得最佳价值和最优性能。例如,如果原有的显卡是GeForce 8600 GT 256MB,那么新买的显卡最好也是GeForce 8600 GT 256MB。不过,利用Coolbits,用户可以将两片显卡均设置为使用其中规格较低的显存并以SLI模式运行。

SLI能不能支持两片以上显卡?

SLI 技术并不局限于只使用两片GPU,在CES 2006展会上,nVIDIA已经展出了支持4颗而不是1颗、2颗或3颗GPU的四重SLI技术,而3-way SLI和混合SLI技术也将在近期公布。

[回顾] 从曙光女神到交叉火力

ATi的Rage Fury MAXX显卡。

其实不只是3dfx与后来收购它的nVIDIA才有双卡互联技术,ATi的Rage FURY MAXX也是有关类似的方案的。资深一些的DIYer一定对当年ATi的Rage Fury MAXX记忆犹新,这款显卡在一块PCB板上采用两块Rage 128 pro芯片协同工作。虽然它是一种单显卡形态,但与Voodoo2 SLI、metebyte PGC方案并没有本质性区别,都是两颗芯片“分工合作”实现性能大幅提升。不过在具体的任务指派机制上,Rage FURY MAXX又有不同:它没有采用画面分割、分别渲染、合成的套路,而是让一颗Rage 128 Pro芯片渲染第一幅画面,另一颗Rage 128 Pro芯片渲染第二幅画面,完成之后第一颗芯片再渲染第三幅画面,依此类推。相比前两者,Rage FURY MAXX的好处是只需用到一条AGP槽,但付出的代价是单块显卡高昂的价格!

在开发之时,Rage Fury MAXX被ATi寄以厚望用以与GeForce 256进行对抗,这一点从其名字中就可以看出来——“MAXX(曙光女神)”是美国空军秘密研发的高超音速侦察机的名字,据说它采用一种全新的推进技术,可以在6万多米的高空上以8马赫(8倍音速)的速度飞行。ATi认为他的新显卡将没有对手,采用这个名称名副其实。Rage Fury MAXX可以说开创了单PCB双核芯的先河,但是由于市场的不成熟,还有Rage Fury MAXX上复杂的AGP桥接架构,以及当时操作系统和软件支持上的不足,Rage Fury Maxx在双核心市场中也只是昙花一现而已。

simFUSION 6000工作站显卡,采用双PCB,每个PCB上集成2个Radeon 9800芯片。

2003年,正是ATi的Radeon 9800系列风光无限的时候,但是他在多卡互联的探索并没有停止,上图的这款产品,就是ATi连同Evan & Sutherlands的推出的simFUSION 6000工作站显卡,集成了多达四颗Radeon 9800芯片,采用双PCB连接、每个PCB上集成2个核心,后期甚至还推出过采用四颗Radeon 9800 XT芯片的类似产品。在同一年,Sapphire(蓝宝)也展示过一片采用Radeon 9800 Pro芯片的单PCB双GPU的的工程版显示卡。

在多卡互联的探索上,ATi的脚步并不比其他厂商落后,只是限于技术和市场的接受程度,ATi早期很少在家用市场涉及类似的产品。随着近年来对3D图形性能需求的快速发展以及GPU发展遭遇瓶颈,并且加上竞争对手nVIDIA的SLI技术带来的巨大压力,ATi终于在2005年6月发布了名为CrossFire(也就是所谓的“交叉火力”简称“交火”)的双卡互联技术。

ATi的第一代CrossFire。

第一代CrossFire应用在Radeon X800或者X850显卡上,对应的Radeon Xpress 200

CrossFire主板拥有2个PCI Express X16插槽连接两块显卡,两块显卡将会通过专用的数据线通过DVI-I接口连接到一起,然后从属显卡的数据将会输出到另一块主显卡上,最终合成并输出到显示屏,一些多GPU渲染模式也会被相应实现。

ATi第二代的Radeon X1900 CrossFire。

为了解决第一代CrossFire高分辩率限制的问题,ATi把新一代Radeon中低端显卡家族的CrossFire技术改良了,并不需要采用Compositing引擎,也就是说不通过专门的信号通道,而是直接通过主板的PCI-E带宽传送数据实现CrossFire。而在高端显卡的CrossFire方面则通过改进Compositing引擎来将最高分辨率提升至2048x1536。

目前第三代的CrossFire已经取消主副卡之分,两片显卡通过交火连接桥进行连接。

在经历过两代CrossFire后,ATi从RV570开始将双卡互联引擎集成到图形核心内(也就是原生CrossFire),也从这一代的交火技术中,不再有主副卡之分,通过交火连接桥将两片显卡顶部交火接口的金手指连接起来,ATI的两个桥接器可以实现24bit(12bit×2)、350MHz的传输速率,另外要注意的是,ATI留有了两个交火金手指接口,单独只插一个桥接器不能够组建CrossFire。新的交火技术不仅为我们带来了更加简便的连接方式,同时在成本、性能方面都有了不小的改善。

发布评论

评论列表 (0)

  1. 暂无评论