nVIDIA的SLi技术从发布至今已经走过了2个年头,SLi技术也从神秘的大洋彼岸来到东方文明古国,将全球顶尖图形技术融入到民用显卡之中。nVIDIA SLi技术的应用充分体现了nVIDIA强大的研发能力和创新精神,从早期寥寥无几的几个游戏到现在庞大的游戏支持库。nVIDIA从被动为游戏开发配置表成功转型到让游戏开发商主动兼容SLi技术。而今天我们所要说的正是这2年来nVIDIA SLi技术的发展与进步,以及对当今游戏的深远影响。
3dfx用的LI技术 两片Voodoo显卡通过专用数据接口互联 2004年7月1日,nVIDIA正式向外界公布了SLi技术,SLi技术最早起源于3dfx公司。3dfx对于老玩家来说一定不会陌生,早在上世纪90年代末,3dfx便以Voodoo显卡。并且在3dfx最辉煌的时期,其推出的双卡互联的SLi技术最大的成功之处就在于突破了单卡性能的极限,让只有理论上存在的双卡互联成为现实。俗话说长江后浪推前浪,前浪死在沙滩上,即便是3dfx这样的公司在2000底的三国演义中也落得全军覆没,从此一蹶不振,最终被nVIDIA所吞并。
nVIDIA的SLi技术 双Geforce 6800Ultra互联 从技术上来说nVIDIA推出SLi技术相比过去3dfx的SLi技术有很大的突破,首先作为双卡互联的实现手段,得益于PCI Express总线的应用化,SLi得以利用点对点总线来实现高速数据传输,这点是PCI总线所望尘莫及的。其次nVIDIA的SLi在技术上有很大改进,全面优化显卡效能,利用专用MIO接口来实现双卡数据平衡,并最终可达到180%的理论性能。在这2年的时光里,nVIDIA为SLi做了很多,最值得赞扬的就是对游戏的兼容性。在SLi发展的同时,nVIDIA的驱动开发小组为市面上常见和不少经典游戏都制作了相关的专用配置文件,并通过Forceware驱动强大的功能来释放SLi的出众效能。
SLi测试平台 | CPU | AMD Athlon64 x2 3800+ | 主板 | Biostar Tforce590 SLi | 显卡 | nVIDIA Geforce 7300GT/7600GS/7900GS SLi | 内存 | Patriot DDR2 1066MHz 2GB | 硬盘 | Seagate 7200.9 ST3802110A | 操作系统 | Windows XP+SP2中文版 | DirectX /驱动 | DirectX 9.0C//ForceWare 93.71 WHQL | 测试平台由映泰的提供Tforce 590SLI主板,2GB的博帝战斧DDR2 1066内存以及Athlon64 x2 3800+处理器所构成。显卡方面选择了低端市场最常见的Geforce 7300GT显卡,而中端市场则选择了价格合适,性价比颇高的7600GS显卡,并且值得一提的是测试用的7600GS显卡默认频率为560/1400MHz,与真正的7600GT并无区别。
测试游戏方面我们挑选了3款可以称得上老中青三代高配置游戏,它们分别是以卓越画质杀出重围的《Far Cry》,OpenGL游戏中的画质王者《Quake4》以及瑞典DICE工作室的《BattleField BattleField 2142》。在上百款游戏之中我们为什么会挑选这三款游戏呢,不妨来看看下面的介绍。 《Far Cry》——德国Crytek工作室在2004年初推出的游戏,《Far Cry》作为第一款真正意义上的全DirectX 9.0游戏,其画面出色,大量顶点与像素着色技术的引入为游戏增添了许多亮点。《Far Cry》的成功之处就在于其精美的画面和出众的开放性,优美的自然环境结合刺激的冒险过程。在技术上《Far Cry》表现同样出色,从最早的1.0补丁到最新的1.40beta版补丁,《Far Cry》已经从DirectX 9.0B全面升级到DirectX 9.0C平台,使得游戏画面有更强劲的细节表现能力,并且通过最新补丁程序,《Far Cry》完美支持了nVIDIA的SLi技术和HDR高动态光照效果,而这也正是我们将其纳入测试游戏的原因。 《Quake4》——世界著名游戏公司ID SOFT在2005年10月推出的系列游戏,剧情延续了《Quake2》的剧情。与前作一样, 《Quake4》采用OpenGL作为图形接口,引擎则选用《DOOM3》的核心部分并加以改进,使得游戏效率有明显提高。作为目前仅有了几款OpenGL游戏,《Quake4》的画面继承了《DOOM3》引擎优秀的画面表现。在技术上《Quake4》良好支持了双核心处理器以及SLi技术。除了《Quake4》以外,ID SOFT的最新作品《Quake War》也非常值得期待,高水准的画面和出色的物理引擎势必会冲击全新的网络对抗游戏新高度。 《BattleField 2142》——由《BattleField 》的原班人马全力打造,并位于2006年10月17日正式上市。《BattleField 2142》延续了该系列一贯的激烈对抗性,只不过战场从史诗般的二次大战转换到近未来战场。由全新组建的泛太平洋共同体PAC为了地球上仅存地适合人类居住的领土与欧盟联军展开激烈对抗。游戏引擎依然采用《BattleField 2》的程序,并通过增加新的光影技术来增进游戏在画面上的表现。《BattleField 2142》作为最新一代的高配置游戏,游戏提供了对SLi技术的良好支持,而这也正是本次测试所关注的。 三款测试游戏横跨2004,2005和2006这三个年头,从侧面反应出SLi技术良好的兼容性,下面,让我们来看看为此次测试所准备的产品吧。
nVIDIA提供的7900GS显卡 本次测试得到了nVIDIA的大力支持,测试中所出现的Geforce 7900GS显卡正是由nVIDIA所提供的。其实在此之前的8800GTX评测中用来对比的Geforce 7950GT显卡同样是由nVIDIA所提供。除了nVIDIA之外,我们还得到了nVIDIA AIC核心合作伙伴富彩国际的大力支持,并且富彩国际为我们提供了2片7300GT和7600GS暴龙版显卡。 富彩暴龙系列显卡 这次由富彩国际提供的两款显卡都相当有特色,其中面向低端市场的7300GT采用高速DDR3显存颗粒,频率为560/1400MHz,就主频而言与7600GT是完全相同的。在显存配制上采用了128bit/128MB的配制,得益于显存容量的降低,显卡的售价得以控制在560元左右。对于一款由AIC品牌出品的显卡而言其性价比还是相当高的。除了7300GT暴龙版外,另一款7600GS暴龙版也同样采用1.4NS的GDDR3颗粒,主频同样也是560/1400MHz,与7600GT保持一直,并且由于在频率与管线上都与7600GT相同,因此在性能上与后者完全一致。
SLi的工作原理分为三种,它们分别是SFR(分屏渲染),AFR(交叉渲染)以及兼容模式。 首先分屏渲染很好理解,简单的说就是通过驱动将游戏画面切割成上下两块,然后由两块显卡分头出力相应的部分,由于每块显卡所渲染的量较单卡有50%的减少,因此性能有了成倍的增长,而画面上则最终通过主卡和驱动来实现画面的拼接,并实现无损的高品质输出效果。 除了分屏渲染外,交叉渲染技术也是SLi的一大组成部分,交叉渲染技术不同于分屏渲染。交叉渲染技术将画面切分为奇数帧和偶数帧,然后将奇数帧交给主卡偶数帧则交给副卡。在游戏运行时两块显卡以奇偶交错的方式渲染画面。除了SFR和AFR之外,兼容模式的引入也增强了SLi技术的兼容性。其实所谓的兼容模式就是当显卡遇到无法支持SLi的游戏后为了让游戏正常运行,驱动指派显卡以兼容模式运行,最大程度兼容游戏程序的一种模式。
从测试成绩可以看到在3Dmark03中,1024x768分辩率下时的性能从8316分提升到了13826分,增长了5000余分。将分辩率提升到1280x1024后总分虽然有所降低,但可以看见的是SLi下的成绩降幅有所降低,这点与单卡下的成绩是完全相反的。随后再将分辩率提升到1600x1200后可以看到总分已然在下降,但此时相比单卡后的得分,SLi平台有了近100%的性能提升!同样的问题在3Dmark05中也同样出现,由此可以看到SLi技术在低分辩率下时的提升十分有限,然而将分辩率或负载提升到一定程度后便能突破单卡性能瓶颈,真正达到双倍的效能。 在Far Cry,Quake4和BattleField 2142等游戏中,SLi技术所带来的效能提升显而易见。和3Dmark相同的是在低分辩率下时SLi所带来的性能提升并不算很明显,事实上在像1024x768下时SLi所提供的帧数相比单卡时仅有20帧左右提高。然而随着分辩率的一次次提升,游戏帧数有了更加明显的增长,并且在1600x1200下时无论是Far Cry,Quake4还有BattleField 2142都有了近一倍增长,大大提升了游戏的流畅性。
与之前7300GT SLi的测试结果不同,7600GS SLi后的成绩并不能另人非常满意,至少在其在3Dmark03所带来的性能提升并不算太好,至少在1024x768下时提升还有5000余分,而1280x1204下时则下降到了2000多分,并且随着分辩率提升,SLi所提供的性能提升进一步下降。这点与SLi本身所提倡的双倍效能是背道而行的,不过所幸的是问题很容易解释,这时因为相对于3Dmark05,年代久远的3Dmark03对CPU的依赖性上存在过渡依赖性,因此可以说7600GS SLi后高分辩率下性能骤降很可能是因为平台CPU不够力所致。这点其实也可以从后面的3Dmark05测试里证实,至少在05中CPU依赖性的降低很大程度上提高了SLi后显卡GPU自身的处理能力。通过今次测试其实也让我们了解到SLi技术的强大之处就在于成功将两块显卡并行工作,但这种先进的技术对CPU的要求却非常高,因此一块采用双核心架构的处理器可以说是今后游戏的必要装备了,不然CPU很可能成为SLi技术的一大瓶颈。
尽管在之前的3Dmark测试中表现受阻,但在实际游戏的测试中SLi的表现可谓非常出色,虽然在1024x768下时SLi的性能提升幅度并不算很大,但是和7300GT SLi时一样,只要游戏的负载进一步加剧,SLi所达成的提升效果反而越好,甚至在BattleField 2142的1600x1200下时出现了近100%的巨大增幅!同样,在Far Cry和Quake4中SLi在高分辩率以及HDR的负载下效能表现不降反升,着实让人感受到了双卡互联所带来的巅峰效能。
除了效能之外,nVIDIA通过不断改进技术赋予了SLi以全新的功能,像SLi抗锯齿就是其中最具特色的技术之一。通常我们在运行3D游戏时都会发现物体表面有非常难看的锯齿现象,这是由于3D模型都是通过无数个三角形堆积出来的,因此当分辩率较低时游戏所应用到的三角形数量也相对较少,使得物体表面看起来坑坑洼洼全是锯齿,而高分辩率下时往往锯齿反而不易察觉也正是因为三角形数量的增多使得物体表面更加细腻所致。 16x抗锯齿效果 对于追求画面的人来说锯齿无疑是大煞风景的,因此通常我们用显卡提供的抗锯齿技术来磨平这些难看的锯齿,一般显卡所能提供的抗锯齿等级分为2X、4X,6X以及8X。倍数越高则驱动对锯齿的处理则越细腻,虽然画面水准得到了一定的提高,但受限于GPU核心能力所限,8X抗锯齿已是绝大多数显卡所能提供的最高抗锯齿效果了。而nVIDIA则通过SLi技术赋予显卡全新的SLi抗锯齿效果,其原理是通过驱动将SLi模式下的显卡从双倍渲染效能改为协同抗锯齿,由此得到16X的超强抗锯齿等级效果,如果应用的是Geforce 8800GTX的话则可以开启至32X的惊人抗锯齿效果! 除了对图象处理有极大作用的SLi抗锯齿技术外,SLi技术还能通过双卡互联的方式达到支持四台显示器同时输出或跨屏输出的显示效果。另外也有主板制造商通过x32的PCI Express插槽来建立单块主板同时接插4块显卡的效果,并达成最大八组显示器的输出效果。
利用由nVIDIA提供的两片7900GS组成SLi平台后,我们可以很轻易的得到中高端显卡互联后的强劲效能。在3Dmark03中通过SLi技术双卡互联后成绩有了相当大的提高,低分辩率下提供了高达7000余分的提升,将分辩率调高后性能还有进一步的提高。这点从后面的3Dmark05和06中也可以看到。总而言之,SLi技术确实能提升显卡的效能,从某种意义上来说突破了单卡的效能极限,在高负载下提供了单卡所无法比拟的性能。只是想要发挥SLi的超强效能,一块性能强劲的CPU是必不可少的。 基于SLi技术的双核心显卡 SLi从2004年发布至今已经走过了相当长的一段时间,SLi技术在nVIDIA的努力下也是有了翻天覆地的变化。强大的双卡甚至多卡互联能力突破了单卡效能极限,大幅提升了图形性能的理论极限,并且SLi通过完善的ForceWare驱动已经对越来越多的游戏提供SLi支持,同时相对于对手ATI的CrossFire技术,得益于超前的市场策略,SLi技术早已深入人心,并且从Geforce 6系列开始便对所有的主流PCI Express显卡提供SLi功能,同时依托于强大的AMD Athlon64处理器和成熟的nForce4 SLi主板,SLi技术的搭建成本和门槛已经大大降低了。如今在新一代的显卡面前,通过全系列的nVIDIA SLi系列产品,Geforce系列显卡更是有机会借SLi之力冲击图形性能的巅峰。 |