专业图形显卡和游戏显卡的效率对比

【OpenGL和DirectX】

OpenGL(全写Open Graphics Library)是个定义了一个跨编程语言、跨平台的编程接口规格的专业的图形程序接口。它用于三维图像(包含二维),是一个功能强大,调用方便的底层图形库。

DirectX(Direct eXtension,简称DX)是由微软公司创建的多媒体编程接口。由C++编程语言实现,遵循COM。被广泛使用于Microsoft Windows、Microsoft XBOX、Microsoft XBOX 360和Microsoft XBOX ONE电子游戏开发,并且只能支持这些平台。

简单概括,OpenGL是跨平台(windows,OSX,IOS,Android等)的免费图形标准,而DirectX则是只在微软操作平台上的图形标准。


【游戏与设计】

图形显示接口卡(也叫图形显示适配器),简称“显卡”,它负责计算机图形输出的任务。应用软件要和硬件内置驱动程序进行数据交接,需要一个桥梁,那就是应用程序接口—API(OpenGL和DirectX)。

微软强势力推DX之后,基于DX接口的显卡占据了大部分游戏娱乐市场。而物以稀为贵,由于应用于专业制图的用户群体不是很大,基于OpenGL的专业显卡驱动开发成本高昂(同样硬件性能的作图卡价格是游戏卡的5倍以上),配机市场流通最广的是nVidia(例如GeForce GTX系列)和ATI(例如Radeon HD系列)公司的游戏显卡。

由于跨平台的完整性,常用的图形和动画设计软件多采用OpenGL开发。nVidia和ATI也推出了专业图形显卡(后面简称图形显卡),例如nVidia的Quadro系列和ATI的FirePro系列。

windows平台下,DX游戏显卡就相当于精简了OpenGL函数的图形显卡;图形显卡则支持DX显卡不兼容的OpenGL部分,同时支持大部分DirectX函数。如果是进行三维游戏,那么图形显卡和同样硬件参数的游戏显卡表现差不多;而进行游戏开发或者三维模型设计时,图形显卡则比DX游戏显卡更能发挥作用。


【专业图形显卡】

与针对游戏、娱乐和办公市场为主的消费类显卡相比,图形显卡主要针对的是三维动画软件(如3DS Max、Maya、Softimage|3D等)、渲染软件(如LightScape、3DS VIZ等)、CAD软件(如AutoCAD、Pro/Engineer、Unigraphics、SolidWorks等)、模型设计(如Rhino)以及部分科学应用等专业应用市场。图形显卡针对这些专业图形图像软件进行了必要的优化,有着极佳的兼容性。

nVidia Quadro系列定位于专业绘图工作站领域。多数产品的核心实质上与定位于个人领域的GeForce完全相同,但与GeForce相比Quadro强调与行业软件的兼容性、稳定性以及高效率。其驱动程序对行业软件及编程接口有相应的优化。

据一些测试,ATI专业显卡对maya的支持比nVidia的专业显卡要高效,不过因为没相关硬件进行测试,所以我无从得知。


注:本文最早发布于2015年,一些内容会做变更和补充。

【Autodesk推荐的兼容maya2016的显卡列表】

很明显,多数GTX游戏显卡并没有被推荐。


【显卡测试】

【主机1】

系统:Win7 64位

CPU:英特尔I7-4790K 4.00GHz

内存:16G DDR3

独立显卡:索泰NvidiaGeForceGTX750Ti(显存2048MB)

桌面分辨率:1920*1080

【主机2】

系统:Win7 64位

CPU:英特尔I7-4790K 4.00GHz

内存:32G DDR3

独立显卡:丽台nVidiaQuadroK4200(显存4096MB)

桌面分辨率:2560*1440

【MacbookProRetina2013年款】

系统:Mac OSX Yosemite

CPU:英特尔I5 2.4GHz

内存:8G  DDR3

集成显卡:英特尔Iris HD5100(显存1536MB)

桌面分辨率:2560*1600


从硬件参数来看,苹果笔记本配置最低,不过OSX系统对于图形设计有先天的优势。

网友总结的显卡天梯图中,性能的分级基本依赖游戏画面的表现,图形显卡通常不参与分级。不过为了有个参考,使用显卡性能测试软件3DMARK11进行测算,可看到K4200的性能相当于GTX660。

在显卡天梯图中GTX660排名高于GTX750Ti,不过差距并不是很大。

下面是各显卡的硬件参数:

*因为找不到macbookPro上HD5100的性能参数,所以使用性能接近(略低)的HD5000进行参考。

显卡的主要性能参数上,HD5100<GTX750Ti<K4200;HD5100相对GTX750Ti性能不到它的5分之1。


【模型场景测试】

测试软件版本:maya2016

启动maya后,空场景时maya占用显存约80M,内存约350M(这个情况在windows7和macOSX中大致一样)。算上win7系统占用的显存,此时显存占用为236M。

【场景1】

模型数量:1515个

多边形数量:约200万三角面

着色形式:纯色材质

载入【场景1】,maya显存占用到350M,内存占用为1.2G。将1515个模型合并为1个后maya显存占用900M内存占用3G;清除合并历史,保存文件后关闭maya,然后再次打开文件,此时maya显存占用440M,内存占用1G。由此可以看出,软件操作过程中显存和内存都是会不断增加的,因此我们要随时清除操作历史并保存文件。

*显卡自带处理图形专用的处理器(GPU)和存储(显存),会优先于CPU和内存调用,除了图形不兼容和运算超出的部分。

目前最高显存和内存占用的情况,三台设备均可以承受,场景的FPS将是判断显卡性能的一个标准(CPU性能也会部分影响到FPS数值)。FPS是一秒内软件图形界面的刷新次数,数值越高越流畅,硬件在软件中的效能发挥越大。

*一般单个模型100万面以上的情况很少见,因此测试保持多个模型组成的场景。不过如果是百万面的单个模型,内存占用相对会少一些,游戏显卡在着色和线框模式下FPS会降低约一半;图形显卡的着色模式FPS会降低,但线框模式FPS会得到30%的提升。

*录屏时会对硬件带来一定负荷,因此实际操作的FPS会比截屏中的数值高2FPS以上。另外,由于K4200测试的屏幕分辨率为2560*1440,macbook是2560*1600,它们相对GTX750Ti较低的1920*1080环境,实际性能仍有提升的空间。

GTX750Ti

HD 5100

K4200

低于5FPS,就像在看幻灯片;10-20FPS之间,传统2D动画片的流畅度;30FPS以上,无卡顿感的顺畅状态;大于60FPS将是最流畅的极致体验。特别补充:2017款macbookPro(集显HD Graphics 630+独显RadeonPro555),该场景在maya2018中测试为60FPS,也就是说RadeonPro555相当于K4200一半性能。

值得一提,如果在软件设置中将Display下的Viewport2.0的Rendering engine设置为OpenGL CoreProfile,在Viewport2.0模式下,图形显卡K4200的着色模式FPS略有提升(约提高10FPS),MacbookPro的HD5100能有2FPS的提升。游戏卡建议设置Rendering engine为DirectX11。

*MacbookPro的OSX系统的图形驱动是基于OpenGL,没有DirectX11的选项。

【场景2】

模型数量:9599个

多边形数量:约2000万三角面

着色形式:纯色材质+部分贴图

从资源消耗上来看,macbookPro也只是能勉强开启场景浏览,当场景发生视图变换后,硬件对于不断增长的显存和内存占用已经力不从心(同样超过了GTX 750Ti的最大显存)。

*当显存不足,显卡将划分可用内存来扩展,此时图形处理的性能将降低。

*因为场景已经超过GTX750Ti主机和MacbookPro负荷,这里仅进行OpenGL模式的对比, DirectX11模式效果大同小异。

在超高面数的场景环境下,GTX 750Ti得益于比HD5100更高的显存,线框模式下却比HD5100要流畅,这和之前200万面场景的对比是个极端的反差。不过除了面数差异,两个场景的线框模式也有一些区别:场景1使用了多种线框着色,且相互交叠,计算量大;场景2仅使用程序默认单色,镜头范围内的线条细节较少。

【特效场景测试】

当粒子充满整个画面的时候是FPS最低,取这时候的平均FPS值。


测试云属性n粒子的时候,GTX750Ti和K4200在Viewport2.0材质模式时,瞬时发生程序崩溃;而macbookPro只有在摄像机进入流体内部时候程序才发生崩溃。Viewport2.0对粒子云的显示支持并不是很好,用户使用该特效时要谨慎。

*官方给出的解决方案是:降低显卡的负载,避免过快刷新。


【总结】

三维图形对应显存和内存的资源消耗:

模型:少量显存,大量内存

材质贴图:大量显存

粒子特效:大量内存

精灵(贴图)粒子特效:大量显存,大量内存

DX游戏显卡(本例中为GTX750Ti)针对多边形几何体的材质显示进行了深度优化,但是在元素编辑上显得吃力(DX模拟OpenGL功能上力不从心)。而测试中用的线框模式的意义就在于:实时编辑场景。因为对模型的点线面进行操作的时候,材质模式会阻碍编辑操作,线框显示(或者点线面的显示)虽然数据量庞大但却是工作所必须的,并且图形显卡展现的线框效果比游戏显卡的线框效果要平滑–游戏显卡的线框显示比较粗糙,常断线(尤其在实时细分显示时候)。

OpenGL图形显卡(本例中为QuadroK4200)在硬件参数上会弱于主流游戏显卡,不过因为接口驱动对OpenGL标准下开发的3D图形具有良好的兼容,因此能承载较高数量的多边形编辑。但由于windows平台的限制,除了线框模式,图形卡针对材质模式和粒子特效并没有明显的优势,处在和DX游戏显卡的同样水平–毕竟微软的DX和OpenGL是竞争的关系。

Viewport2.0是maya为了改善硬件显示效率而增加的视图模式,尽管还有一些元素不能正常显示,不过启用它会比通常视图模式效率更高。因为传统视图是基于软件的转换,而Viewport2.0会更依赖显卡的性能,游戏显卡启用Viewport2.0的时候可以将设置模式更改为DX11,能更大发挥显卡作用。不过仅限于材质模式、OpenGL的线框模式和部分特效显示,游戏显卡在线框模式下的性能并没有得到明显的提升。特别说明:Maya2018起,Arnold渲染器替代了Mentalray渲染器,maya视图只保留了Viewport2.0的硬件实时渲染视图,专业显卡的性能得到更大发挥。

MacOSX和排斥着OpenGL的windows平台不同,它将OpenGL作为官方3D库,由苹果定制的硬件驱动针对OpenGL进行深度优化。所以就有了这样有趣的现象:性能远低于GTX750Ti的HD5100集成显卡(MacbookPro中名称为Intel Iris),在macOSX平台下却发挥出比windows下GTX750Ti更稳定的性能,甚至在某些情况下强于GTX750Ti。windows下的HD4600(Intel I7CPU搭配的集显)对于三维线框的表现和mac类似,Intel集显对OpenGL的兼容较好。
注:2015年后苹果先后在IOS和OSX中引入了自主研发的Metal API,性能更先进,有取代OpenGL的趋势

除了maya、3dsMax、C4D等三维动画设计软件,例如Unity3D游戏引擎,在选择场景模型时候也是以线框包裹形式展现,复杂模型的情况下,DX游戏卡也会发生卡顿延迟。线框和材质的需求,决定了开发游戏的硬件需求不同于玩家进行游戏的硬件需求。


【哪些领域需要专业图形显卡】

三维模型设计;

大型游戏的开发设计;

复杂矢量线条的平面设计;

有GPU渲染需求的绘图和后期合成;

跨平台图形开发,例如OSX、移动平台(android、IOS)、次时代主机的游戏制作。

简而言之,图形显卡重线框,游戏显卡重材质。从事三维设计的用户,如果不是进行高精度复杂的产品级建模,DX游戏显卡也基本能胜任(百万面以上的线框模式是弱项)。随着高分辨率图形及多屏显示的普及,显存的容量也变得更重要,现阶段2G以上的显存将是必要的。

你也可能喜欢阅读这些文章:

2 评论
Inline Feedbacks
View all comments

居然又找到这篇文章了,谢谢楼主!!太感谢了

很有趣

Copyright© VIVICG 版权所有 粤ICP备 17111516号 粤公网安备 44011102000879