1x摄影

iGame RTX 3080 Ti首测 越级提升赶超3090

admin 16

显卡市场近一年可谓跌宕起伏,玩家经历了最初发布时的狂喜,受矿潮影响又经历了天价显卡和全球无货的局面。不过好在NVIDIA官方及时出面,除GeForceRTX3090外,已经推出及后续要推出的显卡将全部限制哈希率,也就是以太坊算力,来限制疯狂的挖矿行为。今天给大家带来的是时隔半年推出的又一款旗舰级显卡——iGameGeForceRTX3080TiVulcanOC。


在这里先说明一下,此次评测的iGameGeForceRTX3080TiVulcanOC在包装上不会有任何限制算力的标注,“LiteHashRate”或者“LHR”的说明只针对已经发售的显卡,后续为了方便区分才会在包装上进行标注。

iGameGeForceRTX3080TiVulcanOC


iGameGeForceRTX3080TiVulcanOC

下面我们回到本次评测的iGameGeForceRTX3080TiVulcanOC显卡,Vulcan(火神)系列是iGame家族的旗舰产品,在做工用料以及性能上,都能表现出其高端定位,在测试开始前,笔者先将这款显卡的特点列出方便大家阅读:

超强性能性能测试优于公版GeForceRTX3090

显示效果出色地LCD侧显示屏

一键超频按钮方便快捷

赛博朋克风格外甲设计

总的来说,iGameGeForceRTX3080TiVulcanOC这款显卡在公版的基础上性能有很大提升,甚至超越了公版GeForceRTX3090,不过售价却更便宜。关于这款卡的定位,通过6月1日的发布会我们也能清楚了解到,就是旗舰游戏卡。相比GeForceRTX3090最大的差别就是少了12GB显存,不过对于游戏来说12GB显存在4K分辨率下也已经足够。如果你是游戏发烧友,在6月3日的显卡发售日,不妨试试手气。

下面我们先来看看在架构上有哪些改动,官方白皮书上对比的对象为GeForceRTX2080Ti,相较于上一代的NVIDIATuring架构,NVIDIAAmpere架构下的GeForceRTX3080Ti每个时钟执行2次着色器运算,而Turing为1次,GeForceRTX3080Ti的着色器性能达到34TFLOPS单精度性能,而Turing为14TFLOPS。


第一代NVIDIARTX架构Turing下的RTX2080Ti


第二代NVIDIARTX架构Ampere下的RTX3080Ti

NVIDIAAmpere架构翻倍了光线与三角形的相交吞吐量,RTCore达到67RTTFLOPS,而Turing为43RTTFLOPS。而且第二代光线追踪最重要的不仅仅是性能提升,还增加了对游戏中运动模糊部分场景的光线追踪计算加速。

第三代TensorCore可自动识别并消除不太重要的DNN权重,处理稀疏网络的速率是Turing的两倍,算力高达273TensorTFLOPS,而Turing为114TensorTFLOPS。

GeForceRTX3080Ti仍然采用了GA102核心,与GeForceRTX3080/3090相同,下面我们来看一看GeForceRTX3080Ti在GA102中做了哪些改动。


完整的GA102核心

完整的GA102GPU包含7个GPC(图形处理集群)42个TPC(纹理处理集群)以及84个SM(流处理器)组成,而GeForceRTX3080Ti的CUDA数量是10240个,所以可以推断GeForceRTX3080Ti屏蔽了两组TPC,所以只有80个SM单元,而完整GA102核心的CUDA数量应该是10752个。


为了查询方便,笔者将这几款显卡的核心参数列出,可以看到GeForceRTX3080Ti与GeForceRTX3090的核心参数非常接近。相差的两个SM单元,也就是1组TPC,256个CUDA,其实在实际应用中来讲差距并不是很大,最大差别是GeForceRTX3090相比GeForceRTX3080Ti多了12GB的显存;而相比RTX3080来说提升就非常大了。

关于这张卡的定位,更多的还是旗舰游戏,它从参数来看相比GeForceRTX3080提升很多,非常接近GeForceRTX3090,仅是显存相差12GB,而大显存对于软件渲染来说又是至关重要的,正如GeForceRTX3090在发布之初的定位,就是专注于内容创作者。

如图我们使用Keyshot9做测试,渲染8K或4K素材的显存占用率非常高,能达到17GB甚至更高,这对于只有12GB显存的RTX3080Ti就完全不够了,爆显存的危害想必大家也知道,可以导致游戏或软件崩溃,从而进程丢失。

GeForceRTX3080Ti采用了GA102核心,拥有280亿(28000million)个晶体管,628平方毫米的面积,基于三星的8nmNVIDIA定制工艺,来自Micron的GDDR6X显存。

本次NVIDIAAmpere架构的SM在Turing架构基础上增加了一倍的FP32运算单元,这使得每个SM的FP32运算单元数量提高了一倍,同时吞吐量也就变为了一倍。

而通常我们计算显卡的CUDA数量,并不是把SM中的所有单元加起来计数,而是只统计FP32单元的数量,所以这样一来,SM中的【FP32:INT32】从1:1变为2:1。

GeForceRTX3080Ti共有10240个CUDA,其实它有5120个INT32单元,但由于内部的FP32数量翻了一倍,所以最终实现了10240的CUDA数量。

而这样粗暴的提升CUDA数量对于游戏其实有着非常大的帮助,通常在游戏中浮点运算相比整数计算要常用的多,图形、算法以及各种计算操作中着色器工作负载通常需要混合使用FP32算数指令,而FP32的加速也有助于光线追踪降噪着色器。

在去年与GeForceRTX30系显卡一同发布的还有一项新技术——RTXIO。目前很多游戏动辄几十G甚至百G的安装空间,对于存储空间的负担暂且不提,但存放在硬盘中的数据,如果显卡想要读取到,需要先由CPU从硬盘中读取压缩过的数据,经过解压缩再发送到显存中。

虽然随着NVMeSSD的推出,读取速度相较机械硬盘能够快20倍,但受制于传统I/O限制,NVMe高达7GB/秒的高速读写对于CPU是极大的负担。

传统的数据交换

在这个过程中,会占用多个CPU核心,压力急剧增大,占用较多的内存,而此时其实GPU是处于闲置状态的。RTXIO的作用就是越过CPU解压再传输数据这一步,直接从PCIE总线读取硬盘上经过压缩的数据,并且完成无损GPU解压,降低CPU占用,变向提升了性能。

RTXIO可以极大解放CPU负担

当然这项技术作为系统底层的运行方式改变,还需要借助微软发布的DirectStorage来实现,对于目前容量的游戏来说,RTXIO的改善效果有限,但假以时日等游戏容量上百G成为常态的时候,这项技术将会发挥巨大的功效。

在GeForceRTX30系列中,iGame的Vulcan系列将外甲重新设计,原本GeForceRTX20系的甲胄式设计,改变为赛博朋克风格的科技感设计。“赛博朋克”这个词近年来出现频率极高,不止因为《赛博朋克2077》这款游戏,整个赛博朋克文化也正在愈演愈烈。

典型的赛博朋克风格

所以,究竟什么是“赛博朋克”?它是一种世界观,还是美学?我们经常听过那么一句话“遇事不决量子力学;不懂配色赛博朋克”,这个词给人更多的似乎在传达一种画面感。

其实赛博朋克是两个词语的结合,“赛博”和“朋克”,赛博(Cyber)即计算机网络或控制论,朋克(Punk)则是一种非主流反叛的亚文化,后来指那些叛逆的另类青年,跟主流社会格格不入。

《攻壳机动队》的设定也是赛博朋克世界

在赛博朋克的世界中,一切都受到高度控制,所有东西都自动化运作,富人、社会名流、精英享受着美好生活;底层的大量贫民生活条件恶劣,没钱消费,没办法把握自己的命运,内心苦闷,不知出路何在,非常迷茫,行为和价值观完全是叛逆的。精神萎靡,沉迷于各种娱乐,寻求麻醉和逃避。可以说自诞生起,赛博朋克就有着天然的反资本主义气息。

《银翼杀手2049》

“高科技、地生活”可以很好地概括赛博朋克世界中的人们,如表现赛博朋克的一部经典电影《银翼杀手2049》,在影片中经常伴随着雨雪交加。霓虹闪烁的夜空下,潮湿的路面变成了反光源,衬托出都市畸形的繁华,整个城市充满故障和错位感。

特斯拉充满未来感的皮卡

此前特斯拉发布的一款皮卡就非常具有赛博朋克未来感,硬朗的线条,冰冷的金属配色,充分体现了机械亦有灵的理念。而iGameGeForceRTX3080TiVulcanOC的外甲也借鉴了特斯拉皮卡的设计,暗冷色调搭配内敛的LED灯,给人十足的赛博朋克风格。

iGameGeForceRTX3080TiVulcanOC

说回今天显卡的主题,iGameGeForceRTX3080TiVulcanOC在外甲设计部分已经讲了很多,另外在显卡导流罩边缘部分也增加了科技感纹理,整体棱角分明,在光线经过产品表面时会有明显的明暗变化,科技感十足。

iGameGeForceRTX3080TiVulcanOC

并且由于这款显卡更是定位旗舰游戏,在散热方面也更加下功夫,三个主动散热风扇均采用了13叶边缘折角的“捕风手”风扇,可将气旋压入散热器内实现风压及进风量的进一步提升。

另外一个细节就是,iGameGeForceRTX3080TiVulcanOC三个风扇中央的logo牌均采用双层处理,上面的一层可手动旋转角度,不会随着风扇启动而旋转。

iGameGeForceRTX3080TiVulcanOC背板展示

iGameGeForceRTX3080TiVulcanOC的金属背板从远处看非常具有视觉冲击力,“三角形”的视觉符号从嵌入的LED灯呈放射状发散开,立体感十足。

iGameGeForceRTX3080TiVulcanOC

在显卡侧面,最引人注意的就是全新的LCD侧显示屏——“维”,打开包装后屏幕默认贴合显卡,适合正常装机的用户;另外这个LCD屏还可翻转90°,适合竖装显卡的用户,后面我们会单独结合iGameCenter来讲这块屏幕,我们接着往下看。

iGameGeForceRTX3080TiVulcanOC显卡尾部的接口

在iGameGeForceRTX3080TiVulcanOC显卡的尾部有两个接口,左侧白色的为主板灯光同步接口,右侧的为LCD侧显示屏上传图片的数据线接口,数据线的另一头需要接在主板上的USB9针插槽上,注意不要接到开机跳线的9针上,两个针口非常相似。

iGameGeForceRTX3080TiVulcanOC供电接口

iGameGeForceRTX3080TiVulcanOC由于定位于游戏旗舰,性能目前仅次于GeForceRTX3090,在功耗上也比较大,一键超频后能达到370W,所以供电接口采用了8pin*3的设计,玩家在购买前需要注意电源是否支持。

想要玩转iGameGeForceRTX3080TiVulcanOC一定要下载iGameCenter这款官方软件,LCD屏幕的自定义功能及各种数据的显示都要靠它来完成。

首先iGameCenter软件的第一栏会显示电脑的基本信息,包括CPU、GPU、内存、网络、风扇等,做到实时监控。

第二栏会详细展示显卡的功能设置,在主页面中可进行手动超频及风扇散热调整。这里注意,如果没有超频经验的用户切勿随意拖动数值,尤其是大部分用户见到这种数值条喜欢直接拉满……

在屏幕设置中,用户可以自定义屏幕显示内容,这里可以实时显示显卡数据、自定义文字以及自定义图案,如果用户想上传图片或GIF,这块屏幕的尺寸为480×128px,可在其他软件截取后上传。

这块LCD侧屏的显示素质非常好,我们将Marbles图片上传后发现几乎和显示器所显示的效果一模一样,但通过相机拍摄始终会有摩尔纹,无法体验到最直观的效果。

如此精美的一块屏幕只显示图片多少有些浪费,笔者上传了一段《暗黑破坏神》手游的GIF图,可以看到显示效果也非常流畅。

软件的第三栏可以自定义调节灯光,具体的种类就不在这里介绍了,除了灯光模式,还支持调节亮度、速度以及流动方向。

最后一栏则是各种硬件的详细参数,这里相较第一栏的硬件整体状态更加细分,包括各个风扇的转速、GPU使用率、显存使用率、显存使用情况等等。

首先介绍一下测试平台,为了保证此次评测能够发挥iGameGeForceRTX3080TiVulcanOC显卡的最佳性能,主板和CPU采用了目前桌面旗舰级配置,具体如下。

在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值。

GPU-Z参数

首先看一下GPU-Z的参数,iGameGeForceRTX3080TiVulcanOC采用GA102核心,三星8nm工艺,芯片面积628平方毫米,拥有10240个CUDA,Boost频率达到1710MHz,相较公版的1665MHz有很大提升。采用12GBGDDR6X显存,位宽为384bit,显存带宽达到了912.4GB/s,光栅单元和纹理单元为112和320。

下面先进行的是用来衡量显卡DX11理论性能的3DMARKFS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下(所有测试项均为一键超频后1710MHz测试结果):

3DMARKFS套装测试

在针对显卡DX11性能的3DMARKFS套装测试中,我们选择了上代和本代的4张显卡进行分值对比,以便能更好的反应iGameGeForceRTX3080TiVulcanOC的性能水平。

在该测试中可以发现显卡性能出现了越级的情况,iGameGeForceRTX3080TiVulcanOC甚至超越了GeForceRTX3090的测试分数,这也印证了笔者在公版测试中的观点。

综合超越虽然只有3%,但两款下卡本就不在一个系列上,价格也有一定差距,所以这次发布的Ti型号可以说非常划算了。

3DMARKTS套装测试

而在针对DX12环境下的TimeSpy和TimeSpyExtreme测试中,iGameGeForceRTX3080TiVulcanOC的分数与GeForceRTX3090的分数基本持平。对比GeForceRTX3080的分数要高出7%左右;对比上一代GeForceRTX2080Ti的分数要高出43%左右。

3DMARK光追测试

PortRoyal是3DMARK中专门针对光追性能的测试项,在这组测试中iGameGeForceRTX3080TiVulcanOC再次超越GeForceRTX3090,分数领先2%;对比GeForceRTX3080的分数提升约为15%;对比上一代GeForceRTX2080Ti的分数提升则非常大,约为66%。

在游戏性能测试中,我们选择了《德军总部新血脉》、《孤岛惊魂5》、《刺客信条:英灵殿》、《无主之地》,国产游戏《边境》、《光明记忆:无限》的benchmark跑分软件。

另外在游戏测试中,由于显卡驱动的版本更新和游戏更新非常影响游戏帧数,所有benchmark跑分成绩均以本次成绩为准。

《刺客信条:英灵殿》游戏测试

尽管在理论测试环节中iGameGeForceRTX3080TiVulcanOC在各个环节都小幅领先GeForceRTX3090,但实际游戏中的差距并不明显,但这也可能和游戏本身的优化有关,后面我们再看更多测试。

在《刺客信条:英灵殿》中iGameGeForceRTX3080TiVulcanOC和GeForceRTX3090的大部分分数相同,仅有1帧的差距。同时GeForceRTX3080的分数差距在1080P和2K分辨率下也并不大,主要是4K分辨率会有10%左右的差距。

《德军总部新血脉》游戏测试

《德军总部新血脉》并且由于自带两个benchmark,所以我们的数据取跑分均值,另外这款游戏几乎每更新一次驱动或者游戏版本升级都会导致分数的巨大差异,在本次重新测试中,iGameGeForceRTX3080TiVulcanOC再次领先GeForceRTX3090,而相比GeForceRTX3080的提升约为5%左右。

《孤岛惊魂5》游戏测试

《孤岛惊魂5》同样算是优化比较到位的3A大作,但在benchmark的帧数测试中经常会不稳定,在本次测试中iGameGeForceRTX3080TiVulcanOC在2K和4K分辨率下要优于GeForceRTX3090,其中4K分辨率下的成绩要领先GeForceRTX308020%左右。

《无主之地3》游戏测试

《无主之地3》是一款采用了卡通渲染风格的游戏,它对于性能要求的下限很低而上限又很高,另外我们注意到,在本次测试中大部分游戏1080P分辨率的成绩基本没有差距,这也是因为如此高性能的GPU在1080P分辨率下已经绰绰有余,开始受制于CPU的性能。

《光明记忆:无限》游戏测试

《光明记忆:无限》是由飞燕群岛工作室开发的《光明记忆》新系列,目前还没有游戏提供试玩,不过benchmark的跑分软件官方已经提供,玩家可以在steam上自行下载。另外我们在测试的时候由于无法关闭光追选项,故所有测试成绩均为“RTX最高/DLSS质量”模式下进行。iGameGeForceRTX3080TiVulcanOC整体以微弱的优势胜出,但看得出在整体性能趋同的情况下,三款显卡的分数差距并不大。

《边境》游戏测试

在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“RTX最高/DLSS质量”下进行。

功耗测试中,我们选择FurMark软件进行拷机测试,并采用GPU-Z检测温度,功耗仅计算显卡自身。

iGameGeForceRTX3080TiVulcanOC经过我们的实测在满载状态下单卡功耗为370W(一键超频后)左右,作为目前整体性能与GeForceRTX3090相仿的情况下,建议搭配750W及以上电源。

温度方面,本次的iGameGeForceRTX3080TiVulcanOC经过15分钟左右的拷机,温度稳定为69℃左右,在更高频率的情况下比GeForceRTX3080Ti低了6℃左右,并且频率稳定无降频情况。

上面我们测试了部分游戏的光追和DLSS性能表现,这些效果具体在游戏中是什么表现,下边笔者选择了两款游戏给大家展示一下。

在《赛博朋克2077》中,光追效果随处可见,而在游戏中也运用到了不同的光追效果,包括最常见的光追反射、阴影,还有环境光遮蔽、漫反射照明以及全局光照等比较高级的效果。

在网游《逆水寒》中,由于光追效果正处于试验阶段,并没有如宣传片一样的水面反射。但画面整体的阴影更加真实,如头顶树木的阴影,以及水面上荷叶的效果。而且由于光追效果较少,在打开该功能后帧数并没有明显下降。

堡垒之夜的光追效果还是比较明显的,其中加入了反射、全局照明和路径追踪等效果。卡车车身上的反射较为明显,角色身上的环境光在打开光追后更为写实,另外仔细看的话远处建筑物的玻璃同样有光线的反射,整体画质改善非常明显。

《魔兽世界9.0》同样作为一款卡通渲染的网游来说,魔兽的年代更加久远,此次加入光追效果在整体视觉上没有堡垒之夜明显。不过如远处的树木阴影,以及近处石台下方的阴影都比较明显。

《控制》这款游戏所采用的引擎物理效果非常出色,同时光追开关的对比也是肉眼可见的明显。包括玻璃上的人物反光,远处地面的植物反光都比较清晰,同时打开光追后屋顶处的明暗对比也更加明显。

《赛博朋克2077》DLSS模式对比

DLSS的对比测试我们选择《赛博朋克2077》这款游戏,2K/RTXON/DLSS关闭原生画质下作为标准,在打开DLSS质量模式后可以看到整体画面几乎没有任何变化,广告牌的字样边缘依然很清晰。在DLSS平衡和DLSS性能模式中依然有着不错的状态,整体相较原生画质并无二致。

《逆水寒》DLSS模式对比

画质说明

在《逆水寒》的DLSS测试中,我们将画面设置为4K分辨率,画质为预设最高。通过关闭、快速、超级性能,3种不同模式来进行帧数以及画面的对比。

首先在关闭DLSS中,游戏帧数为26帧原生画质,打开DLSS快速模式后为41帧,而打开DLSS超级性能模式后为57帧。通过放大图片不难发现原生画质和DLSS快速模式的区别很小,而DLSS超级性能模式中角色背后的装饰会变模糊,以及木条箱的纹理边界会有较明显变化。但帧数提升却非常明显。

NVIDIAReflex

在20系显卡中NVIDIA反复提及的“帧能赢”,在30系显卡中也做了更进一步的突破,除了NVIDIA将推出自己的电竞显示器NVIDIA360HzG-SYNCESPORTS,还有NVIDIAReflex技术。

以往如果想测量系统延迟需要高速相机以及定制的LED鼠标电路。而使用带有NVIDIAReflex技术的显示器将内置精确的延迟分析工具,可在CPU和GPU中优化渲染管道,极大减少延迟时间,将系统延迟整体降低至30ms以下。不过就像图中所示,为此你需要一个支持反射延迟分析的鼠标。

NVIDIABroadcast是一款易用且专业的直播软件,它的强大之处就在于主播不再需要任何的背景布置,只需要一个普通的摄像头和一张GeForceRTX系列的显卡即可。

宠物派对直播

这款软件可以让你杂乱无章的房间立即变成直播间,其内置了音频降噪、背景虚化、虚拟背景、头部追踪等功能。NVIDIABroadcast的工作原理是利用AI算法通过DGX超级计算机深度学习而来。

NVENC编码

同时RTX30系显卡拥有目前最好的硬件解码器,大部分用户的电脑在直播时打开OBS推流后CPU占用会直接飙升到50%左右,而基于GPU的NVENC解码可以极大地减轻CPU负担。

对于内容创作者来说,提到软件可能大部分只会想到内容创作的相关软件,但NVIDIA专为内容创作者推出的NVIDIAStudio驱动则是承担着连接创作软件和显卡功能的关键。

NVIDIAStudio

以GPU渲染为14.98秒而CPU渲染为11分钟

当然NVIDIAStudio的加速创作绝不止Adobe一家,DaVinci、Keyshot、Bler、D5等专业软件中都有非常亮眼的表现。不仅能提供强大且稳定的运行环境,更能以GPU加速,有效提升创作效率。

奇迹,又一个性能奇迹。在同一代显卡越级的情况并不多见,而且还是在两款显卡均在售的情况下。本次iGameGeForceRTX3080TiVulcanOC在频率提升后频繁超越GeForceRTX3090,但精明如NVIDIA不会想不到非公版显卡推出后的情况,难道真的是这一刀失手了吗?

iGameGeForceRTX3080TiVulcanOC

首先外观部分,iGameGeForceRTX3080TiVulcanOC依旧延续了此前的赛博朋克风格,并且LCD屏幕依旧精致,你甚至可以上传一段精彩的GIF动图来播放。

在性能上,iGameGeForceRTX3080TiVulcanOC的Boost频率为1710MHz,通过实测我们也看到大部分分数均超越了GeForceRTX3090,这也印证了笔者在公版首测中的观点,另外我们也有理由怀疑公版GeForceRTX3080Ti是否故意压低了频率不让这张卡太出风头。

iGameGeForceRTX3080TiVulcanOC

关于这张卡的定位,笔者认为GeForceRTX3080Ti为游戏旗舰。坦白来说两组SM单元对性能影响并不大,但12GB显存在特定的时候却能发挥大作用。

对于游戏用户来讲24GB确实有些浪费了,而对于生产力工具来说,在4K/8K素材渲染时,往往能占用12GB甚至更多,爆显存对于软件渲染来说是非常致命的,轻则报错无法渲染,重则软件崩溃进程丢失。所以这两款显卡在细分领域来说还是有所区别,GeForceRTX3080Ti更注重游戏。

iGameGeForceRTX3080TiVulcanOC

价格方面,NVIDIA公版的GeForceRTX3080Ti已经公布价格为8999元,根据现在显卡的行情来看着实有性价比。不过非公版尚未公布价格,按照Vulcan系列以往的定位预估在1之间。虽然本次的发布的显卡限制了挖矿,但具体出货量尚不清楚,极有可能还是一卡难求,手气好的小伙伴不妨在首发试试运气。

(7692157)