Oct 13, 2020

GPU必知 | 不为RTX 30设限,这般配置发挥每一分能力

随着新一代RTX 30系列GPU的火爆开售,近期很多人都在问什么样的CPU才能带的动RTX 3080甚至RTX 3090。那么这个带的动到底是什么意思呢?一般认为带得动就是不会给GPU制造瓶颈。接下来我们通过一系列评测看下比较适配的算力定制方案。





最新GPU深度学习性能排行





下图展示了当前热门的Nvidia GPU在深度学习方面的性能表现(以RTX 2080Ti为对比基准)。从图中可以看出,A100(40GB)在深度学习方面表现最为强劲,是RTX 2080 Ti 两倍还多;新出的RTX 3090(24GB)排第二,是RTX 2080 Ti 的1.5 倍左右。但比较良心的是,RTX 3090 的价格只涨了15%。



排在天梯图顶端的GPU确实是香,其次是性价比选择,建议依据各种任务的大致内存需求,结合上图进行细分筛选:


  • 使用预训练 transformer 和从头训练小型 transformer:>= 11GB

  • 训练大型 transformer 或卷积网络:>= 24 GB

  • 原型神经网络(transformer 或卷积网络):>= 10 GB

  • Kaggle 比赛:>= 8 GB

  • 应用计算机视觉:>= 10GB




高频CPU避免成为GPU瓶颈






CPU作为通用处理器需要计算电脑中的每一个细节,3D画面配合输出,单位运动轨迹计算,后台程序保持运行,还有音频、网络信号不断交换处理。



上图为主流CPU搭配RTX 3080在1080P下的测试数据,很明显,锐龙7 3800X或更低的CPU没有发挥出RTX 3080显卡的真正实力,也就是成了这套系统在1080P分辨率下的“瓶颈”。i9-9900K或锐龙7 3800XT及更高的CPU更适合RTX 3080组成系统。


再来看下3DMark理论性能测试,结合上图筛选,在测试中我们选择了Intel和AMD平台的最强的处理器锐龙9 3900X和i9-10900K。



总结一下,主要用1080P~2K分辨率的话,PCIe 3.0和4.0差别不大。4K起步的话,要想压榨出RTX 30的每一分能力,就真的应该考虑PCIe 4.0,还可以搭配最能发挥RTX IO功能的PCIe 4.0 SSD。


同时电源功率要够大,Nvidia官方给的信息是RTX 3070配650W,RTX 3080/3090配750W即可,但实际850W以上也挺好的。




定制RTX 30系列工作站

高校科研用户可领专属补贴






Cloudhin®云轩专注Deep learning和高性能计算服务器定制,针对主要深度学习框架(如TensorFlow、Caffe 2、Theano或Torch)进行了优化和设置,为计算系统提供强大的深度学习功能。



工作站CPU可选R7-3700X/R7-3800XT/R9-3900XT/R9-3950X等多线程处理器,7nm先进制程工艺,功耗更低,性能更强,频率更高,同步多任务更快速。支持更强PCIe 4.0接口32GB/s带宽,数据传输更迅猛,扩展能力更强。


PCIe 4.0两倍于过去的CPU通信带宽,可以带来更好的GPU计算能力,NVIDIA新一代RTX 30系列GPU,全系支持PCIe 4.0 ,助力开发者们构建并加速HPC、基因组学、计算金融、数据科学、人工智能、影视后期等领域的应用。



专业勤修,锐意进取。云轩技术工程师毕业于NVIDIA深度学习研究所,丰富经验,值得信赖。更多定制方案请联系客服,我们将实时响应您的定制需求。




联系我们


如果您有合作需求或宝贵建议,欢迎来信。

邮箱:hezuo@kuanfans.com

合作热线:021-5415 5559