May 14, 2020

GTC20|Ampere将问世,纵览12年GPU架构发展史

NVIDIA创始人兼首席执行官黄仁勋将于北京时间5月14日晚9时,通过NVIDIA官方网站在线发布GTC 2020主题演讲。通过线上主题演讲,黄仁勋将重点介绍公司在AI、高性能计算、数据科学、自主机器、医疗及图形领域的最新创新。




01>>


NVIDIA GPU今年或是双胞胎:安培&霍普


我们在一份NVIDIA官方公告中发现,“Get Amped”作为开头出现,这次推出7nm安培(Ampere)架构应该是板上钉钉了。



不过2020年的GTC可能不止于此,NVIDIA还有可能更新GPU路线图,公布5nm Hopper(霍普)GPU


深挖三星、台积电泄露的信息来看,NVIDIA今年的GPU计划很庞大,7nm工艺用于安培GPU,但它很有可能主要用于计算卡市场,而5nm工艺则是给下下代架构Hopper(霍普)准备的,这才是面向消费级游戏卡市场的,也意味着RTX 3080 Ti要变成5nm工艺了。



如果按照这个路线发展,那么今年的GPU倒是跟之前的Volta伏打、Turing图灵差不多,两代GPU面向的市场不同,使用的工艺、架构也不同,NVIDIA是彻底把游戏与计算卡市场分开了。



02>>


NVIDIA GPU架构发展史


众所周知,CPU的发展符合摩尔定律:每18个月速度翻倍。


处理芯片晶体管数量符合摩尔定律,图右是摩尔本人


而NVIDIA创始人黄仁勋在很多年前曾信誓旦旦地说,GPU的速度和功能要超越摩尔定律,每6个月就翻一倍。NVIDIA的GPU发展史证明,他确实做到了!GPU的提速幅率远超CPU



NVIDIA GPU架构历经多次变革,从起初的Tesla发展到最新的Turing架构,发展史可分为以下时间节点:


❖2008 - Tesla

Tesla最初是给计算处理单元使用的,应用于早期的CUDA系列显卡芯片中,并不是真正意义上的普通图形处理芯片。


❖2010 - Fermi

Industrial Light and Magic首席技术官Richard Kerris发起了首届GPU技术大会,该大会聚集了高性能计算领域最聪明的人才。NVIDIA利用该活动推出其代号为 “Fermi” 的下一代CUDA GPU架构。Fermi是第一个完整的GPU计算架构。首款可支持与共享存储结合纯cache层次的GPU架构,支持ECC的GPU架构。


NVIDIA与谷歌合作在其Tegra处理器上发挥Android的功能。


资料来源:电子工程世界


❖2012 - Kepler

Kepler相较于Fermi更快,效率更高,性能更好。基于Kepler的GeForce GTX 600系列,可提供当时世界上最快的游戏性能。橡树岭国家实验室推出世界顶级超级计算机Titan,当时也是由基于Kepler的NVIDIA Tesla GPU提供动力。


资料来源:电子工程世界


❖2014 - Maxwell

其全新的立体像素全局光照 (VXGI) 技术首次让游戏 GPU 能够提供实时的动态全局光照效果。基于 Maxwell 架构的 GTX 980 和 970 GPU 采用了包括多帧采样抗锯齿 (MFAA)、动态超级分辨率 (DSR)、VR Direct 以及超节能设计在内的一系列新技术。



❖2016 - Pascal

Pascal 架构将处理器和数据集成在同一个程序包内,以实现更高的计算效率。1080系列、1060系列基于Pascal架构。



❖2017 - Volta

Volta 配备640个Tensor 核心,每秒可提供超过100万亿次浮点运算(TFLOPS) 的深度学习效能,比前一代的Pascal 架构快5倍以上。基于Volta架构的NVIDIA Tesla V100是NVIDIA当前最为先进的人工智能 GPU



❖2018 - Turing

Turing架构配备了名为RT Core的专用光线追踪处理器,能够以高达每秒 10 Giga Rays 的速度对光线和声音在 3D 环境中的传播进行加速计算。Turing架构将实时光线追踪运算加速至上一代NVIDIA Pascal™ 架构的25倍,并能以高出CPU 30多倍的速度进行电影效果的最终帧渲染。同时Turing还配备全新Tensor Core(一款用于加速深度学习训练和推理的处理器),能够极大加速 AI 增强功能,如去噪、分辨率缩放和视频调速,并有助构建具有全新超强功能的应用程序。2060系列、2080系列显卡也是跳过了Volta直接选择了Turing架构。




03>>


宽泛科技—NVIDIA潜力AI公司加速计划成员


众所周知,NVIDIA的GPU在目前是云端人工智能加速的主流解决方案,大多数深度学习库都对英伟达GPU提供最佳支持。



宽泛科技作为英特尔、英伟达等芯片及品牌厂商的核心合作伙伴,NVIDIA潜力AI公司加速计划成员,携手专注为人工智能提供硬件解决方案及相关服务,已成为国内过万家企业、院校及研究机构的信息化解决方案供应商。



旗下Cloudhin®云轩支持Deep learning和高性能计算服务器定制,针对主要深度学习框架(如TensorFlow、Caffe 2、Theano或Torch)进行了优化和设置,在桌面上即可提供强大的深度学习功能。



WS4128深度学习工作站热销中,搭载第9代8核Intel Core i9-9900K不锁频处理器,按需可选择双路Nvidia TITAN RTX/TITAN V/RTX 20系列显卡适配。强强联合,让您尽享GPU加速人工智能和深度学习的强大功能,帮助AI开发者和数据科学家更快捷地取得成果。