首页 > 显卡 >

volta显卡从GTX过渡到RTX NVIDIA GPU架构的历史(2)

电脑杂谈　发布时间：2020-10-24 00:02:19　来源：网络整理

但是Volta是不同的。这是真正为计算而设计的另一种图形卡体系结构。与Pascal相比，即使使用了16nm改进版，GV100内核的CUDA内核数量也立即增加到5120。 12nm FFN工艺，但其各个方面的规格都令人惊叹-815mm2内核面积，211亿个晶体管，5120个CUDA内核，15TFLOPS浮点性能等等。

从GTX到RTX NVIDIA GPU架构的变迁史

在GV100核心中，每组GPC单元是14个SM单元，总共应该是84组SM单元，但是现在Tesla V100并没有像Tesla P100那样完全集成，前者使用56组SM单元，后启用了80套SM单元，总共有80x64 = 5120个CUDA内核。

此外，还有FP64单元。 GV100仍继续GP100中FP32：FP64 = 2：1的比例。每个SM单元中有32个FP64单元，理论上为2688个FP64单元。是2560。

从GTX到RTX NVIDIA GPU架构的变迁史

更重要的是，除了传统的单精度和双精度计算外，Volta架构还添加了专用的Tensor Core张量单元，用于深度学习，AI运算等。在GV100内核中，每组SM单元也都有8张量单位，因此FP32：FP64：Tensor = 64：32：8的比例存在于整个SM单位中。因此，GV100具有张量计算能力指数。 Tesla P100的Tensor计算能力高达120TFLOPS，NVIDIA声称其Tensor性能是Pascal架构的12倍。

从GTX到RTX NVIDIA GPU架构的变迁史

Volta体系结构是如此特殊，以至于NVIDIA除了TITAN V图形卡之外，还没有推出相应的消费类产品。 TITAN V已从Tesla V100的4096位和16GB减少到3072位和12GB的HBM2视频内存。，存储频率为850MHz，等效数据频率为1700MHz，带宽高达652.8GB / s。此外，TITAN V的L2缓存减少到4.5MB，这使深度学习计算性能略逊于Tesla V100（112TFLOPS），显卡电源接口为6 + 8pin，显卡TDP250W和显示器接口是3 DP + 1 HDMI。

volta显卡_英伟达volta显卡_volta显卡

2018 NVIDIA Turing架构：追逐光明的十二年，新的RTX品牌诞生了

Volta一代没有任何主流游戏卡，但这并不影响NVIDIA图形卡的布局。 GTX 10系列图形卡的时代与采矿卡市场的重新流行相吻合，从而使GTX 1060和其他图形卡不必担心销售。 2017年至2018年上半年，NVIDIA和AMD并不担心在市场上相互抢劫。仅仅出售采矿卡就可以赚大钱。因此，GTX 10系列Pascal显卡的升级周期超过2年，并且发布2年后不仅没有恢复。价格没有下降的市场，仅仅是显卡市场的一个奇迹。

但是，在2018年下半年，采矿卡崩溃了。即使NVIDIA和图形卡制造商在采矿卡库存方面遇到问题，他们仍然必须推动新的架构。 NVIDIA于8月底在德国科隆游戏展上正式发布了Turing架构。当然，这次实际上是在比赛前SIGRAPH会议上用于工作站的Quadro RTX 8000/6000系列卡。

从GTX到RTX NVIDIA GPU架构的变迁史

我们已经熟悉Turing图形卡。新一代图形卡最大的变化是从GTX到RTX的新品牌名称。 RTX代表实时光线追踪技术，因为这是Turing图形技术。在升级次数最多的地方，NVIDIA首席执行官黄仁勋在新闻发布会上热情地表示，图灵是过去12年中GPU架构的最大变化。原因是RTX。通过专用的RT Core内核，NVIDIA实现了游戏中可用的实时光线跟踪渲染。

从GTX到RTX NVIDIA GPU架构的变迁史

除RTX之外，Turing图形卡还支持Volta的Tensor Core，可用于AI加速。 NVIDIA先前还提供了可用于图形卡的多种AI游戏玩法，例如DLSS抗锯齿技术，但与RTX光学跟踪技术相比，AI加速在游戏中的应用很少，而且吸引力不足。

从GTX到RTX NVIDIA GPU架构的变迁史

在SM单元体系结构中，图灵一代不同。它与Pascal架构中的GP102 / GP104内核不同，并且更类似于Volta架构的GV100内核，因为每组SM单元已变成64个CUDA内核，其中RTX 2080 Ti使用的TU102内核被划分了分为6组GPC单元，每组GPC单元有12个SM单元，共72个SM单元，但是RTX 2080 Ti仅使用其中的68个。就是这样，68 x 64 = 4352 CUDA流处理器。

对于RTX 2080显卡使用的TU104内核，完整版的TU104内核仍然是6组GPC单元，但是每组GPC更改为8个SM单元，总共6×8 = 48个，而RTX 2080 GPU内核为TU104-400，仅使用46组，保留了2组，即46×64 = 2944，其规模比RTX 2080 Ti小得多。

支持RTX光学追逐是Turing图形卡的特征。但是，除了游戏数量的问题之外，RTX光学追逐还有一个问题，就是它的性能要求仍然太高，因此在这一代图灵图形卡中，NVIDIA RTX的市场策略也有所不同。支持RTX技术的显卡主要是RTX Titan，RTX 2080 Ti，RTX 208 0、RTX 2070和RTX2060。不支持RTX的显卡将成为GTX 16系列，包括GTX 1660 Ti，GTX 1660和刚刚发布的显卡。 GTX 1650显卡。

从GTX到RTX NVIDIA GPU架构的变迁史

RTX 20系列图形卡的规格

从GTX到RTX NVIDIA GPU架构的变迁史

GTX 16系列图形卡的规格

总结：第五代GPU的性能得到了极大的提高，具有更高的能效，但价格也更高

从2012年的开普勒图形卡到今天，NVIDIA图形卡已经推出了五代架构。如果计算每一代的核心和游戏核心，则至少有10个模型。这些图形卡的处理技术也来自28nm。一直升级到16nm和12nm。在游戏性能方面，根据Chaoneng.com的显卡排名，当今的RTX 2080 Ti显卡的性能约为GTX 480显卡的7倍，GPU晶体管的数量也从30亿增加到21亿元，基本符合业绩增长。

如果考虑性能和功耗，多年来NVIDIA显卡的能效已大大提高。毕竟，大核的TDP功耗多年来一直保持在250-300W之间，但性能却提高了6-7倍。

此外，我们没有详细提及前几代显卡的价格，但是这种趋势也很明显。在GTX 400至GTX 700阶段，高端显卡的价格为3999元，但价格近年来有所上涨。 NVIDIA在这里尤其明显。 Titan显卡从最初的7999元涨到了20000元，而主流市场中的旗舰显卡价格也涨到了6000多元。 RTX 20世代已经提高了价格。 RTX 2080 Ti出售。价格直接达到了9999元，这是过去Titan显卡的水平。

从GTX到RTX NVIDIA GPU架构的变迁史