b2科目四模拟试题多少题驾考考爆了怎么补救
b2科目四模拟试题多少题 驾考考爆了怎么补救

volta显卡 从GTX过渡到RTX NVIDIA GPU架构的历史(2)

电脑杂谈  发布时间:2020-10-24 00:02:19  来源:网络整理

但是Volta是不同的。这是真正为计算而设计的另一种图形卡体系结构。与Pascal相比,即使使用了16nm改进版,GV100内核的CUDA内核数量也立即增加到5120。 12nm FFN工艺,但其各个方面的规格都令人惊叹-815mm2内核面积,211亿个晶体管,5120个CUDA内核,15TFLOPS浮点性能等等。

从GTX到RTX NVIDIA GPU架构的变迁史

在GV100核心中,每组GPC单元是14个SM单元,总共应该是84组SM单元,但是现在Tesla V100并没有像Tesla P100那样完全集成,前者使用56组SM单元,后启用了80套SM单元,总共有80x64 = 5120个CUDA内核。

此外,还有FP64单元。 GV100仍继续GP100中FP32:FP64 = 2:1的比例。每个SM单元中有32个FP64单元,理论上为2688个FP64单元。是2560。

从GTX到RTX NVIDIA GPU架构的变迁史

更重要的是,除了传统的单精度和双精度计算外,Volta架构还添加了专用的Tensor Core张量单元,用于深度学习,AI运算等。在GV100内核中,每组SM单元也都有8张量单位,因此FP32:FP64:Tensor = 64:32:8的比例存在于整个SM单位中。因此,GV100具有张量计算能力指数。 Tesla P100的Tensor计算能力高达120TFLOPS,NVIDIA声称其Tensor性能是Pascal架构的12倍。

从GTX到RTX NVIDIA GPU架构的变迁史

Volta体系结构是如此特殊,以至于NVIDIA除了TITAN V图形卡之外,还没有推出相应的消费类产品。 TITAN V已从Tesla V100的4096位和16GB减少到3072位和12GB的HBM2视频内存。 ,存储频率为850MHz,等效数据频率为1700MHz,带宽高达652.8GB / s。此外,TITAN V的L2缓存减少到4.5MB,这使深度学习计算性能略逊于Tesla V100(112TFLOPS),显卡电源接口为6 + 8pin,显卡TDP250W和显示器接口是3 DP + 1 HDMI。

volta显卡_英伟达volta显卡_volta显卡

2018 NVIDIA Turing架构:追逐光明的十二年,新的RTX品牌诞生了

Volta一代没有任何主流游戏卡,但这并不影响NVIDIA图形卡的布局。 GTX 10系列图形卡的时代与采矿卡市场的重新流行相吻合,从而使GTX 1060和其他图形卡不必担心销售。 2017年至2018年上半年,NVIDIA和AMD并不担心在市场上相互抢劫。仅仅出售采矿卡就可以赚大钱。因此,GTX 10系列Pascal显卡的升级周期超过2年,并且发布2年后不仅没有恢复。价格没有下降的市场,仅仅是显卡市场的一个奇迹。

但是,在2018年下半年,采矿卡崩溃了。即使NVIDIA和图形卡制造商在采矿卡库存方面遇到问题,他们仍然必须推动新的架构。 NVIDIA于8月底在德国科隆游戏展上正式发布了Turing架构。当然,这次实际上是在比赛前SIGRAPH会议上用于工作站的Quadro RTX 8000/6000系列卡。

从GTX到RTX NVIDIA GPU架构的变迁史

我们已经熟悉Turing图形卡。新一代图形卡最大的变化是从GTX到RTX的新品牌名称。 RTX代表实时光线追踪技术,因为这是Turing图形技术。在升级次数最多的地方,NVIDIA首席执行官黄仁勋在新闻发布会上热情地表示,图灵是过去12年中GPU架构的最大变化。原因是RTX。通过专用的RT Core内核,NVIDIA实现了游戏中可用的实时光线跟踪渲染。

从GTX到RTX NVIDIA GPU架构的变迁史

除RTX之外,Turing图形卡还支持Volta的Tensor Core,可用于AI加速。 NVIDIA先前还提供了可用于图形卡的多种AI游戏玩法,例如DLSS抗锯齿技术,但与RTX光学跟踪技术相比,AI加速在游戏中的应用很少,而且吸引力不足。

从GTX到RTX NVIDIA GPU架构的变迁史

在SM单元体系结构中,图灵一代不同。它与Pascal架构中的GP102 / GP104内核不同,并且更类似于Volta架构的GV100内核,因为每组SM单元已变成64个CUDA内核,其中RTX 2080 Ti使用的TU102内核被划分了分为6组GPC单元,每组GPC单元有12个SM单元,共72个SM单元,但是RTX 2080 Ti仅使用其中的68个。就是这样,68 x 64 = 4352 CUDA流处理器。

对于RTX 2080显卡使用的TU104内核,完整版的TU104内核仍然是6组GPC单元,但是每组GPC更改为8个SM单元,总共6×8 = 48个,而RTX 2080 GPU内核为TU104-400,仅使用46组,保留了2组,即46×64 = 2944,其规模比RTX 2080 Ti小得多。

支持RTX光学追逐是Turing图形卡的特征。但是,除了游戏数量的问题之外,RTX光学追逐还有一个问题,就是它的性能要求仍然太高,因此在这一代图灵图形卡中,NVIDIA RTX的市场策略也有所不同。支持RTX技术的显卡主要是RTX Titan,RTX 2080 Ti,RTX 208 0、RTX 2070和RTX2060。不支持RTX的显卡将成为GTX 16系列,包括GTX 1660 Ti,GTX 1660和刚刚发布的显卡。 GTX 1650显卡。

从GTX到RTX NVIDIA GPU架构的变迁史

RTX 20系列图形卡的规格

从GTX到RTX NVIDIA GPU架构的变迁史

GTX 16系列图形卡的规格

总结:第五代GPU的性能得到了极大的提高,具有更高的能效,但价格也更高

从2012年的开普勒图形卡到今天,NVIDIA图形卡已经推出了五代架构。如果计算每一代的核心和游戏核心,则至少有10个模型。这些图形卡的处理技术也来自28nm。一直升级到16nm和12nm。在游戏性能方面,根据Chaoneng.com的显卡排名,当今的RTX 2080 Ti显卡的性能约为GTX 480显卡的7倍,GPU晶体管的数量也从30亿增加到21亿元,基本符合业绩增长。

如果考虑性能和功耗,多年来NVIDIA显卡的能效已大大提高。毕竟,大核的TDP功耗多年来一直保持在250-300W之间,但性能却提高了6-7倍。

此外,我们没有详细提及前几代显卡的价格,但是这种趋势也很明显。在GTX 400至GTX 700阶段,高端显卡的价格为3999元,但价格近年来有所上涨。 NVIDIA在这里尤其明显。 Titan显卡从最初的7999元涨到了20000元,而主流市场中的旗舰显卡价格也涨到了6000多元。 RTX 20世代已经提高了价格。 RTX 2080 Ti出售。价格直接达到了9999元,这是过去Titan显卡的水平。

从GTX到RTX NVIDIA GPU架构的变迁史


本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/shenmilingyu/article-328165-2.html

相关阅读
    发表评论  请自觉遵守互联网相关的政策法规,严禁发布、暴力、反动的言论

    热点图片
    拼命载入中...