
IT Home News 4月6日消息,今天清晨,Nvidia正式发布了新一代计算卡Tesla P100,GP100也首次在人们面前露面. 目前,国外媒体已经为我们编制了GP100表格,并将其与前两张计算卡进行了比较. 让我们深入分析历史上最快的计算卡.



GP100内核具有内置的3840个CUDA内核,240个纹理单元,高达32GB的HBM2视频存储器,4096位的位宽,并且L2缓存已从3MB增加到4MB. 根据Nvidia官员的说法,Nvidia Tesla P100使用GP100的“ castration”“ Version”,因此使用3584 CUDA内核,并且视频内存也已减少到16GB HBM2视频内存. 老实说,如果您看一下FP32,即单精度计算性能,那么GP100并不是什么大惊喜. 10.6 Teraflops的性能仅比上一代7TFlops高出51%. 这仅供使用. 16nmFinFET工艺和新架构令人失望.

GP100的最大变化是FP64的显着增加,这是双精度计算性能. 与上一代GM200较差的0.2Tflops相比,5.3Teraflops的双精度计算性能可以说是质的飞跃,后者也可与Nvidia媲美. 目的性能,但是对于消费者(尤其是游戏玩家)来说,双精度计算性能是没有用的. 我们更加关注图形卡的单精度计算性能. 根据之前的猜测,普通GP100的单精度计算性能约为14-15 Tflops,因此它可以反映旗舰显卡的水平. 同时,随着晶体管的大量增加,GP100内核的TDP也从250W大大增加到300W. 对于将来要购买新一代Titan作为游戏图形卡的玩家,应该注意这一点. 也许您的电源需要替换为更高的电源.

当然,Nvidia Tesla P100不在游戏领域中使用,因此可以大大提高双精度计算性能. 目前,对于玩家来说,体验GP100的另一种方法是等到GP102启动. 据说Nvidia将为游戏玩家创建一个特殊的核心,即GP102. 与Nvidia Tesla P100不同,GP102将大幅降低FP64的双精度计算性能,并将其余的晶体管性能纳入FP32的单精度计算性能. 它还将增加核心频率和Boost频率,目的是为了响应当前日益苛刻的游戏要求,当然,这也是玩家最关心的新闻.
对于其他游戏显卡,例如带有GP104的GTX1080和GTX1070,这次将不在GTC2016上看到. 恐怕我们需要在6月1日至6月6日的台北计算机展上看到相应的内容. 新闻. 如果您需要等待Pascal游戏显卡,则最好先等待. 首先使用当前的图形卡. 如果性能提升巨大,则可以考虑购买. 如果FP32的性能提升不大,请等待AMD的Polaris做出决定.
如果您在2016 Nvidia GTC的云端环境中,则可以查看该编辑器为您总结的以下文章:
“ Nvidia的2016 GPU技术大会: VR和人工智能”
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/shenmilingyu/article-298293-1.html
如果你果真当上了伊拉克总统
以后小日本得对我们点头哈腰了