
NVIDIA为全球10台最快的超级计算机中的8台提供了加速. NVIDIA Selene已成为美国最快的工业系统,并具有领先的能效水平.
最新的TOP500超级计算机列表显示了现代科学计算的总体情况: 它通过AI和数据分析得到扩展,并通过NVIDIA技术得到加速.
目前,全球十大超级计算机中有8个使用NVIDIA GPU超级计算机配置,InfiniBand网络技术或同时使用这两种技术. 其中包括美国,欧洲和中国最强大的超级计算机系统.
在TOP500列表中的所有系统中,三分之二的系统(333套)使用NVIDIA(现已与Mellanox合并)来发挥作用. 在2017年6月发布的列表中,使用两家公司的系统所占比例不到总数的一半(203套).
如今,榜单中有近四分之三(74%)的新InfiniBand系统使用NVIDIA Mellanox HDR 200G InfiniBand,这也表明了最新的智能高速数据互连技术的迅速普及.
自2019年以来,使用HDR InfiniBand的TOP500系统的数量几乎翻了一番. 共有141台超级计算机使用InfiniBand,自2019年6月以来增长了12%.
越来越多的TOP500系统采用NVIDIA GPU,Mellanox网络技术,或同时采用这两种技术.

在TOP500超级计算机中,有305个系统使用NVIDIA Mellanox InfiniBand和以太网(61%),包括所有141个使用以太网的InfiniBand系统和164个(63%)系统.

就能源效率而言,使用NVIDIA GPU的系统也很突出. 与不使用NVIDIA GPU的系统相比,它们的能源效率(千兆位/瓦)平均高出2.8倍.
这是为什么TOP500排名前25位的超级计算机中有20个选择NVIDIA GPU的原因之一.
NVIDIA GPU提高了TOP500超级计算机的能效.
这种能源效率的最证明性能是NVIDIA内部研究小组的新成员Selene(如上图所示). 该系统在Linpack基准测试中的性能为27.5 petaflops,在最新的Green500列表中排名第二,在整个TOP500列表中排名第七.
Selene的功耗为20.5 gigaflop / watt,与Green500列表中的第一名稍有不同,但是排名第一的系统更小,其性能仅排名第394位.
Selene是前100个系统中唯一突破20吉瓦/瓦能效壁垒的系统. 它也是世界上性能第二高的工业超级计算机,仅次于意大利能源巨头Eni SpA的NO. 6系统(使用相同的NVIDIA GPU).
就能源效率而言,Selene的能源效率是不使用NVIDIA GPU的其他TOP500系统的平均能源效率的6.8倍. Selene出色的性能和能效归功于NVIDIA A100 GPU中的第三代Tensor Core内核. 该内核可以为传统的64位数学仿真和较低精度的AI工作提供加速.
Selene的排名已经是一个了不起的成就,毕竟,该系统是在不到4周的时间内建成的. 工程师可以使用NVIDIA的模块化参考架构来快速构建Selene.
参考体系结构是NVIDIA的DGX SuperPOD. 该系统基于强大而灵活的现代数据中心构建块-NVIDIA DGX A100系统.

高度灵活的DGX A100系统现已上市. 该系统在6U服务器中集成了8个A100 GPU和NVIDIA Mellanox HDR InfiniBand网络技术,可以加速高性能计算,数据分析和AI工作(包括训练和推理)等组合,并实现快速部署.
从系统扩展到SuperPOD
参考此参考体系结构设计,任何企业组织都可以快速构建自己的世界一流的计算集群. 该参考设计展示了如何使用高性能的NVIDIA Mellanox InfiniBand交换机来连接20个DGX A100系统,例如构建块.
InfiniBand加快了10大超级计算机中的7个的速度,其中包括中国,欧洲和美国最强大的系统.
4个操作员用不到1个小时的时间就组装了由20个系统组成的DGX A100集群,并创建了一个具有2 petaflops性能的系统,这足以列出. 进入TOP500列表. 这样的系统可以在标准数据中心的功率和冷却能力范围内轻松运行.
通过添加NVIDIA Mellanox InfiniBand交换层,工程师连接了14组模块,每个模块配备20个DGX A100系统,以创建Selene. Selene系统具有:
280个DGX A100系统
2240个NVIDIA A100 GPU
494 NVIDIA Mellanox Quantum 200G InfiniBand交换机

56 TB / s的网络架构
7PB的高性能全闪存存储器
Selene最重要的性能规格之一是它可以提供超过1 exaflops的AI性能. 此外,在TPCx-BB关键数据分析基准测试中,它仅使用16个DGX A100系统创造了新记录,其性能是其他系统的20倍.
现在,人工智能和分析已成为科学计算的新要求,这些结果也非常重要.
全世界,研究人员正在使用深度学习和数据分析来预测最有潜力的领域并进行实验. 这种方法可以帮助研究人员减少昂贵且费时的实验,从而加快获得科学成果的速度.
例如,尽管目前有6个正在建设中的系统尚未出现在该TOP500列表中,但它们都使用了NVIDIA上个月发布的A100 GPU. 这些系统将用于加速HPC和AI的集成,并开辟科学研究的新纪元.
TOP500扩展了科学计算应用
在这些系统中,其中一个位于美国阿贡国家实验室. 该机构的研究人员将使用24个NVIDIA DGX A100系统的集群来扫描数十亿种药物,以寻找COVID-19的治疗方法.
Argonne国家实验室的计算生物学家Arvind Ramanathan在A100 GPU的第一份用户报告中表示: “这项工作的困难之一是在计算机上进行仿真,因此我们使用AI来指导一步采样位置和时间. ”

国家能源研究科学计算中心(NERSC)正在将AI应用于多个Perlmutter项目. Perlmutter是该中心的百亿美元级百兆级解决方案.
例如,一个项目将使用强化学习来控制光源实验,而另一个项目将使用生成模型来在高能物理探测器上复制复杂的模拟.
为了加快对新冠状病毒蛋白的分析,慕尼黑的研究人员依靠Summit超级计算机中的6000个GPU来训练自然语言模型. 有迹象表明领先的TOP500系统已经超越了使用双精度数学进行的传统仿真.
人工智能,数据分析和边缘流技术正在重新定义科学计算.
随着深度学习和分析的扩展超级计算机配置,科学家还使用了云计算服务,甚至使用了网络边缘远程仪器的流数据. 这些要素共同构成了NVIDIA加速的现代科学计算的四大支柱:
模拟: 为了对抗新型冠状病毒,橡树岭国家实验室的研究人员使用了Summit超级计算机的内置GPU来运行AutoDock,并在24小时内模拟了20亿种化合物.
人工智能和数据分析: Spark 3.0为关键且耗时的机器学习流程的前端提供GPU加速.
前沿科学: 欧洲核研究所(CERN)最近宣布,NVIDIA GPU将把大型强子对撞机中粒子碰撞事件产生的数据量减少500倍.
可视化: NVIDIA的IndeX和Magnum IO软件帮助增强了Mars Lander的可视化功能,这是世界上最大的交互式实时三维可视化项目.
所有这些表明,研究人员和企业迫切需要从云到网络边缘的AI和分析加速. 这就是为什么全球最大的云服务提供商和世界顶级OEM都采用NVIDIA GPU的原因.
此外,最新的TOP500列表还说明了NVIDIA在以另一种方式使AI和HPC民主化方面的努力. 任何想领先计算能力的公司都可以使用NVIDIA技术,例如支持全球最强大系统的DGX系统.
最后,NVIDIA要向日本排名第一的Fugaku超级计算机背后的工程师表示祝贺,这表明Arm正在变得越来越实用,并已成为高性能计算的可行选择. 这就是NVIDIA去年宣布为Arm处理器体系结构提供CUDA加速计算软件的原因之一.
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/jisuanjixue/article-287881-1.html
我给大家说个高人
来抱中国大腿就对了