b2科目四模拟试题多少题驾考考爆了怎么补救
b2科目四模拟试题多少题 驾考考爆了怎么补救

2016高性能计算机技术_高性能计算机课_曙光高性能计算机(3)

电脑杂谈  发布时间:2017-01-31 01:00:13  来源:网络整理

作为CAE计算服务器,对浮点运算性能要求较高,因此大多数服务器均采用了最新的双核处理器技术,包括Intel的Woodcrest 5100系列和AMD的Opteron 200/2000系列。它们的对应关系如下:

Woodcrest和Opteron的对应关系

应该说,Woodcrest的双总线架构和Opteron的直连架构,各有特色。那么在CAE高性能计算中,那种架构性能更好呢?我们来看一下Intel官方网站上对LS-Dyna和Fluent的测试数据。

Woodcrest 5160和Opteron275的测试数据

Intel只提供了Woodcrest 5160和Opteron275的测试数据,由于两者并不是同档次的CPU,不能直接比较。考虑到主频的因素,可以推算出与Opteron 275同档次的Woodcrest 5130的性能。

Intel官方测试数据比较

上述测试数据表明,Opteron 275的性能比Woodcrest 5130要高17%以上。

进行CAE高性能计算时,通常会采用4颗以上的处理器,因此CPU的扩展性也十分重要。我们再来比较一下Woodcrest和Opteron的扩展性。以下测试数据来自AMD。

Woodcrest和Opteron的扩展性

上述测试数据表明,4进程时,Woodcrest 5160的浮点运算性能比Opteron 2220要慢14%,Opteron 2220浮点运算的并行效率也比Woodcrest 5160高出20%。

综上所述,对于CAE/CFD应用,由于Woodcrest处理器持续沿用已有20多年历史的前端总线架构,其实测性能和扩展性均不如同档次的Opteron处理器。

四、曙光CAE高性能计算解决方案

当设计CAE高性能计算整体解决方案时,要充分考虑用户需求,比如资金预算、问题类型、分析规模、用户数量、软件License个数等,以此来确定最终的硬件选型。

4.1 以隐式分析为主的解决方案

常用的隐式有限元软件有ABAQUS/Standard、ANSYS、MSC.NASTRAN等。根据隐式有限元分析要求内存容量大、磁盘IO快、通信延迟低的特点,推荐采用基于SMP架构的4路的曙光天阔A820r-F或A830r-F,对于预算充足的用户,可以采用8路的曙光天阔A950r-F。

上述几款机型用于隐式有限元分析有以下优点:

1)采用了最新的AMD Opteron 8000系列处理器,支持双核技术。

隐式有限元分析对系统的浮点运算性能和内存带宽要求非常高。在共享内存架构中,各处理器之间通过访问内存中的公共变量进行通信,内存存取延迟越小,则性能越高。Opteron 处理器内部则整合了内存控制器,CPU与内存之间的数据交换过程简化为“CPU--内存--CPU”三个步骤,与传统的基于北桥芯片的方案相比显然具有更低的数据延迟,这有助于提高计算机系统的整体性能。

2)采用了先进的 Registered ECC DDRII内存,最大支持64GB~128GB内存。

隐式解法内存占用较大。以40万自由度为例,如果采用ANSYS的SPARSE求解器,大概需要6GB内存。当物理内存不足的时候,ANSYS采用磁盘文件作为虚拟内存,但这样会大大降低性能。配置较多的物理内存,则可将所有数据都放在内存中,ANSYS不需要进行磁盘文件交换就能完成整个求解过程,从而节约求解时间。因此内存配置推荐至少1GB/Core,最好是2GB/Core。

3)最多可以安装8块热插拔SCSI硬盘,可以通过RAID提高磁盘性能。

进行隐式有限元分析,尤其是模态分析,会产生大量的临时文件,而且要反复读写磁盘,因此磁盘IO速度对于软件的计算性能也非常关键。据统计,1个40万自由度的算例,计算过程中的磁盘IO量可达16.2GB。通过多块磁盘的RAID,磁盘的IO速度可以成倍提高。


本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/jisuanjixue/article-29668-3.html

相关阅读
    发表评论  请自觉遵守互联网相关的政策法规,严禁发布、暴力、反动的言论

    每日福利
    热点图片
    拼命载入中...