作为CAE计算服务器,对浮点运算性能要求较高,因此大多数服务器均采用了最新的双核处理器技术,包括Intel的Woodcrest 5100系列和AMD的Opteron 200/2000系列。它们的对应关系如下:
Woodcrest和Opteron的对应关系
应该说,Woodcrest的双总线架构和Opteron的直连架构,各有特色。那么在CAE高性能计算中,那种架构性能更好呢?我们来看一下Intel官方网站上对LS-Dyna和Fluent的测试数据。
Woodcrest 5160和Opteron275的测试数据
Intel只提供了Woodcrest 5160和Opteron275的测试数据,由于两者并不是同档次的CPU,不能直接比较。考虑到主频的因素,可以推算出与Opteron 275同档次的Woodcrest 5130的性能。
Intel官方测试数据比较
上述测试数据表明,Opteron 275的性能比Woodcrest 5130要高17%以上。
进行CAE高性能计算时,通常会采用4颗以上的处理器,因此CPU的扩展性也十分重要。我们再来比较一下Woodcrest和Opteron的扩展性。以下测试数据来自AMD。
Woodcrest和Opteron的扩展性
上述测试数据表明,4进程时,Woodcrest 5160的浮点运算性能比Opteron 2220要慢14%,Opteron 2220浮点运算的并行效率也比Woodcrest 5160高出20%。
综上所述,对于CAE/CFD应用,由于Woodcrest处理器持续沿用已有20多年历史的前端总线架构,其实测性能和扩展性均不如同档次的Opteron处理器。
四、曙光CAE高性能计算解决方案
当设计CAE高性能计算整体解决方案时,要充分考虑用户需求,比如资金预算、问题类型、分析规模、用户数量、软件License个数等,以此来确定最终的硬件选型。
4.1 以隐式分析为主的解决方案
常用的隐式有限元软件有ABAQUS/Standard、ANSYS、MSC.NASTRAN等。根据隐式有限元分析要求内存容量大、磁盘IO快、通信延迟低的特点,推荐采用基于SMP架构的4路的曙光天阔A820r-F或A830r-F,对于预算充足的用户,可以采用8路的曙光天阔A950r-F。
上述几款机型用于隐式有限元分析有以下优点:
1)采用了最新的AMD Opteron 8000系列处理器,支持双核技术。
隐式有限元分析对系统的浮点运算性能和内存带宽要求非常高。在共享内存架构中,各处理器之间通过访问内存中的公共变量进行通信,内存存取延迟越小,则性能越高。Opteron 处理器内部则整合了内存控制器,CPU与内存之间的数据交换过程简化为“CPU--内存--CPU”三个步骤,与传统的基于北桥芯片的方案相比显然具有更低的数据延迟,这有助于提高计算机系统的整体性能。
2)采用了先进的 Registered ECC DDRII内存,最大支持64GB~128GB内存。
隐式解法内存占用较大。以40万自由度为例,如果采用ANSYS的SPARSE求解器,大概需要6GB内存。当物理内存不足的时候,ANSYS采用磁盘文件作为虚拟内存,但这样会大大降低性能。配置较多的物理内存,则可将所有数据都放在内存中,ANSYS不需要进行磁盘文件交换就能完成整个求解过程,从而节约求解时间。因此内存配置推荐至少1GB/Core,最好是2GB/Core。
3)最多可以安装8块热插拔SCSI硬盘,可以通过RAID提高磁盘性能。
进行隐式有限元分析,尤其是模态分析,会产生大量的临时文件,而且要反复读写磁盘,因此磁盘IO速度对于软件的计算性能也非常关键。据统计,1个40万自由度的算例,计算过程中的磁盘IO量可达16.2GB。通过多块磁盘的RAID,磁盘的IO速度可以成倍提高。
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/jisuanjixue/article-29668-3.html
美国把伊拉克蹂躏了
是买不起
很真实