理论性能可以看出,单个intel的phi处理器是高于SW26010的计算核心,得益于超宽的512位矢量处理器(VPU),intel phi上的处理器每个时钟可以执行16个单精度运算或8个双精度计算,而SW26010上的计算核心只有一半的宽度,所以最多也就8个单精度和4个双精度,不过SW26010的核心频率是1.45GHz,要比intel phi的1.3GHz稍高,但是这样也很难追平intel的单个核心的理论性能优势。
但是光比理论峰值性能是没有什么意义的,SW26010的VPU虽然比intel phi的宽度小,但是264bit的宽度而不是256bit的宽度可以提供比intel的单双精度浮点更高的计算精度,单精度浮点可以比intel的高一倍,而双精度可以高4倍,这在科学计算中是能够获得更大的优势,而且intel的512bit宽度的矢量运算需要更多的数据来填饱它,加上需要用PCI-E传输数据的瓶颈,大部分时候也只能挨饿,而SW26010可以直接访问主存,因此在实际使用效率上不见得就会比intel phi低多少,并且某些应用场合甚至可能大幅度超过intel。
而且最重要的是,SW26010这样的设计,大幅度降低了系统复杂度,单个计算节点只需要一片SW26010,而intel就很杯具的需要一整台机架服务器,大概长得像这样:

或是这样:
对比一下sw26010,只需要这样,一块插件板上有8个节点:

然后这样:
得益于SW26010的超低功耗,大幅度降低了散热压力,一个小小的机箱塞进了256个计算节点。。。。同体积秒杀intel。不要小看体积因素,更小的体积意味着可以用更快的总线和更低的成本将所有节点连接起来。而SW26010的节点轻松用PCI-E 3.0就连起来了,又便宜又快,喷总线瓶颈的可以省省了,天河二号用的自制TH-Express-2连接计算节点,使用PCI-E 2.0连接,根据资料显示速度是6.36GB/s,延迟是85us;而SW26010的计算节点连接性能高达12GB/s,延迟只有区区的1us,性能远超intel方案的天河二号。然后这样一个小小的机柜,居然塞进了8机箱,像这样:

下面说说超算闲置问题 针对此某HPC从业者这样回答
1.中国无论天河-1还是天河-2融类类低层次的应用,人家根本没把它们当正经应用(这类应用由于门槛低,并行度高,很容易占用大量计算资源),国防科大和广州天河的袁教授期望的是天河-2在国家重大专项等高层次应用上更多做出贡献,比如核物理,流体力学等代表超算顶尖水平的应用更多(这也是天河-3继续获得国家拨款的主要依据,国家一点都不傻),这当然有一定难度,因为天河-2是异构计算机,想充分利用这些资源,代码几乎都得重写,实际上,在美国TITAN上由于用了GPU, 这类应用推进的也不怎么样。
2.以我在HPC工作接触的情况来看,江南所这个超算完全不用担心上述问题,因为江南所是军方背景,他们搞得计算机一个主要应用就是核物理仿真,中国在核物理仿真方面几乎全部代码都是自主搞得,而且很多代码都是针对江南所的计算硬件专门设计的,编译器加速库等生态系统一应俱全,因此这些在天河-2上遇到的问题,反而在神威上可能不是太大问题,一个例子就是神威超算刚上线,一个核物理仿真在神威上就取得了40P的惊人效率,并且有三个应用已经入围超算应用国际大奖评选了(效率3占到理论峰值多30的超算应用是惊人的,实际上写过程序的都知道,别说超算,即便多核计算机,一般的应用能达到系统浮点峰值30都是挺不错了)。
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/jisuanjixue/article-33813-2.html
俄国重心在欧洲所以放弃在华利益
现在不容易的事情就是炫富了