正是由于此功能,SMP的主要问题?服务器是它的可扩展性非常有限. 对于SMP服务器,当SMP服务器扩展时,每个共享链接都可能导致瓶颈,并且最受限制的是内存. 由于每个CPU必须通过相同的内存总线访问相同的内存资源,因此随着CPU数量的增加,内存访问冲突将迅速增加,最终将导致CPU资源的浪费. 实验表明,SMP服务器的最佳CPU利用率是2到4个CPU. NUMA(非统一内存访问)NUMA技术可以结合数十种技术吗? CPU(甚至数百个CPU)?在服务器中,弥补了SMP的局限性吗?在扩展能力方面,NUMA?服务器?中央处理器?模块结构如下. NUMA服务器的基本功能是具有多个CPU模块,每个CPU模块由多个CPU(例如4个)组成,并具有独立的本地内存,I / O插槽等. 因为其节点可以通过互连连接和交换信息模块(例如交叉开关),每个CPU都可以访问整个系统的内存(这是NUMA和MPP系统之间的重要区别). 显然,访问本地内存的速度将远远高于访问远程内存(系统中其他节点的内存)的速度,这也是非均匀存储访问NUMA的起源.
由于此功能,为了更好地利用系统性能,在开发应用程序时必须最小化不同CPU模块之间的信息交换. 使用NUMA技术,它可以解决原始SMP系统的扩展问题,并可以在物理服务器中支持数百个CPU. 但是NUMA技术也有某些缺陷. 由于访问远程内存的等待时间远远超过本地内存的等待时间,因此当CPU数量增加时,系统性能将无法线性增加. 例如,当惠普发布Superdome服务器时,它宣布了与惠普其他UNIX服务器的相对性能价值. 发现64通道Superdome(NUMA结构)的相对性能值为20,而8通道N4000(?Shared SMP)结构的相对性能值为6.3. 从这个结果可以看出,CPU数量的8倍只是性能提高的3倍. MPP(并行处理)MPP与NUMA不同. MPP提供了另一种扩展系统的方法. 是多个连接的吗? SMP?服务器通过某个节点的互连网络协同工作以完成相同的任务. 从用户的角度来看,它是一个服务器系统. 基本特征是多个? SMP?服务器(每个SMP服务器称为节点)通过节点互连网络连接,并且每个节点仅访问自己的本地资源(内存,存储等),这完全是共享(无共享)?结构上,所以扩展能力是最好的,理论上它的扩展是无限的,目前的技术能达到什么? 512?节点互连,数千个CPU.

在MPP系统中,每个SMP节点也可以运行自己的操作系统,等. 但是与NUMA不同,它没有远程内存访问的问题. 换句话说,每个节点中的CPU无法访问另一个节点的内存. 节点之间的信息交换是通过节点的互连网络实现的. 此过程通常称为数据重新分发. 但是MPP服务器需要复杂的机制来调度和平衡每个节点的负载和并行处理. 当前,一些基于MPP技术的服务器通常通过系统级软件(例如)来掩盖这种复杂性. 例如,Teradata是基于MPP技术的关系软件. 在基于此开发应用程序时,无论后端服务器由多少个节点组成,开发人员都面对相同的系统,而无需考虑如何计划其中一些节点的负载. MPP并行处理系统由许多松耦合的处理单元组成. 应当指出,这是指处理单元而不是处理器. 每个单元中的CPU都有自己的专用资源,例如总线,内存,硬盘等. 每个单元中都有操作系统和管理实例的副本. 这种结构的最大特点是它不共享资源. NUMA,MPP和SMP之间的性能差异NUMA节点互连机制是在同一物理服务器内部实现的. 当CPU需要访问远程存储器时,它必须等待. 这也是NUMA服务器无法增加CPU的原因. 时间性能线性扩展.
MPP的节点互连机制是通过不同SMP服务器外部的I / O实现的. 每个节点仅访问本地内存和存储. 节点之间的信息交换与节点本身的处理并行进行. 因此,添加节点时,MPP基本上可以实现线性扩展. SMP的所有CPU资源都是共享的,因此可以完全实现线性扩展. MPP,SMP和NUMA应用程序之间的区别NUMA体系结构可以在物理服务器中集成许多CPU,因此系统具有更高的事务处理能力,因为远程内存访问延迟比本地内存访问长得多,因此您需要最小化差异?模块之间的CPU数据交互. 显然,NUMA体系结构更适合OLTP事务处理环境. 当在数据仓库环境中使用时,大量的复杂数据处理将不可避免地导致大量的数据交互,这将降低CPU利用率. MPP系统不共享资源,因此,资源比SMP多. 当要处理的交易达到一定规模时,MPP比SMP更有效. 由于MPP系统需要在不同处理单元之间传递信息,因此,在通信时间短的情况下,MPP系统可以充分利用资源优势,实现高效率. 也就是说: 操作之间没有关系,处理单元之间的通信相对较小,因此最好使用MPP系统. 因此,MPP系统在决策支持和数据挖掘方面显示出优势. MPP系统需要在不同处理单元之间传输信息,因此其效率比SMP差一点.
当通信时间较长时,MPP系统可以充分利用资源优势. 因此,在当前使用的OTLP程序中,用户访问中央. 如果采用SMP系统结构,则其效率要比MPP结构快得多. HPC的主要应用场景和软件高性能计算集群的应用主要根据应用类型分为科学计算集群,负载均衡集群,高可用性集群和并行集群. 与应用需求相对应的应用领域分为: 计算密集型应用: 大型科学工程计算,数值模拟等. 其应用领域为石油,气象,CAE,核能,制药,环境监测与分析,系统仿真数据密集型应用程序: 数字图书馆,数据仓库,数据挖掘,计算可视化等;其应用领域: 图书馆,银行,证券,税收,决策支持系统等. 网络密集型应用: 协同工作,网格计算,远程控制,远程诊断等;它的应用领域: 网站,信息中心,搜索引擎,电信,流媒体等. HPC?高能计算的常用应用领域主要分为: CAE?模拟,渲染,物理化学,石油勘探,生命科学,气象环境. 主要的CAE模拟软件是什么? CAE(计算机辅助工程)使用计算机辅助解决方案来分析和分析复杂项目和产品的结构力学性能,并优化结构性能.
主要用于航空航天,汽车,轮船,机械,建筑,电子等领域. CAE的主要处理流程大致如下: 几何建模,网格划分,指定载荷和边界条件,提交给服务器进行分析,显示结果以及评估产品性能. 隐式和显式有限元分析的主要区别是什么? ? FEA(有限元分析)使用数学逼近法来模拟真实的物理系统(几何形状和载荷条件). 使用简单的交互式元素(即单位),可以使用有限数量的未知数来近似无限的未知实系统. 隐式有限元(IFEA)是用于结构内部分析的主要场景结构设计;显示有限元(EFEA)用于分析碰撞,爆炸和其他结构; CFD是计算流体动力学(Computational Fluid dynamics)的缩写,是一门预测流体流动,传热和传质,化学反应和其他物理现象的学科. 主要的生命科学软件是什么?生物科学主要分为三个领域: 生物信息学,分子动力学模拟和新药开发. 生物信息学: 使用HPC对生物基因数据进行测序,缝合和比较,提供基因组信息和相关数据系统,并解决生物,医学和工业领域的主要问题. 分子动力学模拟: 使用HPC进行分子动力学模拟,通过模拟结果分析和验证分子和原子水平的蛋白质变化. 新药开发领域: 使用HPC快速完成高通量药物的虚拟筛选可以使平均研发周期缩短大约一年半.
主要的渲染软件是什么?多媒体是HPC的另一个重要应用. 在这个行业中,许多图形渲染已成为HPC应用程序的主要领域. 业务流程大致是: 原始模式的抽象框架,作业提交,任务排队,任务激活,渲染作业,档案存储. 主要的气象环境软件是什么?气象预报是一种使用数学方法构造方程式,将气象数据和边界参数导入方程式从而预测大气变化和状态的科学. 业务流程大致如下: 气象数据收集和预处理,全面的数值天气预报,气象,统计和其他输出预测结果. 气象预报是一种使用数学方法构造方程式,将气象数据和边界参数导入方程式从而预测大气变化和状态的科学. 业务流程大致如下: 气象数据的收集和预处理,数值天气预报的过程,综合数值天气预报,气象,统计和其他输出预报结果. 简而言之,不同的HPC应用程序消耗IT资源的方式有所不同,高性能计算系统需要根据其不同的应用程序场景配置资源. 计算密集型应用程序需要高频CPU,内存受限应用程序需要高带宽和大内存,网络密集型应用程序需要IB网络,而IO密集型应用程序则需要高带宽和大容量并行存储系统. 1
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/jisuanjixue/article-225641-2.html
迟早要统一