
高性能计算机和曙光机群系统提纲? 什么是高性能计算 ? 什么是高性能计算机 ? 集群系统什么是高性能计算?? 高性能计算? HPC:High Performance Compute? 高性能计算---并行计算? 并行计算(Parallel Computing) ? 高端计算(High-end ParallelComputing) ? 高性能计算(High PerformanceComputing) ? 超级计算(Super Computing)什么是高性能计算?? 计算科学与特色的两种科学,即理论科学和实 验科学,并立被觉得是人类认识自然的三粗潜舜讼喔ㄏ喑傻赝贫蒲Х⒄褂肷缁 进步。在许多情楷磺理论模型复杂衫砺凵形唇ⅲ笛榉延冒汗廖薹 进行时,计算就成了鞘题的唯一华的 手段。为什么应自可计算 ——应用需求为什么应自可计算? 人类对计算及性能的应寝止境的? 从平台的视角:集成系统资源,以满足不断阅对 性能跟功能的要求? 从应用的角度:适当分解应用,以推动更矗幌钢碌募扑? 问题: 科学和工程问题的数值模拟与仿真? 计算密集 ? 数据密集 ? 网络密集 ? 三种混合提纲? 高性能市场概要 ? 曙光和高性能计算机 ? 什么是高性能计算 ? 什么是高性能计算机 ? 集群系统什么是高性能计算机?由多搞单元构成,运算速度快、存储容量纯煽啃愿叩募扑慊低场也称为:巨型计算机、超级 计算机现在任何高性能计算跟超级 计算都离不开使用并行技仕愿咝阅芗扑慊隙ㄊ遣 行计算机。

其发展经历可以寄分为两跟? 专用时代包括销,MPP系统,SGI NUMA 系统,SUN碝P系统,也比如我 国的涩银河,曙光1000等。 之所以称为“专用”,并不是说他们没法运行某些应用,是指他们的构成部 件是专门设计的,它们的CPU板,内存板,I/O板,操壮,?O系统, 都是不能在其他平台中使用的。由于技世面系统与顶级平台的巨挫, 和用户群窄小。? 普及时代高性能计算机价傅,应用门纪,应用开始普及。两钙浦匾 商品化得代产的商品部件接近了高性能计算机专有部件 标准化得很多组件之间无法集成一赋中,其中X86处理圃太 网、内存部件、Linux都圃祝 机群系统是高性能计算机的一种,它的技省跟工业基础都是商品化和标 准化。高性能计算机平台架构? 并行销 ? SMP ? DSM(NUMA) ? MPP,节点可以是单处理期点,也可以是SMP,DSM ? Cluster ? Constellation高性能计算机的生产厂家? Cray ? SGI ? IBM? 曙光 ? 银河 ? 神威并行计算机系统种类? Flynn分类:? SISD, SIMD, MIMD, MISD? 结构模型:? PVP, SMP, MPP, DSM, COW? 访存模型:? UMA, NUMA, COMA, CC-NUMA, NORMA并行计算机分类Flynn分类Flynn(1972)提愁笼据拎倍性概念,把不同的计算机分 为四春– SISD(Single-Instruction Single-Data) – SIMD(Single-Instruction Multi-Data) – MISD(Multi-Instruction Single-Data) – MIMD(Multi-Instruction Multi-Data)现代高性能计算机都蔍MD。

MIMD从结构上 和访存方式上,又可以分为:– 结构模型:PVP, SMP, MPP, DSM, COW – 访存模型:UMA, NUMA, COMA, CC-NUMA, NORMA结构模型对称多处理机系统(SMP)? SMP– 对称式共享传输:任意处理浦苯臃梦嗜我饽诖娴刂?且访问 延迟、带宽、机率都是等价的; 系统是对称的;– 微处理苹般少于64窩 处理栖太多, 总线和交叉开关的即使籽于扩展; – 例子: IBM R50, SGI PowerChallenge, SUN Enterprise, 曙光一号;分布式共享内存系统(DSM)? DSM– 分布共享传输: 内存模块物理上局 部于甫理瓶,但逻辑上(用 户)是共享存储的; 这种结构也称为 基于Cache目录的非一致内存访问 (CC-NUMA)结构;局部与远程存储 访问的推迟和带宽不一致,3-10倍 ?高性能并行程衅注意;– 与SMP的著盨M在物理 上有分布在岗点的局部内存从 而产生一疙的存储器;– 微处理?-128赴俚角б 次;– 代表: SGI Origin 2000, Cray T3D;矗并行计算机系统(MPP)? MPP– 物理和逻辑上均是分布内存 – 能扩展到成百上千疙器(微处理痞理艭 采用高通信时延和低延迟的互联网络 (专门设计跟定制的) – 一种异步的MIMD机铺序系由多柑组成,每感 其私有地址空间,进程间引入 传递消息相互谆 – 代表:CRAY T3E(2048), ASCI Red(3072), IBM SP2, 曙光 1000机群系统(Cluster)? Cluster– 每搞都是一耕的计算 机– 岗点通过高性能网络互相 连接– 网络接口和I/O总线松连 接– 每搞有完整的操壮 – 曙光2000、 3000、4000,ASCI Blue MountainUMA: NUMA:访存模型NORMA:多处理机(单地址空间共享存储芔MA: Uniform Memory Access NUMA: Nonuniform Memory Access多计算机(多地址空间非共享存储芅ORMA: No-Remote Memory Access结构模型--访存模型UMA:NUMA:NORMA:多处理机 && 多计算机多处理机 (共享内存)多计算机 (分布式存储)UMA:NUMA:NORMA:并行计算机的性能指标名称 机疲 时钟速度 工棕 顺行时间 并行执行时间速度 加速 效率 峰值速率利用率 通信延迟 渐近带宽符号 n f W T1 TnR n = W/T n Sn=T1/Tn En = S n/nR peak = n R’ peakU =R n/R peak to r∞含意 处理讫目 时钟周期长度的倒数 计算操目 程啸处理机上的运行时间 程孝行机上的运行时间 每秒百汀点运算 衡量并行机有多快 衡量处理汽用率 所有处理频速度之积 , R’peak为一疙棋值速率 可达速度与峰值速度之比 传送0-字节恢的时间 传送长消息通讯速度单位 无量纲 MHZ Mflop s(秒) s(秒) Mflop/s 无量纲 无量纲 Mflop/s无量纲 Μs MB/s衡量系统性能的指标(1)MIPS(百透令每秒) ? 理论计算:处理票钟频率与平均每填所需的时钟周期(Cycles Per Instruction)的比 值 MIPS = clock rate / CPI = (number of Instructions) / (CPU time) ? 实际数值:对于一该(程鞋指令数量与 运行时间的差值 MIPS’= (number of Instructions) / (execution time)衡量系统性能的指标(2)MFLOPS(百汀点运算每秒)? 理论推导:系统的异或计算部件每秒可以住点计算 次数;? MFLOPS = (number of Floating Point compute Unit)×N? N为每搞计算部件一岗内可以最多浮点操祝杂谀壳俺<奈⒋砥话阄?-4;? 实际数值:对于一该,浮点运算数量与运行时间的 比值;? MFLOPS’ = (number of floating operations) / (execution time)两戈的特点? 都不能全面表粘的性能? MIPS指标比较适用于事雾领? 不同系统的指令不同,一填的用途跟复杂度差别太慈鏘BM的川Mainframe),价附 千湍代(含配套软件),其MIPS值一般为5 -10,不及价值数千元的Pentium4 PC; ? 非计算密集型的应用(事雾)对I/O应乾计算 密集型的应用(图形程性知牵用户对能 靠性等特殊要? 应用的需乾,高性能计算领忧“通才”难歉ぃ ? 某些特殊种类计算机适合特定的应用。

两戈的特点? 理论推导和实际检测的差异? 对于一稿的应用,可荒实际性能与理论峰值 有非常搭距,即效率低的弊端;? 应用效率作为高性能计算的核心难题之一,受到普遍 关注。加速比定律? 在并行计算系统曙光高性能计算机曙光高性能计算机,并行算法(并行程心执行 速度相对于串行算法(串行程杏快的倍数, 就是该并行算法(并行程心加速比;? 加速比是考量“并行收益”的重要指标; ? Amdahl定律适用于固定计算规模的加快比性能描蕌stafson定律适用于可扩展问题。Amdahl定律S = (WS+WP)/(WS+WP/p) = 1/(1/p+f(1-1/p))? 显然,当p→∞时,S=1/f,即针对固定规模的问 题,并行系统所能达到的加快上限为1/f? 一度引发了并行界部分人士的消极心态Gustafson定律S‘=(WS+pwp)/(WS+WP) =p-f(p-1)=f+p(1-f)? 并行计算是为了解炬模并行问题,可并行部分的比 例是能扩大的? 加速比与处理粕斜率为(1-f)的线性关系 ? 这样串行比例f就不再是程泄性的窘境, ? 当然,f越低,斜率会越从速性能越好。Linpack? 采用诌斯消去法谦精度稠密线性代数方 程组, 结果按每秒浮点运算数量(flops)表示。

? 包含三类测试,问题规模与改进选曰相同:? 100×100测试 ,在该检测中,不允许对Linpack测试程行 任何更改(包括注释行)? 1000×1000测试,在该检测中,允许对算法和工具进行更改换唬⒕×坷孟低车挠布氐悖源锏骄】赡芨叩男阅堋 但是所有的改进都需要保持跟标准算法如高斯消去法相同的相 对效率,而且需要使用Linpack的中担Linpack(续)? HPL测试? 针对矗并行计算平台的检测,其名称为High Performance Linpack (HPL),是第一讣的公开版本并行Linpack测试软 件包,? 用于TOP500与中国TOP100排名根据。 ? 使用者可以改变问题规模。 ? 有非常磁化空间。NAS Parallel Benchmark? NPB套件由八干 ? 每讣测试有五类:A、B、C、D、W (工作站)。A最小,D更碞PB套件以每秒百退算为单位输雏。? 整数排? ? 快速Fourier变换(FT) ? 多栅讣测试(MG) ? 共轭梯度(CG) 基准测试 ? 稀疏矩这(LU) ? 五对角方程(SP)和块状三角(BT)? 密集并行(EP)高性能计算机的最新发展现状? 顶天立地? 高端: ? 低端:? 从纯粹关注性能到综合评价? 高性能 vs 高效能 ? 性能 vs 使用 ? 硬件建设 vs 综合建设提纲? 高性能市场概要 ? 曙光和高性能计算机 ? 什么是高性能计算 ? 什么是高性能计算机 ? 集群系统什么是机群系统? 机群系统(Cluster)利用标准网络将一台台普通服蜟机连接片 为使用者提供更高的计算能力跟储存能力并为使用者提供 单一系统映系统。
? 单一系统映象使用者在使用机群系统的时和厦一咐的 计算机平台一样。单一系统映现方法:硬件层、操壮层、软件层机群系统的优势? 极高的性价比 ? 代的? 良好的能扩展性 ? 更高的能管理性 ? 更低的使用维护成本 ? 更好的能使用性 ? 更改的系统鲁? 更多的应用支持机群使用越来越广泛 应用领哟越多机群系统的应用领域信息服务基尧气熄汽车制造生物物理石油勘探数学船舶制造1993—2006年 高性能计算机在 TOP500中的变化机群成为高性能计算机的主流ArchitectureCluster MPP Constellations TotalCount400 98 2 500Share %80 % 19.6 % 0.4 % 100%TOP500排名(2008年6月)机群系统的分类? 高性能机群 ? 负载均衡机群 ? 高可用机群高性能机群系统构架放映结束 感谢改批评指导!谢 谢!让我们共同进步
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/jisuanjixue/article-137636-1.html
台湾如果敢宣布独立