
“并行计算: 并行计算”结构编程算法的应用程序第2节. 1.并行计算机系统的结构模型(第1部分)岳跃恒(Yueshen Xu)ysxu @西安电子科技大学软件工程系本部分的内容Architecture并行计算机体系结构分类通用计算机体系结构从处理器的角度看弗林的四种体系结构划分方法并行计算机体系结构的特定实现并行计算机体系结构的多种实现的比较并行计算机访问内存模型统一的存储访问和非统一存储访问从内存的角度看缓存存储访问非远程存储访问模型等架构与内存访问模型之间的关系学习动机为什么学习并行计算机架构并行计算应用知识的完整性系统➢与其他学校进行类似的竞赛➢中国科学技术大学哈尔滨工业大学NTU并行算法设计发展的可能性知识栈并行性和并发性➢并行计算平台架构师对并行计算机系统进行编程➢并行计算平台➢一级结构工程师并行计算机体系结构设计人员课程要求➢内容本身也是有趣的通用计算机体系结构CPU,一个存储系统计算出的输出是从传入通信中引来的. “计算机系统体系结构”通用计算机体系结构involved涉及的重要组件或结构总线(物理层)➢一组连接处理器,内存模块和I / O设备进行通信每个插入板上的更多通用组件➢IOC: 输入/输出控制器, I / O控制器➢IOP: 输入/输出处理器,I / O处理器➢IF: 接口逻辑,专用逻辑接口➢LM: 本地存储器,本地存储器➢MC: 存储控制器,存储器控制器➢CC: 公共ication控制器,通信控制器的分类并行计算机体系结构nn Flynn分类点基础: 指令流和数据流执行模式➢指令流: 机器执行的指令序列➢数据流: 指令流调用的数据序列,包括输入数据和中间数据结果SISD(单指令流,单个数据流),单指令流,单指令流SIMD(单指令流,多个Flynndata流),单指令流,多个数据流分类方法MISD(多个指令流,单个数据流),多个指令流单个数据流Michael J.

MIMD(多指令流,Flynnmulti数据流),多指令流,多数据流并行计算机体系结构分类SISD(早期计算机)➢单指令流,单数据流➢从存储在存储器中的程序中获取指令,以及作用于单个数据流,即一条指令来处理一个数据➢主要在早期计算机中使用-目前很少使用-并行计算机不使用PU: 处理单元并行计算机体系结构分类SIMD(单核计算机)➢单个指令流,多个数据流➢单个指令流作用于一个以上的数据流,在单个时钟周期内处理多个数据单元➢主要用于单核计算机,不是并行计算机的主流模式PU: 处理单元并行计算机架构分类MISD(很少使用)MIMD(多核计算机,并行)➢多个指令流,➢多个指令流,单个数据流,多个数据流使用多个指令流来处理单个指令以同时执行多个指令,这些数据流和指令流在不同的数据流上运行. 常见的MIMD结构MIMD: 多个指令流和多个数据流MI MIMD PVP(并行矢量处理器),并行矢量处理器SMP(对称多处理器),五个常见的对称多处理器传统传统分类法,MIDMDMP()的通用特定实现并行处理器),和越来越的并行处理器实现,复杂的DSM(分布式共享内存)并行处理系统结构,分布式共享内存机器COW(工作站集群),工作站集群的通用MIMD结构MIMD: 多个指令流和多个数据流高性能并行计算机的发展历史全部都是MIMD结构CRAY-1(1976)大型且萌芽的行处理器1964-19751976-19901990- 20002000-矢量机集群CDC 6600(1964)CM-5( (1993)根据MIMD的类别详细解释了常见的MIMD结构structure MIMD: 多指令流和多数据流PVP (并行向量处理器)并行向量处理器(取决于管线技术)VPVPVP交叉开关SMSMSMPVP向量处理器(向量处理器,VP)向量由具有相同类型和位数的元素的有序集合组成➢向量处理器: 输入基于流水线技术的计算机,带有矢量数据表示和相应矢量指令的处理器的通用MIMD结构MIMD: 多个指令流多个数据流PVP(并行矢量处理器,续)➢相对而言,标量处理器: 没有矢量数据表示和相应的矢量指令➢通用计算机是标量处理器➢vs.

矢量处理器用于科学计算(非线性/线性编程,傅立叶变换,偏微分方程,矩阵计算等). ➢早期(70-90年代)超级计算机,超级计算机,例如Galaxy Early系列,所有向量处理器➢传统处理器设计的成本性能迅速下降,使得矢量处理器在1990年代后期不再占主导地位,Galaxy-ISeymor Cray和设计的CDC STAR通用MIMD结构MIMD: 多个指令流数据流SMP(对称多处理器)对称多处理器SM =共享内存P / CP / CP / C总线或纵横式SMSMI / OSMP➢所有处理器均等,没有主从设备➢所有处理器均可以访问任何存储单元和I / O设备➢通信共享变量(读写相同的存储单元)可用于实现通用的MIMD结构MIMD: 多个指令流和多个数据流commercial商业SM的比较P系统功能2005年之前➢最新的模型数据,学生可以找到DECHPSUN UltraSGI Power功能,Alphaserver90006000XL,处理器数量,12123036,最大主内存,28 GB16 GB30 GB16 GB磁盘容量192 GB168 GB63 GB144 GB320 MBps倍I / O带宽1.

2 GBps1 GBps2. 带有网卡插槽数量的6 GBps DEC: 数字设备公司SGI: Silicon Graphics通用MIMD结构MIMD: 多个指令流和多个数据流MPP(并行处理器)并行处理器MBMB NIC = NetworkP / CP / C接口CircuitryLM =本地内存LMLMNICNIC英特尔Paragon定制网络MPP具有数千个处理器的超大型并行计算机系统通常为分布式内存,该内存通常为私有处理器处理器之间通过消息传递来通信公共MIMD结构MIMD: 多个指令流和多个数据流MPP设计问题MBMBP / CP / CLMLM的可扩展性➢MPP在处理器NICNIC方有很高的可扩展性➢但这将带来I / O容量,内存等的平衡. 自定义网络可用性MPP➢估计10,000个处理器/计算节点MPP中的至少一个处理器/计算节点系统每天都会发生故障内存和I / OO功能➢内存部分发展很快,但I / O部分发展缓慢系统成本对于一项任务,有多少个处理器/计算节点共有MIMD结构MIMD: 多个指令流和多个数据流DSM(分布式共享内存)分布式共享内存计算机MBMBMB =内存BusP / CP / CNIC =网络接口LMLMCircuitryLM =本地MemoryDIRDIRDIR =缓存目录NICNIC定制网络DSM内存在物理上分布在各个节点之间但是,通过硬件和软件为用户提供单个地址编程空间,即形成虚拟共享内存的通用MIMD结构MIMD: 多个指令流和多个数据流DSM(分布式共享内存,续)分布式共享内存机器通过缓存目录(DIR)Cray Inc.支持分布式缓存的一致性.

公用MIMD结构MIMD: 多个指令流和多个数据流COW(工作站集群)工作站群集MBMBNIC =网络接口P / CP / CCircuitryMMLD =本地DiskBridgeBridgeM =内存LDIOBLDIOBBridge =桥接NICNIC商用网络(以太网,ATM,Etc . )COW使用高速商业互连网络或定制的网络连接➢通用的MIMD结构,例如以太网和ATM网络MIMD: 多个指令流和多个数据流COW(工作站集群,续)工作站集群每个节点是一台完整的计算机➢现代超级计算机的主流超级计算机体系结构也是商业产品的主流形式➢性能: 一排排机柜并行计算机体系结构摘要各种实现形式的比较VVPVPPP / CP / CP / CP / CMBMBP / CP / C交叉总线或LMLMNICNICSMSMSMSMSMI / OPVPSMP自定义网络MBMBMBMBMP PP / CP / CP / CP / CP / CLMLMMMDIRDIRBridgeBridgeLDIOBLDIOBNICNICNICNIC自定义网络商品网络(以太网,ATM等)
)DSMCOW并行计算机体系结构摘要并行计算机体系结构变得更加一致SMP,MPP,DSM和COW并行体系结构变得更加一致功能➢大量节点通过高速网络互连➢节点遵循Shell结构: 使用专门定制的Shell电路连接商业微处理器和节点的其他部分(包括板级缓存,本地存储,NIC和DISK)注: Shell特别设计的定制电路与Linux中的Naming解释器➢动机更新➢简化并行计算机的设计并提高并行计算机的性并行计算机体系结构摘要三种通用体系结构CCCShell节点NShellShellMPPPDNICNIC节点1互连网络互连网络共享存储共享磁盘(a)不共享(c)共享存储C MShell节点NP的区别: 节点1 NICNIC➢是否共享外部存储互连网络➢是否共享内存共享磁盘(b)共享磁盘并行计算机体系结构摘要中国曙光系列超级计算机[注]曙光第一号SMP1993曙光1000MPP1995曙光5000A曙光2000ICluster19982009曙光2000IICluster1999曙光3000Cluster2000曙光4000ACluster2004注意: 曙光公司解决方案中心总经理曹振南SMP =对称多处理器MPP =并行处理器并行计算机体系结构摘要中国曙光系列超级计算机曙光2000I曙光2000I曙光2000 . 曙光3000.
天河中国并行超级计算机的北方学校和南方学校,移动联通曙光4000A曙光5000A曙光6000家庭作业标题标题标题1.在可扩展性方面比较SMP和MPP的两种体系结构-可扩展性的角度包括: 内存大小可扩展性,处理器数量可扩展性,磁盘容量可扩展性等,至少要选择一个. 主题2. 说明(可以举例,也可以演示): 如何使用SIMD机实现MIMD并行应用程序? -即,假设您拥有的只是一台SIMD机器并行处理系统结构,但是任务是实现并行应用程序,是否有办法完成?作业要求独立完成,发送Word或pdf的电子版本作业地址➢xdsepc2018 @ 163. com➢附件命名规则: “学生编号+名称+作业编号”➢时间: 两周之内,必须在提交之前第四类➢空间: 没有绝对的页数,但是两个问题通常不应少于1页A4纸的2/3页课件地址➢/ ysxu /教书. html课件地址§2.2主流并行计算机系统与性能评估/ ysxu /结构编程算法的应用
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/jisuanjixue/article-199366-1.html
对象不定
所以呐让舍不得的美好留在美好的回忆里吧
配套组件和运用经验都不充分