
2113分布式文件系统,群集文件系统和并行5261文件系统. 这三个4102概念很容易混淆. 在1653年,人们经常不加区分地使用它们. 总是有人问这三个之间的区别和联系. 实际上,它们之间确实存在概念上的重叠区域,但也存在显着差异.

分布式文件系统

自然,分布式是重点,它相对于本地文件系统. 分布式文件系统通常是指C / S体系结构或网络文件系统. 用户数据未直接连接到本地主机,而是存储在远程存储服务器上. NFS / CIFS是最常见的分布式文件系统,这就是我们所说的NAS系统. 在分布式文件系统中,存储服务器节点的数量可以是一个(例如传统的NAS)或多个(例如群集的NAS). 对于单节点分布式文件系统,存在单点故障和性能瓶颈. 除了NAS外,典型的分布式文件系统是AFS,下面将介绍群集文件系统(例如Lustre,GlusterFS,PVFS2等).

集群文件系统

该群集主要分为高性能群集HPC(高性能群集),高可用性群集HAC(高可用性群集)和负载平衡群集LBC(负载平衡群集). 群集文件系统是指与多个节点协作提供高性能,高可用性或负载平衡的文件系统. 它是分布式文件系统的子集,消除了单点故障和性能瓶颈问题. 集群对客户端是透明的. 它看到一个单一的全局名称空间,并且用户文件访问请求被分发到所有群集进行处理. 此外,群集文件系统还追求可伸缩性(包括Scale-Up和Scale-Out),可靠性和易于管理. 在元数据管理方面并行文件系统的特点,可以使用专用服务器,服务器群集或没有专用元数据的完全对等分布式服务器系统. 目前,典型的群集文件系统包括SONAS,ISILON,IBRIX,NetAPP-GX,Lustre,PVFS2,GlusterFS,Google File System,LoongStore,CZSS等.
并行文件系统
此文件系统可以支持并行应用程序,例如MPI. 在并行文件系统环境中,所有客户端都可以同时并行读取和写入同一文件. 同时读取,可以实现大多数文件系统. 并发写入的实现要复杂得多,不仅要确保数据一致性,而且要最大程度地提高并行性,因此在锁定机制中需要特殊的设计,例如细粒度的字节锁定. 通常,SAN共享文件系统是并行文件系统,例如GPFS,StorNext,GFS,BWFS,群集文件系统大多数是并行文件系统,例如Lustre,Panasas等. 如何区分?区分这三个关键字的关键是分布式,群集和并行这三个前缀关键字. 简单来说,非本地直接连接和网络连接是分布式文件系统. 在分布式文件系统中,服务器节点由多个文件组成. 这是一个群集文件系统. 它支持并行应用程序(例如MPI). ),这是一个并行文件系统. 从上面给出的示例中还可以看出,这三个概念之间存在重叠,例如Lustre,它既是分布式文件系统并行文件系统的特点,又是群集和并行文件系统. 但是,它们也有差异. 群集文件系统是分布式文件系统,但事实并非如此,例如NAS和AFS. SAN文件系统是并行文件系统,但可能不是集群文件系统,例如StorNext. GFS,HDFS等是群集文件系统,但它们可能不是并行文件系统. 在实践中,在明确了这三个概念之后,在分析文件系统的特征之后应该容易对它们进行正确的分类.
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/jisuanjixue/article-248311-1.html
很真实