
原标题:全球100款大数据工具汇总(下)

上篇(戳标题即可跳转):全球100款大数据工具汇总(前50款)
51、Redis
是一个高性能的key-value存储系统,和Memcached类似,它支持存储的value类型相对更多,包括string(字符串)、list(链表)、set(集合)和zset(有序集合)。Redis的出现,很大程度补偿了memcached这类key/value存储的不足,在部分场合可以对关系起到很好的补充作用。
52、HDFS
Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统。它和现有的分布式文件系统有很多共同点。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合数据集上的应用。
53、HBase
是Hadoop的,一个分布式、可扩展、大数据的存储。是为有数十亿行和数百万列的超大表设计的,是一种分布式,可以对大数据进行随机性的实时读取/写入访问。提供类似谷歌Bigtable的存储能力,基于Hadoop和Hadoop分布式文件系统(HDFS)而建。
54、Neo4j
是一个高性能的,NOSQL图形,它将结构化数据存储在网络上而不是表中。自称“世界上第一个和最好的图形”,“速度最快、扩展性最佳的原生图形”,“最大和最有活力的社区”。用户包括Telenor、Wazoku、ebay、必能宝(Pitney Bowes)、MigRaven、思乐(Schleich)和Glowbl等。
55、 Vertica
基于列存储高性能和高可用性设计的方案,由于对并行处理(MPP)技术的支持,提供细粒度、可伸缩性和可用性的优势。每个节点完全独立运作,完全无共享架构,降低了共享资源的系统竞争。
56、Cassandra
是一个混合型的非关系的,类似于Google的BigTable,其主要功能比Dynamo (分布式的Key-Value存储系统)更丰富。这种NoSQL最初由Facebook开发,现已被1500多家企业组织使用,包括苹果、欧洲原子核研究组织(CERN)、康卡斯特、电子港湾、GitHub、GoDaddy、Hulu、Instagram、Intuit、Netfilx、Reddit及其他机构。
57、CouchDB
号称是“一款完全拥抱互联网的”,它将数据存储在JSON文档中,这种文档可以通过Web浏览器来查询,并且用Java来处理。它易于使用,在分布式上网络上具有高可用性和高扩展性。
58、Dynamo
是一个经典的分布式Key-Value 存储系统,具备去中心化、高可用性、高扩展性的特点。Dynamo在Amazon中得到了成功的应用,能够跨数据中心部署于上万个结点上提供服务,它的设计思想也被后续的许多分布式系统借鉴。
59、 Amazon SimpleDB
是一个用Erlang编写的高可用的NoSQL数据存储,能够减轻管理工作,开发人员只需通过Web服务请求执行数据项的存储和查询,Amazon SimpleDB 将负责余下的工作。作为一项Web 服务,像Amazon的EC2和S3一样,是Amazon网络服务的一部分。
60、 Hypertable
是一个开源、高性能、可伸缩的,它采用与Google的Bigtable相似的模型。它与Hadoop兼容,性能超高,其用户包括电子港湾、百度、高朋、Yelp及另外许多互联网公司。
61、Kettle
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/jisuanjixue/article-65640-1.html
是出于对它的信任