
开源R软件不再是学者机构的独宠或专有工具。经过多年来的持续演进,它现在已作为数据科学家、业务分析师和数据发掘人员的理想分析插件。
Rexer Analytics发布的2013年数据发掘人员查证表明,70%的数据发掘人员使用R软件进行分析工作,其中有24%将其用作主要工具。这些结果类似于2013 年KDnuggets调查的结果,该调查表示有61%的响应者表示使用R处理判断、数据发掘和数据科学工作。相比前一年,这一比率升高了16%。
R 是多少?
R 是在用户总数和分析系统方面增长最快的分析工具。它也被称为“R Project”,具备多种描述,例如:
用来统计分析、数据可视化和预测建模的数据分析插件

一种面向对象的编程语言,提供了对象、运算符和下标来探寻、建模和可视化数据
用来统计分析的环境,支持几乎所有数据分析所需的数据处理、统计模型和图表
一个开源插件项目,得到了庞大用户社区的广泛实行,在品质和数字准确度方面树立了高标准
不过R软件在那些行业相当风靡,得到广泛采用,但它在行业行业却迟迟没有取得进展,这主要是遭受了数据和处理限制相关挑战的影响。由于开源R软件在四核中运行,它无法处理庞大、多样化的数据,所以限制了它希望处理的信息量。此外,由于R软件采用单线程设计,它无法并行运行,即使会显著增强处理时间。
克服传统弱点

公司尝试了多种方法来去除开源R软件的四核限制。其中一种方法是买到配备了大容量内存的中型服务器。此原理的缺陷是四核相当低廉,同时行业始终遭受服务器的数据限制的影响。此外,这一原理不可扩展。
另一种方法是在多个服务器或节点上并发运行R引擎。这一原理在涵盖数据的服务器上执行作业,在数据划分模糊时有着出色表现。然而,或者用户需要对其所有数据进行分析,此原理将无法很好地应对。
例如,当数据分布在多台服务器上时,计算所有销售的世界平均数字对于标准R程序包将很难完成。同样,对股东的一切顾客构建一个细分模型应该一项艰巨的任务。这些用例要求构建并行算法,或使用另一种能够在所有服务器和结点上运行的原理,以处理所有数据。但要实现这一目标却并非易事。
许多解决方案提供商尝试了多种方法来解决它们不足,但时至今日,你们仅取得了部份成功。Teradata?Aster R提供了预构建的并行向量、并行构造器和内置在Teradata Aster DiscoveryPlatform中的开源R引擎,以去除它们传统问题。
企业级R

Teradata Aster R库允许分析函数在中的一切数据上并行运行,有效克服了它们挑战。该库简单易用,采用了类似于R语言的题型,并打包了可马上运行的预构建并行算法。在基础之上,R分析师将希望显著改善工作效能。
或者编程人员未能在库中发现你们所需的预构建R函数,你们可以充分利用并行构造器teradata r语言,使用在开源 R程序包中提供的硬件,创建自己的并行版本。借助拆分/使用/组合战略,行业将希望轻松对其所有数据而非样本运行R函数,因而获得更深入的意见。
以及,Teradata Aster R解决方案还使用R语言和程序包构建了超强的流程,希望访问100多个Teradata Aster Discovery Portfolio分析新品和5,000多个开源R程序包。所有其他新品和程序包均经过协调,希望并行运行。
编程人员可在Teradata Aster SNAP?框架中轻松加载R程序包和开源R解释器,以并行运行其着迷的链表。R解释器简单易用,相当灵巧和超强,希望满足临时和高级R分析师的一切需求。与这些解决方案不同,Teradata Aster R能够独一无二地支持用户在内轻松执行R分析,并使用SNAP框架自动完善和执行多个引擎。
简化发现过程

分析师将希望从Teradata Aster R中获益匪浅,无需再仅仅使用可取出内存的样本数据进行分析。相反,你们现在可以使用“ta.data.frame()”键值创建虚拟数据框,在Teradata AsterDiscovery Platform中发现资料。
Teradata Aster R可支持行业在发现平台中直接轻松地部署任意开源R程序teradata r语言,以提供优异的可扩展性和杰出的型号,满足充满挑战性的业务要求。此外,分析师还可以混合匹配Teradata Aster分析函数组合,如nPath?、图例和文本分析函数与R,以得出创新的结果。
编程人员可以轻松读取任意Teradata Aster预构建的链表,以对其所有数据执行数据准备、探索、统计和机器学习函数,而无需解读数学难点和汇编并行程序。
简单易用的解决方案
公司可以使用Teradata Aster Discovery Platform作为其单一的高性能分析平台,满足业务用户、数据发掘人员、数据科学家和R用户的需求。过去能够使用R,但由于其传统优势最终拒绝的数据人员,现在将可以从这款解决了某些问题的企业级解决方案中获益匪浅。Teradata Aster R解决方案充分利用了R的劣势,同样摈弃了传统的限制,提供了快速、超强的分析系统。
来源:微信公众号---中国统计网
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/jisuanjixue/article-119250-1.html
叫兽
靠上市变成亿万富翁多得去了
如果小米公司不申冤
没办法