b2科目四模拟试题多少题驾考考爆了怎么补救
b2科目四模拟试题多少题 驾考考爆了怎么补救

olap与数据仓库_oracle数据仓库_数据仓库实现

电脑杂谈  发布时间:2017-01-18 13:10:58  来源:网络整理

一、什么是数据挖掘

数据挖掘(Data Mining),又称为中的知识发现(KnowledgeDiscovery in Database, KDD),就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程,简单的说,数据挖掘就是从大量数据中提取或“挖掘”知识。

二、数据挖掘相关的10个问题

NO.1 Data Mining 和统计分析有什么不同?

但是为什么Data Mining的出现会引发各领域的广泛注意呢?主要原因在相较于传统统计分析而言,DataMining有下列几项特性:

1.处理大量实际数据更强势,且无须太的统计背景去使用Data Mining的工具;

2.数据分析趋势为从大型抓取所需数据并使用专属计算机分析软件,DataMining的工具更符合企业需求;

3. 纯就理论的基础点来看,Data Mining和统计分析有应用上的差别,毕竟DataMining目的是方便企业终端用户使用而非给统计学家检测用的。

NO.2 Data Warehousing和 Data Mining的关系为何?

若将Data Warehousing(数据仓库)比喻作矿坑,Data Mining就是深入矿坑采矿的工作。毕竟DataMining不是一种无中生有的魔术,也不是点石成金的炼金术,若没有够丰富完整的数据,是很难期待DataMining能挖掘出什么有意义的信息的。

要将庞大的数据转换成为有用的信息,必须先有效率地收集信息。随着科技的进步,功能完善的系统就成了最好的收集数据的工具。数据仓库,简单地说,就是搜集来自其它系统的有用数据,存放在一整合的储存区内。所以其实就是一个经过处理整合,且容量特别大的关系型,用以储存决策支持系统(DesignSupport System)所需的数据,供决策支持或数据分析使用。从信息技术的角度来看,数据仓库的目标是在组织中,在正确的时间,将正确的数据交给正确的人。

许对于Data Warehousing和Data Mining时常混淆,不知如何分辨。其实,数据仓库是技术的一个新主题,利用计算机系统帮助我们操作、计算和思考,让作业方式改变,决策方式也跟着改变。

数据仓库本身是一个非常大的,它储存着由组织作业中整合而来的数据,特别是指事务处理系统OLTP(On-LineTransactional Processing)所得来的数据。将这些整合过的数据置放于数据昂哭中,而公司的决策者则利用这些数据作决策;但是,这个转换及整合数据的过程,是建立一个数据仓库最大的挑战。因为将作业中的数据转换成有用的的策略性信息是整个数据仓库的重点。综上所述,数据仓库应该具有这些数据:整合性数据(integrateddata)、详细和汇总性的数据(detailed and summarized data)、历史数据、解释数据的数据。从数据仓库挖掘出对决策有用的信息与知识,是建立数据仓库与使用DataMining的最大目的,两者的本质与过程是两回事。换句话说,数据仓库应先行建立完成,Data mining才能有效率的进行,因为数据仓库本身所含数据是干净(不会有错误的数据参杂其中)、完备,且经过整合的。因此两者关系或许可解读为DataMining是从巨大数据仓库中找出有用信息的一种过程与技术。

NO.3 OLAP能不能代替 Data Mining?

所谓OLAP(Online Analytical Process)意指由所连结出来的分析处理程序。有些人会说:「我已经有OLAP的工具了,所以我不需要DataMining。」事实上两者间是截然不同的,主要差异在于Data Mining用在产生假设,OLAP则用于查证假设。简单来说,OLAP是由使用者所主导,使用者先有一些假设,然后利用OLAP来查证假设是否成立;而DataMining则是用来帮助使用者产生假设。所以在使用OLAP或其它Query的工具时,使用者是自己在做探索(Exploration),但DataMining是用工具在帮助做探索。


本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/jisuanjixue/article-27139-1.html

相关阅读
    发表评论  请自觉遵守互联网相关的政策法规,严禁发布、暴力、反动的言论

    热点图片
    拼命载入中...