首先了解多维数据模型和OLAP的含义. OLAP与传统交易业务系统之间的区别(添加,删除和修改)也称为OLTP. OLAP的目的不是在任何时候促进数据的添加,删除和修改,而是在任何时候促进数据的统计分析,因此其存储数据的结构和模型设计将与OLTP完全不同. 多维数据模型是非常适合OLAP的模型. 它拆分维度(分析角度)以形成维度表,然后基于交易事务将事实表与事实表关联以形成多维星型或雪花模型. 在执行数据分析时,如果要基于哪个维度对统计数据进行计数,只需将维度表与事实表相关联即可. 以下明星模特从互联网上借来了一张照片:
这种模型结构的优点是非常方便地进行数据的统计分析,并且结构清晰并且关系简单. 但是,当数据量很大时,在关联表之后执行实时聚合,分组依据,总和,计数和其他操作. 基于不同的性能瓶颈,需要更长的响应时间,尤其是在Hadoop体系结构中. 有关表之间的联接操作.
因此,还有OLAP多维数据集(数据多维数据集)的概念,这对OLAP非常有帮助. 参见下面的图片(也来自网络)
我们对第一张图片的星型模型进行多维预计算过程,以形成一个多维数据集数据存储结构. 当需要统计数据时,可以直接查询一个小多维数据集以获取结果数据并将其返回给用户,这可以达到第二级响应. 由于多维数据集是预先计算和存储的,因此在查询统计数据时无需实时关联联接维表和事实表,并执行实时分组,求和,计数和其他运算,因此数据的性能分析非常快. 除了基于大数据Hadoop架构的Apache Kylin之外,还有很多基于此思想的工具. 还有基于传统架构的Microsoft SSAS,IBM Cognosolap多维分析olap多维分析,Oracle Essbase等.
如果您对数据更改业务感兴趣,欢迎访问Kyligence官方网站
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/jisuanjixue/article-178324-1.html
水军太多了