数据仓库基础笔记思维导图已经整理完毕,完整连接为:
数据仓库基础知识笔记思维导图
数据仓库作为数据分析基础
数据分析基础方法
- 趋势分析和比较
- 切片和分块
切片和分块
向下钻取分析
向下钻取数据:指从一个汇总数据开始麻将该汇总数据分解成一组更细致的汇总数据。通过获取汇总数据下的细节数据,管理者可以知道究竟正在发生什么事,特别是汇总数据在哪里出现异常。
跟踪关键性能指标的能力:关键性能指标能表明公司的运转情况,甚至能表明公司的发展趋势。
最后分析数据的结果需要准确地、完全地、集成地查找和准备数据过程。
生成用于向下钻取分析的基本数据是成功执行向下钻取处理的主要障碍。
数据仓库作为数据分析的基础,数据仓库提供了分析员有效支持分析所必须的数据基础,能够满足数据分析是在低粒度级别上进行操作。
数据通过一个主键结构建立关联,主键结构本身或者主键结构衍生出来的结构将各层数据联系起来,以便能够方便地进行向下钻取。
主要使用数仓的功能有:
- 数据仓库提供汇总数据
- 数据仓库结构支持向下钻取处理
- 数据仓库的元数据为DSS分析员规划建造分析环境
- 数据仓库的历史内容支持管理人员所需要的趋势分析
- 数据仓库中的继承数据可以观察整个公司的运行概况
事件映射
描述事件映射的最简单方式是从一条简单的趋势曲线开始
使用事件映射的事件类型
- 事件的行为不能直接度量,不得不用一种相关的方式
- 成本合理性和实际成本收益用任何别的方法不能度量
细节数据
需要尽可能多的细节数据
安全起见,最好将所有当前能得到的所有细节数据都保存起来
- 存储和处理的开销可能是天价
- 大量数据是有效使用分析技术的一个障碍
- 前面做的细节分析不可重用,只要存在大量细节数据,DSS分析员就会被鼓舞从头做新的分析。浪费,并且可能出现前后分析矛盾的结论
汇总数据是未来分析的基础,并且由于它的存在,不必进行重复分析,应该将汇总数据作为DSS环境的主要部分
只保存汇总数据
汇总数据永远是计算过程的结果,任何情况下都不存在孤立的汇总数据
DSS分析员必须取得汇总数据、理解用来产生汇总数据的过程。
汇总数据可能处于也可能不处于即将进行分析所需要的合适的粒度级,为了进行DSS处理,需要在数据的细节程度和对总数据之间进行权衡。