做每一件事,都需要一定的流程,数据分析也不例外。下面,我将从我理解的角度介绍数据分析工作具体需要哪些工作流程:
一、目标确定
在数据分析之前,我们需要明确我们要解决什么问题,要达到什么目的,只有明确了目标,我们才能进行下面的工作。
我们还要明确分析方式,我们是对现有情况进行分析,也就是描述性分析,还是基于现状,预测未来的情况,也就是预测性分析,这两种分析方式决定了我们接下来的工作步骤。
二、数据获取
在这一步我们需要进行字段设计,也就是根据第一步的目标确定到底要分析哪些指标,并确定相应的字段,以便进行分析。
若当前的基础数据中有需要的字段,就对其保留;若没有,则需要根据现有字段进行计算,如通过单价和购买数量计算总额。
三、数据提取
有两种常用的方式:
- 从软件中导出数据。例如从销售管理软件中导出销售数据。
- 通过SQL语句从数据库中提取数据。
四、数据清洗
需要对四种不正常的数据进行清洗:
- 异常值:首先,识别异常值,可以通过计算与平均值的倍数;其次,判定异常值是否合理,是否有其产生的合理原因;最后,对异常值进行处理。
- 空白值:可以对其进行平均值填补或删除。
- 无效值:可以对其进行修正、平均值填补或删除。
- 重复值:可以对其进行删除。
五、数据整理
两种基本操作:
- 格式化:如对日期的处理、对行和列进行格式化。
- 指标计算:对原始数据进行基础的计算,如平均值、总额、频数、频率,以便快速了解数据。
六、描述分析
- 数据描述:对数据的基本情况进行描述,如数据的总数、时间跨度、数据来源等。
- 指标统计:分析实际情况的数据指标,主要包括四个部分:
(1)变化:数据随着时间的变动而增减,如近期销售额表现。
(2)分布:数据在不同层次上的表现,如地域分布、人群分布。
(3)对比:数据项之间的对比,如产品线对比、用户数对比。
(4)预测:根据数据现有的增减幅度,预测未来的状况。
七、洞察结论
此步骤是数据报告的核心,体现了数据分析师的分析能力,主要是对图表进行解读。
八、撰写报告
主要包括以下五个步骤:
- 报告分析背景,如业务的现状。
- 报告分析的目的,如本次分析主要解决什么问题。
- 报告数据的基本情况,如数据的来源、数据的可信度、数据的缺失情况,是怎样处理数据的。
- 粘贴可视化图表,对图表进行解释。
- 根据分析结果对做出决策,提出解决方案。