做每一件事,都需要一定的流程,数据分析也不例外。下面,我将从我理解的角度介绍数据分析工作具体需要哪些工作流程:

一、目标确定

在数据分析之前,我们需要明确我们要解决什么问题,要达到什么目的,只有明确了目标,我们才能进行下面的工作。
我们还要明确分析方式,我们是对现有情况进行分析,也就是描述性分析,还是基于现状,预测未来的情况,也就是预测性分析,这两种分析方式决定了我们接下来的工作步骤。

二、数据获取

在这一步我们需要进行字段设计,也就是根据第一步的目标确定到底要分析哪些指标,并确定相应的字段,以便进行分析。
若当前的基础数据中有需要的字段,就对其保留;若没有,则需要根据现有字段进行计算,如通过单价和购买数量计算总额。

三、数据提取

有两种常用的方式:

  • 从软件中导出数据。例如从销售管理软件中导出销售数据。
  • 通过SQL语句从数据库中提取数据。

四、数据清洗

需要对四种不正常的数据进行清洗:

  • 异常值:首先,识别异常值,可以通过计算与平均值的倍数;其次,判定异常值是否合理,是否有其产生的合理原因;最后,对异常值进行处理。
  • 空白值:可以对其进行平均值填补或删除。
  • 无效值:可以对其进行修正、平均值填补或删除。
  • 重复值:可以对其进行删除。

五、数据整理

两种基本操作:

  • 格式化:如对日期的处理、对行和列进行格式化。
  • 指标计算:对原始数据进行基础的计算,如平均值、总额、频数、频率,以便快速了解数据。

六、描述分析

  • 数据描述:对数据的基本情况进行描述,如数据的总数、时间跨度、数据来源等。
  • 指标统计:分析实际情况的数据指标,主要包括四个部分:
    (1)变化:数据随着时间的变动而增减,如近期销售额表现。
    (2)分布:数据在不同层次上的表现,如地域分布、人群分布。
    (3)对比:数据项之间的对比,如产品线对比、用户数对比。
    (4)预测:根据数据现有的增减幅度,预测未来的状况。

七、洞察结论

此步骤是数据报告的核心,体现了数据分析师的分析能力,主要是对图表进行解读。

八、撰写报告

主要包括以下五个步骤:

  • 报告分析背景,如业务的现状。
  • 报告分析的目的,如本次分析主要解决什么问题。
  • 报告数据的基本情况,如数据的来源、数据的可信度、数据的缺失情况,是怎样处理数据的。
  • 粘贴可视化图表,对图表进行解释。
  • 根据分析结果对做出决策,提出解决方案。