一、数据分析概念
1.1 数据分析
是指用适当的统计分析方法对收集来的大量数据进行分析,将他们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。
1.2 数据分析包括
- 描述性数据分析(初级数据分析)
- 探索性数据分析(中级数据分析)
- 验证性数据分析(高级数据分析)
1.3 企业数据分析的目标
- 进行市场分析和研究
- 把握产品的市场动向
- 指定产品研发和销售计划
二、数据分析的三大作用
2.1 现状分析
- 告诉你企业的整体运营情况,通过各项指标衡量企业的运营状况。
- 告诉你企业的各项业务构成,了解各项业务发展和变动情况。
- 通过日常通报完成,如日报、周报、月报。
2.2 原因分析
- 有了现状分析,但不知好在哪里,差在哪里,就要进一步开展原因分析,做优化调整。
- 原因分析通过专题分析完成。
2.3 预测分析
- 需要对企业未来发展趋势做预测,为企业提供参考与决策依据,使企业持续健康发展。
- 预测分析通过专题分析完成,指定企业年度、季度计划时进行。
三、数据分析六大步骤
3.1 明确分析目的和思路
3.1.1 明确分析目的
菜鸟会想 | 数据分析师会想 |
这张曲线图很好看,怎么做的? | 数据变化背后真相是什么? |
这些数据可以做什么样的分析? | 从哪些角度分析数据才系统? |
高级分析方法在这里能用嘛? | 用什么分析方法最有效? |
要做多少张图表? | 图表是否表达出有效的观点? |
除了为数据添加文字说明外还需说什么? | 数据分析的目的达到了嘛? |
数据分析报告要写多少页? | 数据分析报告有说服力吗? |
3.1.2 确定分析思路
《精益数据分析》
- 熟悉分析方法论
- 搭建分析框架
- 再把分析框架体系化
3.2 数据收集
是指按照确定的数据分析框架,收集相关数据的过程,它为数据分析提供素材和依据。
数据的主要来源:
- 数据库
- 互联网
- 市场调研
- 埋点(前端埋点、后端埋点)
自己埋点和接入第三方统计工具,现在有很多第三方统计工具,神策、Google Analytics、百度统计、CNZZ统计、友盟都是用得比较多的,操作简单又方便。自己埋点比较复杂,当然得到的统计数据更为准确高质量。
3.3 数据处理
数据处理 是指对收集到的数据进行加工处理,形成适合数据分析的形式。
数据处理目的 是从大量杂乱、无规则的数据中,抽取有价值、有意义的数据。
3.4 数据分析与数据挖掘
3.4.1 数据分析
是指用适当的分析方法和工具,对处理过的数据进行分析,提取有价值的信息,形成有效结论的过程。
数据处理是数据分析的基础
- 一般数据分析:EXCEL
- 高级数据分析: SPSS、Python
3.4.2 数据挖掘
数据挖掘是一种高级的数据分析方法,它侧重解决四类问题:分类、聚类、关联和预测。
- 特征工程
- sklearn
- TensorFlow
3.5 数据展示
数据展现是指用通过表格和图形的方式来呈现数据。
能用图说明问题的就不用表格,能用表格说明问题的就不用文字。
- matplotlib
- seaborn
- tableau
3.6 撰写报告
- 需要有一个好的框架,图文并茂,层次清晰。
- 需要有一个明确的结论。
- 一定要有建议或解决方法。
四、常用数据分析方法
4.1 数据分析作用与对应的分析方法
4.2 对比分析法
定义
对比分析法是将两个或两个以上的数据进行比较,分析其中的差异,从而揭示这些事物所代表的发展变化情况和规律性。
特点
非常直观的看出事物某方面的变化或差距,而且可以准确、量化的表示出变化的差距是多少。
对比经常被应用在如下各种场景:
- 与目标对比 实际完成值与目标值进行对比,属于横比
- 不同时期对比 选择不同时期的指标数值作为标准对比,属于纵比。
同比:历史同期数据进行比较,突出显示数据的短期趋势,会受到季节等因素的影响。
环比:相邻两月进行比较,侧重反映长期的大趋势,也就规避了季节的因素。 - 同级别对比 同级部门、单位、地区对比,属于横比
- 行业内对比 对比找出自身发展方向,属于横比
- 活动效果对比 比较营销活动前后效果对比,属于纵比
4.3 分组分析法
定义
分组分析法是根据数据分析对象的特征,按照一定的指标,把数据分析对象划分为不同的部分和类型来进行比较研究。
目的
把总体中具有不同性质的对象区分开,把性质相同的对象合并在一起便于对比。分组分析一般都与对比分析结合使用。
步骤
- 确定组数
- 确定各组组距 组距 =(最大值-最小值)/ 组数
- 根据组距大小,对数据进行分析整理,划归到相应组内
4.4 结构分析法
定义
结构分析法是指被分析研究总体内各部分与总体之间进行的分析方法。
公式
结构相对指标(比例)= 总体某部分的数值 / 总体总量 * 100%
应用案例
市场占有率 =(某商品销售量 / 该种商品市场销售总量)* 100%
市场占有率是分析企业在行业中竞争状态的重要指标。市场占有率高,表明企业运营状况好,竞争能力强,市场占据有利地位;反之,结果相反。
4.5 平均分析法
定义
平均分析法是运用计算平均数的方法来反映总体在一定时间、地点、条件下某一数量特征的一般水平的分析方法。
作用
- 利用平均指标对比同类现象在不同地区、不同行业之间的差异程度,比用总量指标更具说服力。
- 利用平均指标对比某些现象在不同历史时期的变化,更能说明其发展趋势和规律
公式
算术平均数 = 总体各单位数值的总和 / 总体单位个数
4.6 交叉分析法
定义
交叉分析法是同时将两个有一定联系的变量及其值交叉排列在一张表内,使各变量值成为不同变量的交叉结点,一般用二维交叉表分析法。
4.7 杜邦分析法
定义
杜邦分析方法是将各种财务指标综合在一起来评价公司财务管理效果。通常用于公司财务方面的分析。
4.8 漏斗图分析法
漏斗分析是一套流程式数据分析,它能够科学反映用户行为状态以及从起点到终点各阶段用户转化率情况的重要分析模型。漏斗分析模型已经广泛应用于网站用户行为分析和APP用户行为分析的流量监控、产品目标转化等日常数据运营与数据分析的工作中。
4.8.1 用户转化\流失率漏斗模型
漏斗分析最常用的是转化率和流失率两个互补型指标。用一个简单的例子来说明,假如有100人访问某电商网站,有30人点击注册,有10人注册成功。这个过程共有三步,第一步到第二步的转化率为30%,流失率为70%,第二步到第三步转化率为33%,流失率67%;整个过程的转化率为10%,流失率为90%。该模型就是经典的漏斗分析模型。
4.8.2 用户完成支付行为的漏斗模型
五、数据分析报告
5.1 数据分析报告简介
5.1.1 什么是数据分析报告
数据分析报告是根据数据分析原理和方法,运用数据来反映、研究和分析某项事物的现状、问题、原因、本质和规律,并得到结论,提出解决办法的一种分析应用问题。
决策者依靠数据分析报告
- 认识事物
- 了解事物
- 掌握信息
- 搜索相关信息
5.1.2 数据分析报告的原则
一份完整的数据分析报告,应当围绕目标确定范围,遵循一定的前提和原则,系统地反映存在的问题及原因,从而进一步找出解决问题的方法。
- 规范性:数据分析报告中所使用的名词术语一定要规范,标准统一,前后一致,要与业内公认的术语一致。
- 重要性:数据分析报告一定要体现数据分析的重点,在各项数据分析中,应该重点选取关键指标,科学专业地进行分析。
- 谨慎性:数据分析报告的编制过程一定要谨慎,基础数据必须真实、完整,分析过程必须科学、合理、全面,分析结果可靠,内容要实事求是。
- 创新性:数据分析报告需要适时地引入科学技术,可以用实际结果来验证或改进它们。
5.1.3 数据分析报告的作用
- 展示分析结果:报告以某一种特定的形式将数据分析结果清晰地展示给决策者,使得他们能够迅速理解、分析、研究问题的基本情况、结论与建议等内容。
- 验证分析质量:通过报告中对数据分析方法的描述、对数据结果的处理与分析等几个方面来检验数据分析的质量,并且让决策者能够感受到整个数据分析过程是科学且严谨的。
- 提供决策参考:大部分的数据分析报告都是具有时效性的,因此所得到的结论与建议可以作为决策者在决策方面的一个重要参考依据。
5.1.4 数据分析报告的总类
由于数据分析报告的对象、内容、时间、方法的情况不同,因而存在这不同形式的报告类型:
专题分析报告:单一性、深入性
综合分析报告:全面性、关联性
日常数据通报:进度性、规范性、时效性
5.2 数据分析报告组成
5.2.1 数据分析报告结构
数据分析报告确实有特定的结构,但是这种结构并非一成不变,不同的数据分析师、不同的老板、不同的客户、不同性质的数据分析,其最后的报告可能会有不用的结构。
最经典的报告结构还是“总-分-总”结构,它主要包括:开篇、正文和结尾三大部分。
5.2.2 六大组成部分及特点
1. 标题页
需要写明报告的题目,题目要精简干练,根据版面的要求在一两行内完成。
好的标题不仅可以表现数据分析的主题,而且能够激发读者的阅读兴趣,因此需要重视标题的制作,以增强其艺术性的表现力。
2. 目录
可以帮助读者快捷方便地找到所需的内容,因此,要在目录中列出报告主要章节的名称。
3. 前言
- 分析背景
- 分析目的
- 分析思路
4. 正文
正文是数据分析报告的核心部分,它将系统全面地表述数据分析的过程与结果。
报告正文具有的特点:
- 是报告最长的主体部分。
- 包含所有数据分析事实和观点。
- 通过数据图表和相关的文字结合分析。
- 正文各部分具有逻辑关系。
5. 结论与建议
- 结论是以数据分析结果为依据得出的分析结果,通常以综述性文字来说明。
- 建议是根据数据分析结论对企业或业务等所面临的问题而提出的改进方法,建议主要关注在保持优势及改进劣势等方面。
6. 附录
附录提供正文中涉及而未予阐述的有关资料,有时也含有正文中提及的资料,从而向读者提供一条深入数据分析报告的途径。
它主要包括报告中涉及的专业名词解释、计算方法、重要原始数据、地图等内容。
5.2.3 注意事项
- 结构合理,逻辑清晰
- 实事求是,反映真相
- 用词准确,避免含糊
- 篇幅适宜,简洁有效
- 结合业务,分析合理
小伙伴们!你们搞清楚数据分析在公司中的使用了吗?