数据分析与Excel

1. 数据分析

随着互联网+的不断深入,网络中的数据量飞速膨胀。身处信息的海洋,在这个数据高速爆发的时代,企业想要快速发展,不能只简单地靠历史的经验,想要快速成功,就要认清数据、企业、社会三者之间的联系,因此就出现了数据分析这个职业。尤其是在以数据驱动为首的百度、美团、以及京东等企业中,数据分析都扮演了重要的角色。现在的传统企业也慢慢意识到了数据驱动的重要性,大部分企业也都在学着用数据分析解决问题,或者提升业绩,这类公司在进行数字化转型。比如:银行企业的中国银联,交通银行的东方航空,通信行业的移动、联通、电信等都在通过数据进行探索。

1.1 什么是数据分析

数据分析是通过技术手段,对业务进行流程梳理、指标监控、问题诊断以及效果评估,它的目的是对过去发生的现象进行评估和分析,并在这个基础上对未来事物的发生和发展做出预期分析处理,以此指导未来的一些关键性决策。

随着数据量的不断增长,数据处理以及信息挖掘技术也在迅速发展,人们对于数据的处理也不仅仅是数据存储以及信息的简单探索,而是结合一些模型的应用进一步分析。虽然现在出现了大量数据分析技术,例如:Python、R等编程语言以及MySQL、Hadoop等数据存储技术,但是Excel凭借其操作简单、灵活以及宽广的覆盖面,在数据分析中占据着一席之地。

1.2 数据分析流程

数据分析流程可以概括为:数据理解、提取数据、数据清洗、数据分析、数据可视化、撰写报告。

2. Excel用法

2.1 创建与保护

2.1.1 认识Excel文件

工作簿:一个excel文件就是一个工作簿
工作表:一个工作簿中可以有多个工作表(至少一个)
单元格:单元格是excel文件保存数据的基本单位
行号和列号:可以确定单元格位置

2.1.2 保护功能

保护工作簿:

防止其他用户对工作簿的结构进行更改,如移动、删除或者添加工作表

保护工作表:

通过限制其他用户的编辑能力来防止他们进行不需要的更改

保护单元格:

防止数据被篡改

2.1.3 操作方法

保护工作表:

在Excel底部工作表处选中工作表后——>右键——>保护工作表

python银行流水分析模型 银行python数据分析部门_python银行流水分析模型

保护单元格:

选中单元格——>开始——>选择单元格中的格式——>锁定单元格、保护工作表

python银行流水分析模型 银行python数据分析部门_python银行流水分析模型_02


python银行流水分析模型 银行python数据分析部门_数据分析_03

先锁定单元格,再保护工作表

保护工作簿:

审阅 ——> 保护工作簿

python银行流水分析模型 银行python数据分析部门_数据_04

2.2 快速输入

在这里主要讲几个常用的快速输入

2.2.1 填充序列

复制单元格样式,将单元格内容按照一定规则变化

摁住右键下拉会出现选择

python银行流水分析模型 银行python数据分析部门_数据分析_05

文字+数字或者纯数字会显示为:

python银行流水分析模型 银行python数据分析部门_学习_06

如果鼠标左键直接下拉,纯数字会直接复制原数据

2.2.2 以年、月、日、工作日填充

方法:鼠标右键选中单元格右下角出现+,下拉

python银行流水分析模型 银行python数据分析部门_右键_07

根据情况选择以年填充、以月填充、以天数填充或者以工作日填充

鼠标左键下拉,默认是以天数填充

2.2.3 等差序列、等比序列

等差序列和等比序列必须有两个单元格是有数据存在的,才可以进行等差和等比

  1. 选中两个单元格,鼠标移到选中的单元格右下角出现+后,右键选中下拉

python银行流水分析模型 银行python数据分析部门_数据_08

  1. 选择等差序列或者等比序列

python银行流水分析模型 银行python数据分析部门_右键_09

2.2.4 快速填充

以图示为例:

python银行流水分析模型 银行python数据分析部门_python银行流水分析模型_10

如果我们想在第二列填充的都是第二列第一行在第一列中类似的情况。这个时候,选中单元格,鼠标放单元格右下角出现+后,右键下拉

python银行流水分析模型 银行python数据分析部门_数据分析_11

2.2.5 自定义列表填充

如何选中单元格,鼠标左键按住单元格右下角+后出现的是自己想要的东西?

文件——>选项——>高级——>编辑自定义列表

python银行流水分析模型 银行python数据分析部门_python银行流水分析模型_12


python银行流水分析模型 银行python数据分析部门_数据_13

添加自己想要出现的格式

设置好之后,在其中一个单元格输入有关内容,选中单元格,右下角+号,左键下拉

python银行流水分析模型 银行python数据分析部门_数据_14

2.2.6 多个不连续单元格同数据
1)Ctrl+鼠标左键选中单元格,填入数据,Ctrl+Enter补全
  1. 先crtl一直摁住,鼠标左键选择需要填充同一数据的单元格,输入自己想要填充的内容

python银行流水分析模型 银行python数据分析部门_数据分析_15

  1. ctrl+enter,将填充的内容不全到选中的单元格里

python银行流水分析模型 银行python数据分析部门_python银行流水分析模型_16

2)选中下方数据,Ctrl + G,选中空值,对空值进行单元格引用,Ctrl + Enter

python银行流水分析模型 银行python数据分析部门_右键_17

  1. ctrl+G,点击定位条件

python银行流水分析模型 银行python数据分析部门_右键_18

2.选中空值

python银行流水分析模型 银行python数据分析部门_python银行流水分析模型_19

  1. Ctrl + Enter

python银行流水分析模型 银行python数据分析部门_学习_20

2.2.7 文本记忆输入

Alt + 向下箭头,必须连续单元格输入才会生效

python银行流水分析模型 银行python数据分析部门_学习_21

2.3 数据验证

2.3.1 数据有效性

如果想有图示效果的选择:

python银行流水分析模型 银行python数据分析部门_python银行流水分析模型_22

  1. 选中单元格——>工具栏的数据——>数据验证——>设置——>允许:序列——>来源

python银行流水分析模型 银行python数据分析部门_右键_23

  1. 选中单元格中想要列出的数据

python银行流水分析模型 银行python数据分析部门_python银行流水分析模型_24

  1. 点击全中的符号

python银行流水分析模型 银行python数据分析部门_数据_25

2.3.1 圈释无效数据

如果想像这样把无效数据圈起来:

python银行流水分析模型 银行python数据分析部门_python银行流水分析模型_26

  1. 选择数据验证,设置最大值和最小值,划范围

python银行流水分析模型 银行python数据分析部门_学习_27

  1. 点击工具栏,数据工具中的数据验证下标,圈释无效数据

python银行流水分析模型 银行python数据分析部门_学习_28