分布形态的描述偏态:数据分布的偏斜程度。峰态:数据分布的尖峰扁平程度。偏态 峰态峰态指数据分布的尖峰扁平程度。相对于标准正态分布而言。 描述性统计图表统计表最常用的统计表是频数分布表。 统计图饼图:结构分析条形图(柱形图):对比分析直方图:数据的分布形态箱线图:数据的分布特征线图:描述量的变化情况。散点图:描述变量间的相关关系。 饼图用于结构分析
离散程度的描述分类数据的离散程度:分类数据的离散程度常用指标:异众比率,一组数据中,非众数的频数占总数据个数的比重。异众比率性质:①不受极端值的影响;②一组数据中异众比率越大,众数的代表性越大。如考试成绩优秀9人,良好20人,中等25人,差等6人,则众数是中等,异众比率是25/50=0.4顺序数据的离散程度常用指标:极差、四分位差。极差即范围,等于一组数据的最大值和最小值之差。极差的性质:①极差是
数据的描述性统计分析数据的描述性统计分析常从数据的集中趋势、离散程度、分布形态3反面着手。集中趋势集中趋势描述数据向其中心值靠拢的趋势。分类数据的集中趋势描述:众数。特点:不受极端值影响,不唯一。用表示。 顺序数据的集中趋势描述: 数值数据集中趋势描述常用指标平均数,又称为均值、期望。分为算术平均数、调和平均数、几何平均数、平方平均数。算数平均数:调和平均数:是数据
统计学基本概念总体:研究的所有元素的集合。个体:总体中的一个元素。样本:总体中抽取的一部分个体的集合。样本容量:样本中个体的数量。参数:总体的某个特征。统计量:样本的某个特征。 是否使用抽样统计不不是根据数据量的多少,而是根据总体中的个体是不是 按照表达形式划分:有两种划分形式,一种是定性数据、定量数据。另一种是分为分类数据、顺序数据、数值数据(定量数据)。第一种:定性数据:刻
第四章描述性统计分析概述统计学解决问题的步骤:收集数据、处理数据、分析数据、解释数据。收集数据是数据分析的前提,直接来源的数据是一手数据,间接来源的数据是二手数据。调查和实验的区别:调查强调的是不对数据对象进行干扰,任其自然发展,收集发展过程中的数据;实验强调的是有目的的对数据对象进行因素干扰,从而验证这些因素对数据对象是否产生影响,以及产生何种影响。处理数据:包括将收集的数据进行数据编码、数据库
业务分析方法论业务分析方法是遇到特定业务问题时使用的分析定式。帕累托分析方法又称二八分析方法,依据帕累托法则在对关键对象进行查找、定位时使用的分析方法。帕累托法则是由19世纪意大利经济学家帕累托所创:主要资源集中在少数人手中。帕累托分析方法是帕累托法则的法相应用。帕累托图:折线图和柱状图组合而成。折线图使用业务结果完成度的累计百分比作为指标,柱形图使用实际业务结果作为指标。横轴是业务对象维度。
客户分类模型用户价值模型:单位时间内用户贡献的价值为核心业务目标。将消费金额拆解成购买频次和客单价两个不同度量轴。 RFM模型:主要应用于电商领域,帮助决策者了解用户的留存、流失情况,以便针对不同特征用户开展不同运营策略。R最近一次消费,F消费频次,M消费金额。衡量客户价值和客户创利能力。 用户忠诚度模型:在零售企业中用的多。用消费金额和消费次数指标体现用户的忠诚度
指标体系指标体系是相互之间有逻辑联系的指标构成的整体。完整的指标体系可以描述业务框架的整体架构情况、业务流程的完整脉络线索即业务结果的具体产生原因。指标体系从搭建到分析应用有4步骤:1 选取、设计指标搭建指标体系2 收集指标数据3 计算指标值4 分析指标值搭建指标体系需要明确三个问题:1 指标体系服务对象是谁。2 指标体系的使用目的。3 指标体系所处的维度环境搭建指标体系过程中使用的核心思维方法是
业务分析类指标主要用来量化企业不同业务部门中开展不同业务行为结果的好坏情况。以下是营销行为的一些指标,营销行为主要包括市场宣传、产品推广、发现客户、挖掘需求、客户运营、销售产品、售后服务等。客户拜访次数:接通率:回访次数:引导客户注册人数:其他:申请通过人数、审核人数、审核通过率、广告投放数、广告投放金额、成交单数、成交金额、成交率等。 效果分析类指标效果分析类指标主要用于企业资产使用效
产品库存类指标库存手进货与销售双方向的影响。期初库存:单位时间的起点处库存量。期末库存:单位时间的终点处库存量。常见指标:库存数量与库存金额:可以是某时点或者某时段平均值。 有两个计算方法:计算方法一:单位时间内库存总数量或库存总金额/单位时间天数,代表单位时间内的库存平均水平。计算方法二:单位时间内,(期初库存数量或金额+期
客户行为特征类指标单位时间内客户群体发生特定行为的次数及频繁程度。浏览量(PV)访问数平均访问深度跳失次数:用户点开页面后直接关闭的行为,值越大说明店铺越不吸引用户。跳失率:跳失次数/访问数其他:跳转次数、停留时长、访问间隔、搜索量、评论量、分享量、点击量、收藏量、付费转化率、退货率、退货量。 客户价值类指标。分为客户收入类指标和客户成本类指标。客户收入类指标客单价:客户单笔消费时贡献的
场景指标通用指标可以在多个不同场景下使用,场景指标是在特定场景下使用。如库销比在进销存业务场景。客户分析类指标客户生命周期类指标分为新增类、留存类、流失类新增类新增客户数量类指标:新增注册会员数新增访客数,访客数(UV)新增到店数新增下载用户数 新增客户质量类指标:新增活跃用户数新增活跃用户数占比新增注册用户数新增注册用户数占比新增付费用户数新增付费用户数占比其他:新增VIP注册客户数、
基准比计算方法各个不同维度项下的汇总值和某个基准值之间的比较。基准值:一个公认的可以衡量此类汇总值的数值。如考试几个成绩60分等。用于描述各个维度项的表现水平与基准值的差异程度。进行分类,了解各个维度项的表现水平的好坏程度。在基准值以上表现水平越往上越好。例如考试分数总分100分,那么在1至100以内有各种值,这些值是连续的,不利于理解。此时采用了类似于分箱的办法,把数据归类到某个区间来衡量。基准
第六章 业务分析方法业务分析方法有三个部分:业务指标分析、业务模型分析、业务分析方法论。业务指标分析是业务分析方法的核心内容。主要有指标计算方法、场景指标、指标体系。指标是是某种观测或行为的数值量化方法。指标值是具体量化计算后得到的数值结果。从数据透视计算方法的角度理解指标和指标值,针对表结构数据计算逻辑而言:指标=度量+汇总计算规则。指标值=维度项+度量+汇总计算规则。通用指标计算方法求和类指标
1. 主表提供数据范围,在一对多的对应关系下,使用单项筛选器进行汇总计算时,应遵循:“一表出维度字段是附表,多表出度量字段是主表,一表筛选多表”。一对一:应当是逻辑上的一对一,而非当前数据是一对一。多对多: 尽量避免。可能出现度量值重复计算的可能。2. &n
商业智能报表:BI报表。ETL:全称 Extract-Transform-Load,即提取(extract)、转换(transform)、加载(load)。 E是第一步对源数据进行抽取,源数据主要来源于业务系统、文件数据、第三方数据。T是第二步,对数据进行适当处理,目的是为了下一步的加载。主要是筛选(有价值数据)、清理(异常数据)、转换(如时间、数字、小数等)、缺失值填充、默认值设定、枚举值映射、
Copyright © 2005-2025 51CTO.COM 版权所有 京ICP证060544号