- 何为企业画像
企业画像是一种标签体系方法,标签是某一种企业特征的符号表示,标签体系主要包括2种方式一是化整为零其方法就是每个标签都规定了我们观察、认识和描述企业的一个角度,二是化零为整,主要实现方法是企业画像是一个整体,各个维度不独立,标签之间有联系最终实现用标签的集合来实现企业画像。
整个企业画像(UserProfile)项目中,数据、业务及技术流程图如下所示
- 企业360°度画像
企业360°画像的报告范围涉及企业相关的工商信息、无形资产、经营状况、法院信息、环保信息、税务信息、金融监管信息、海关信息、食药监信息、上市公司信息、舆情数据,可以提供目标企业的信用记录信用报告,支持企业授信业务决策。
- “企业360°画像"的四个功能
1:授信额度判定分析
银行、证券、基金等金融机构在信用贷款前,辅助授信额度判定;
2:风险动态管理分析
银行、证券、基金等金融机构在信用贷款过程中,对于企业的风险变更,进行实时动态管理;
3:信贷风险监控分析
监控贷后企业经营、财务、还款能力以及行业情况等多方面信息;协助银行了解贷款企业的信贷风险程度;降低次级、可疑和损失等不良贷款的发生;
4:企业360°画像辅助信贷决策
根据信贷分析结果,为用户提供目标企业的信用记录和信用报告,为企业授信业务提供决策支持。
- 企业画像构建的相关技术
企业画像的方法进行总结归纳,发现用户画像的构建一般可以分为目标分析、体系构建、画像建立三步。画像构建中用到的技术有数据统计、机器学习和自然语言处理技术(NLP)等,下如图所示。具体的画像构建方法学长会在后面的部分详细介绍。
按照数据流处理阶段划分企业画像建模的过程,分为三个层,每一层次,都需要打上不同的标签。
数据层:用户消费行为的标签。打上事实标签,作为数据客观的记录
算法层:透过行为算出的用户建模。打上模型标签,作为用户画像的分类
业务层:指的是获客、粘客、留客的手段。打上预测标签,作为业务关联的结果
- 标签体系
构建标签体系,目前主流的标签体系都是层次化的,首先标签分为几个大类,每个大类下进行逐层细分。在构建标签时,我们只需要构建最下层的标签,就能够映射到上面两级标签。上层标签都是抽象的标签集合,一般没有实用意义,只有统计意义。
- RFM模型
银行当然还有以下这些问题都是需要考虑的:
1.谁是我的最佳客户?
2.谁即将要成为流失客户?
3.谁将有潜力成为有价值的客户
4.哪些客户能够留存?
5.哪些客户会对你目前对活动有所反应?
那么最终的问题是如何对客户进行分群,即如何建立客户的价值模型呢?
1、什么是RFM模型
在传统企业和电商众多的客户细分模型中,RFM模型是被广泛提到和使用的。
RFM模型是衡量当前用户价值和客户潜在价值的重要工具和手段。
RFM是Rencency(最近一次消费),Frequency(消费频率)、Monetary(消费金额),三个指标首字母组合,如图所示:
1.1 R值:最近一次消费(Recency)
消费指的是客户在店铺消费最近一次和上一次的时间间隔,理论上R值越小的客户是价值越高的客户,即对店铺的回购几次最有可能产生回应。目前网购便利,顾客已经有了更多的购买选择和更低的购买成本,去除地域的限制因素,客户非常容易流失,因此CRM操盘手想要提高回购率和留存率,需要时刻警惕R值。
1、客户R值呈规律性的“波浪形”分布,时间越长,波浪越小;
2、最近一年内用户占比50%(真的很巧);
数据分析:这个数据根据向行业内专业人员请教,已经是比较理想了的。说明每引入2个客户,就有一位用户在持续购买。说明店铺复购做的比较好。
1.2 F值:消费频率(Frequency)
消费频率是客户在固定时间内的购买次数(一般是1年)。但是如果实操中实际店铺由于受品类宽度的原因,比如卖3C产品,耐用品等即使是忠实粉丝用户也很难在1年内购买多次。所以,有些店铺在运营RFM模型时,会把F值的时间范围去掉,替换成累计购买次数。
1、购买1次(新客户)占比为65.5%,产生重复购买(老客户)的占比为34.4%。
2、购买3次及以上(成熟客户)的占比为17%,购买5次及以上(忠实客户)的占比为6%;
数据分析:影响复购的核心因素是商品,因此复购不适合做跨类目比较。比如食品类目和美妆类目:食品是属于“半标品”,产品的标品化程度越高,客户背叛的难度就越小,越难形成忠实用户;但是相对美妆,食品又属于易耗品,消耗周期短,购买频率高,相对容易产生重复购买,因此跨类目复购并不具有可比性。
1.3 M值:消费金额(Monetary)
M值是RFM模型中相对于R值和F值最难使用,但最具有价值的指标。大家熟知的“二八定律”(又名“帕雷托法则”)曾作出过这样的解释:公司80%的收入来自于20%的用户。
这个数据我在自己所从事的公司总都得到过验证!可能有些店铺不会那么精确,一般也会在30%客户贡献70%收入,或者40%贡献60%收入。
理论上M值和F值是一样的,都带有时间范围,指的是一段时间(通常是1年)内的消费金额,在工作中我认为对于一般店铺的类目而言,产品的价格带都是比较单一的,比如:同一品牌美妆类,价格浮动范围基本在某个特定消费群的可接受范围内,加上单一品类购买频次不高,所以对于一般店铺而言,M值对客户细分的作用相对较弱。
2、 基于RFM模型的实践应用
主要有两种方法来分析RFM模型的结果:用基于RFM模型的划分标准来进行客户细分,用基于RFM模型的客户评分来进行客户细分。
2.1 基于RFM模型进行客户细分
CRM实操时可以选择RFM模型中的1-3个指标进行客户细分,如下表所示。切记细分指标需要在自己可操控的合理范围内,并非越多越好,一旦用户细分群组过多,一来会给自己的营销方案执行带来较大的难度,而来可能会遗漏用户群或者对同个用户造成多次打扰。
2.2 通过RFM模型评分后输出目标用户
除了直接用RFM模型对用户进行分组之外,还有一种常见的方法是利用RFM模型的三个属性对客户进行打分,通过打分确定每个用户的质量,最终筛选出自己的目标用户。
RFM模型评分主要有三个部分:
1、确定RFM三个指标的分段和每个分段的分值;
2、计算每个客户RFM三个指标的得分;
3、计算每个客户的总得分,并且根据总得分筛选出优质的客户
- KMeans聚类算法
1、算法原理
在正式开始之前,我们可以先通过几个网址来感受一下KMeans的魅力。
首先是 http://shabal.in/visuals/kmeans/3.html,我们可以通过刷新页面多次,来观察不同的KMeans聚类过程。下图是我把四次不同的结果合并在一起的一个结果。
通过观察,我们可以得到初步结论:
中心点数量4, 起始位置不相同。
中心点可以移动
中心点最后不移动
2.在企业画像中的应用
根据RFM模型,就可以统计在某一段时间内,用户最近的消费间隔,消费次数和消费金额,再根据使用 k-means 算法对用户进行聚类分群。