用户画像代码实现 java 用户画像的开发_数据


本文摘自赵宏田老师的:“用户画像:方法论与工程化解决方案”。

用户画像项目建设流程,主要分为以下几个阶段:

第一阶段:目标解读

在建立用户画像之前,首先需要明确的是,用户画像服务于企业的对象,再根据业务方需求,明确未来产品建设目标和用户画像分析之后的预期效果。

一般而言,用户画像的服务对象,包括运营人员和数据分析人员。不同的业务方,对用户画像的需求侧重点也不一样。就运营分析人员来说,他们需要分析用户特征、定位用户行为偏好,做商品或内容的个性化推送,以提高点击转化率,所以画像的侧重点就落在用户的个人行为偏好上;就数据分析人员来说,他们需要分析用户行为特征,做好用户的流失预警工作,还可以根据用户的消费偏好,做更有针对性的精准营销。

第二阶段:任务分解与需求调研

经过第一阶段的需求调研和目标解读,我们已经明确了用户画像的服务对象和应用场景。接下来,需要针对服务对象的需求侧重点,结合现有的业务体系和“数据字典”规约实体和标签之间的关联关系,明确分析纬度。就一般案例而言,需要从用户属性画像、用户行为画像、用户偏好画像、用户群体偏好画像等角度进行建模。

第三阶段:需求场景讨论与明确

在本阶段,数据运营人员需要根据与需求方的沟通结果,输出用户画像需求文档,在该文档中,明确画像应用场景、最终开发的标签内容与应用方式,并就该文档与需求方反复沟通确认。

第四阶段:应用场景与数据口径确认

经过第三阶段,明确了需求场景与最终实现的标签纬度、标签类型后,数据运营人员需要结合业务和数据仓库中已有的数据表,明确与各个场景相关的数据口径。在该阶段中,数据运营方需要输出用户画像开发文档,该文档需要明确应用场景、标签开发的模型、涉及的数据库与表以及应用实施流程。该文档不需要再与运营方讨论,只需面向数据运营团队内部,就开发实施流程达成一直即可。

第五阶段:特征选取与模型数据落表

在本阶段中,数据分析挖掘人员需要根据前面明确的需求场景进行业务建模,写好HQL逻辑,将相应的模型逻辑写入临时表中,并抽取数据校验是否符合业务场景需求。

第六阶段:线下模型数据验收与测试

数据仓库的人员将相关数据落表后,设置定时调度任务,定期增量更新数据。数据运营人员需要验收数据仓库加工的HQL逻辑是否符合需求,根据业务需求抽取表中的数据,查看其是否在合理的范围内,如果发现问题,要及时反馈给数据仓库人员,让其调整代码逻辑或行为权重的数值,使数据符合要求。

第七阶段:线上模型发布与效果追踪

经过第六阶段,数据通过验收后,会通过Git进行版本管理,部署上线。上线后,通过持续跟踪标签应用效果及业务反馈,调整优化模型及相关权重配置。