数据挖掘和数据分析核心就是用科学的手段验证两个东西,就是a和b之前是否存在相关性以及因果性。很多报告、甚至研究都只发现了相关性,利用相关性系数就能得出;还要用假设检验来得出因果性关系才算完整。
1.分析背景
数据集背景介绍
- 政策:2011年11月,中国各地全面实施双独二孩政策;2013年12月,中国实施单独二孩政策;2015年10月,十八届五中全会公报提出实施全面二孩政策。
- 技术:自2012年起,母婴APP陆续上线,线上交易活跃,但是渗透率不高
- 经济:从2014年起,中国母婴线上交易规模增长率超过整体网购增长率,进入飞跃式发展阶段。母婴行业的市场规模从2012年的12565亿到2015年的19166亿。
- 社会:“三聚氰胺”事件过后,母婴产品的购买主要注重于质量和品牌,育儿成本逐年升高,行业发展成稳定增长趋势
数据集字段解释
表1购买商品(sample)sam_tianchi_mum_baby_trade_history.csv)
- user_id:用户id
- auction_id:物品编号(item_id)
- cat_id: 商品种类ID(商品二级分类,表示商品属于哪个类别)
- cat1: 商品种类ID(商品一级分类,表示商品属于哪个类别)
- property:商品属性(属性值可以是大小,可以是尺码、毫升等数字,还可以指品牌等,一切可以描述商品特征的都可以称为属性值)
- buy_mount:购买数量
- day:购买时间(是个时间戳格式,可以通过excel将时间戳显示未日期格式)
表2婴儿信息表字段
- user_id:用户id
- birthday:出生日期
- gender:性别(0女性;1男性;2未知的性别
2.分析目的
了解产品的销售情况,有利于对不同的人群、不同的商品开展销售运营活动。
3.分析思路
4.分析内容
销售情况与年份的关系
随着店铺运营时间的增长,销售总体呈增长趋势。
总体而言,下半年度的购买率普遍较好,商家可以在上半年借鉴下半年的运营方式。上半年适当减少库存,下半年适当增加库存。
销售情况与日期的关系
某些日期的销量特别好,报表仔细分析,有5单是一次性购买1000数量的特殊情况。分别是117730165 173701616 1945590674 32141414,这些用户可以给他们提供实时反馈,增进他们对品牌的认可。
除开了一次性购买100数量以上的情况,可以看出双十一、双十二活动确实加大了购买的情况。其余时间段也主要在下半年。
其次是5月,有多次购买高峰,主要有母亲节和520促销,刺激消费
销售情况与不同类别的关系
商品28为热销产品,商品12265008为差销产品。
可以收集更多的资料,了解28畅销的原因是质量优良/符合买家需求/活动推广良好,看可否适用于12265008的推广,适当分析差销产品的原因是质量?不符合买家需求?推广不够等
用户购买总量与年龄的关系
用户购买总量与性别的关系
根据购买总量与性别来看,女婴所需的购买量较大
用户购买类别与年龄的关系
据图可知,主要的购买用户层在0-3岁,细分年龄可知0岁到1岁的购买率最高,后面依次降低
用户购买类别与性别的关系
对于50008168类别的商品,男性的购买率大于女性,仔细了解客户需求,在此类商品上对男行婴儿进行大力度的推广
其他商品均是女婴的消费较高。
5.结论
- 商品销量主要是针对0-3岁的婴儿
- 每年的1,2月份销量较少,而5月和11月销量高峰
- 有女性婴儿的购买率较高
- 商品复购率较低
6.建议
- 商品销量主要是0-3岁的婴儿,主要在用户推广上主推这类年龄段的婴儿产品。丰富0-3岁孩子适用的婴幼儿的产品,创造更多消费的机会。
2.每年的1,2月份销量较少,加大相应的推广促销活动,并且适当控制购入的产品的数量。
3.加大对商品类别28的宣传和供应。
4.婴儿产品的复购率很低,从产品,客户售前售后服务,退货政策,广告推广等维度去分析原因。
5.在不畅销的时候,运用畅销时期的运营方案带动整体销量。
6.可以运用购买畅销产品送不畅销产品的方式,带动不畅销产品的发展。