上次,我们给大家讲述了一些数据分析师面试的必备技巧,本期我们主要给大家盘点数据分析师笔试题(当然,即便是笔试用不到,面试也可以用得到哈),希望当遇到这类典型题目时,大家可以轻松应对。
盘点数据分析师笔试题 你会做几道?
1、不用任何公开参考资料,估算今年新生儿出生数量。
关于类题目,在作答前,我们应该去分解思考会涉及到哪些内容,并通过总结性思维,将你联想到的内容加以描述。
首先,我们应该知道这是在考查费米估计问题,所以我们可以采用两层模型(人群画像x人群转化):新生儿出生数=Σ各年龄层育龄女性数量*各年龄层生育比率。来作为回答的主线。
然后,先从数字到数字:如果有前几年新生儿出生数量数据,建立时间序列模型进行预测(PS:这里还需要考虑到二胎放开的突变事件)。
接着,找出先兆指标。如:婴儿类用品的新增活跃用户数量X表示新生儿家庭用户。Xn/新生儿n为该年新生儿家庭用户的转化率,如X2007/新生儿2007为2007年新生儿家庭用户的转化率。当然,该转化率会随平台发展而发展,我们可以根据往年数量,推出今年的大致转化率。
最后,我们可以通过今年大致的转化率,并根据今年新增新生儿家庭用户数量,推出今年估计的新生儿数量。
2、什么是PCA?PCA为什么要中心化?它的主成分是什么?
在统计学中,主成分分析(PCA)是一种简化数据集的技术。它是一个线性变换。这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。
主成分分析的原理,是设法将原来变量重新组合成一组新的相互无关的几个综合变量,同时根据实际需要,从中可以取出几个较少的综合变量,尽可能多地反映原来变量信息。这种统计方法叫做主成分分析,或称主分量分析。它也是数学上处理降维的一种方法。
主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的、互相无关的、综合的指标,来代替原来的指标。通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。
最经典的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Va(rF1)越大,表示F1包含的信息越多。因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现再F2中,用数学语言表达就是要求Cov(F1,F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,……,第P个主成分。
另外,主成分分析经常用减少数据集的维数,同时保持数据集的对方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面。但是,这也不是一定的,要视具体应用而定。
3、如何计算出头条广告的广告收益?(无需计算,给出作答思路即可。)
首先,我们要知道:收益 = 出价x流量x点击率x有效转化率。
那么,显而易见,广告投放的数量,会在一定程度上拉升流量,同时也会造成匹配程度的降低,从而影响因点击率。
由此观之,最大收益是找到这个乘积的最大值,同时,还需考虑有约束条件下的最优化问题。另外,我们还可以参考价格歧视方案,对不同的用户,投放不同数量的广告。
4、关于次日用户留存率降低,我们应该怎么分析?
首先,我们要采用“两层模型”分析法来作答。通过对用户进行新老、渠道、活动、画像等多个维度的细分,然后分别计算出每个维度下不同用户的次日留存率。通过数据,定位到导致留存率下降的,是哪个群体。
当然,对于用户留存率下降问题,我们还应具体情况具体分析。你还可以通过“内部-外部”因素,来分析这个问题。
1)内部因素:包括获客(渠道质量低、活动获取非目标用户)、满足需求(新功能改动引发某类用户不满)、提活手段(签到等提活手段没达成目标、产品自然使用周期低导致上次获得的大量用户短期内不需要再使用等);
2)外部因素:包括宏观经济环境(可采用PEST分析法)、政治(政策影响)、经济(短期内主要是竞争环境,如对竞争对手的活动)、社会(舆论压力、用户生活方式变化、消费心理变化、价值观变化等偏好变化)、技术(创新解决方案的出现、分销渠道变化等)。
5、在销售大豆时,如何做可以提升收益?价格提升至什么水平,收益最大?
我们都知道,收益 = 单价*销售量。因此,在回答这道题目时,我们应该从提高单位溢价,或者提高销售规模这两个方向着手。
>>提高单位溢价:
1)如果前期营销资金充足,我们可以通过打造品牌,从而获得长期溢价能力;
2)如果前期资金不足,我们还可以通过增加产品的附加值来提高溢价。比如,增加商品加工环节,将大豆做成豆奶粉、豆浆、豆干、大豆蛋白粉等;或者重新定位商品,将商品礼品化,打造有机大豆等产品形象。
>>提高销售规模:
我们都知道,销售量=流量x转化率。如果我们通过上述提高单位溢价的方法,从而增加商品的收益,在对流量产生影响的同时,也会对转化率产生影响。
因此,在销售过程中,我们还可以通过价格歧视,根据客户对商品的敏感度,采用不同定价的方法,来提升销售规模,以达到增加收益的目的。
当然,为了促销,我们还应该控制价格歧视的时间、投放的数量、价格定档策略等。比如,不同时间段、不同商圈的大豆价格不同,采取高定价,然后对价格敏感的用户提供优惠券等方式,充分发挥价格歧视的优势,从而达到收益最大化。
写在最后
小编盘点的这些数据分析师笔试题也许你在面试中,不一定能碰到这些题目,但一定会有运用相同思路,去分析其他问题的可能。因此,希望大家能够提前做好准备,将笔试部分稳稳拿下,为后续面试做好铺垫。