1.五月份的商品销售额为60万元,该月的季节指数为120%,则消除季节因素影响后,该月的商品销售额为( )万元
答案:消除季节因素影响后,商品销售额=该月商品实际销售额/该月季节指数=60/120%=50(万元)
季节变动指数,简称季节指数,它是预测目标季节或某月受季节变动因素影响发生变动的比例。
季节指数的计算公式为:季节指数(%)= (历年同季平均数/趋势值)*100%
例如
商品销售量一季度的季节指数S=112.5%,意味着春季销售量比全年季度平均销售量高12.5%。
2.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有( )个变量
答案:2个变量,企业&年利润额
标志、指标
标志是说明总体单位属性和特征的名称。可分为品质标志和数量标志,品质标志只能用文字进行描述,数量标志只能用数字进行描述。
指标是说明总体属性和特征的名称。按总体数量特点和计算方法不同,可分为数量指标和质量指标,数量指标是说明总体规模大小和数量多少的指标,质量指标是说明总体内部数量对比关系和一般水平的指标,两者可通过数值是否需要相除求商来得到进行判断。按数值表现形式,可分为总量指标、相对指标、平均指标。
变量
变量是说明现象某种属性和特征的名称。可分为品质变量和数值变量。
品质变量就是品质标志,数量变量包括数量标志和指标,数量变量可以分为连续变量和离散变量。
连续变量的数值通过连续登记取得,数值表现为无穷小数;
离散变量的数值通过间断登记取得,数值表现为整数。
3.周末超市的营销额常常会高于平常,这种波动属于
A.长期趋势
B.循环变动
C.季节变动
D.不规则变动
答案:C
季节变动也称季节性,它是时间序列在一年或更短的时间内重复出现的周期性波动。季节性中的“季节”一词是广义的,它不仅仅是指一年中的四季,其实是指任何一种短期内周期性的变化。
这里补充,时间序列的影响因素:长期趋势、季节变动、循环变动、不规则变动
4.一名研究人员希望用图形说明5月份以来我国每天新增甲型流感确诊病例数的变化趋势,你认为适合的图形是
答案:线图
5.某种股票原价格为a元,连续两天上涨,每次涨幅10%,则该股票两天后的价格为
A. 1.21a元
B. 1.1a元
C. 1.2a元
D. (0.2+a) 元
答案:两天后的价格为
6.下面的例子可以用Paired-Samples T Test过程进行分析的是
A.家庭主妇和女大学生对同种商品喜好的差异
B.复用某种药物前后病情的改变情况
C.复用药物和没有复用药物的病人身体状况的差异
D.性别和年龄对雇员薪水的影响
答案:B
参考:T检验分析思路完整总结,让你条理清晰完成分析 T检验可以分为三种,分别是单样本T检验、配对样本T检验、独立样本T检验。它们本质上都是对比均值,但在不同的分析场景应选择不同的T检验,具体的分类如下:
单一样本T检验(One-Sample T Test)
用于比较一个正态总体在方差未知时总体均值与某一已知数是否有显著性差异。这里的单一样本是指只有一个样本总体。
独立样本T检验(Independent-Samples T Test)
用于检验两个独立样本是否来自具有相同均值的总体,本质是对两个样本均值之差进行T检验。
配对样本T检验(Paired-Samples T Test)
用于检验两个配对总体的均值是否存在显著性差异。这里的配对是指,这两个样本值之间是一一对应的,样本容量相同。
配对T检验与独立T检验区别
两者的主要区别在于:配对样本t检验需要两组样本数相等,且要求每对配对数据之间要有一定的对应关系,而独立样本t检验两组数据的样本个数可以不等。
7.用One-Way ANOVA进行大、中、小城市16岁男性青年平均身高的比较,结果给出sig.=0,043,说明
A.按照0.05显著性水平,拒绝,说明三种城市的平均身高有差别
B.三种城市身高没有差别的可能性是0.043
C.三种城市身高有差别的可能性是0.043
D.说明城市不是身高的一个影响因素
答案:A,此题考查单因素方差分析,给出的sig.=0.043,即 值,那么在给定的显著性水平为0.05时,
,根据
单因素方差分析(one-way ANOVA)也称为F检验,是通过对数据变异的分析来推断两个或多个样本均数所代表的总体均数是否有差别的一种统计推断方法。简单的来说,就是用来检验同一个影响因素的不同水平对因量是否有影响的一种方法。
比如说
超市的营业额受多种因素的影响,比如超市的促销方式、超市的地理位置、超市的规模大小…等等
单因素方差分析研究的是一个分类型自变量对一个数值型因变量的影响,比如这里研究促销方式对超市营业额的影响,促销方式是一个影响因素,它包括多种不同水平,如降价销售、打折销售、买一送一、有奖式促销、…
下面就是探究促销方式这个影响因素的不同水平对营业额这个因变量的影响是否有差别。
首先提出假设问题,一般假设为
如果拒绝 ,则说明促销方式因素的各水平的效应之间有显著的差异。
通常,将上述检验写成如下形式
其次,单因素方差分析(One-way Anova)与T检验的用途很类似,更多需要参考SPSS单因素方差分析(One-way Anova)
8.用最小平方法给时间数列配合直线趋势方程y=a+bt,当b<0时,说明现象的发展趋势是?
A.上升趋势
B.下降趋势
C.水平态势
D.不能确定
答案:B
一元一次方程,变量系数小于零单调递减。
9.已知甲、乙两班学生统计学考试成绩:甲班平均分为70分,标准差为7.5分;乙班平均分为75分,标准差为7.5分。由此可知两个班考试成绩的离散程度
A.甲班较大
B.乙班较大
C.两班相同
D.无法作比较
答案:A
此题考查离散系数(平均数代表集中趋势,标准差代表离散趋势)
离散系数又称变异系数,是统计学当中的常用统计指标,主要用于比较不同水平的变量数列的离散程度及平均数的代表性。
离散系数是衡量资料中各观测值离散程度的一个统计量。当进行两个或多个资料离散程度的比较时,
- 如果度量单位与平均数相同,可以直接利用标准差来比较
- 如果单位和(或)平均数不同时,比较其离散程度就不能采用标准差,而需采用标准差与平均数的比值(相对值)来比较
常用的离散系数指标有:全距(极差)系数R、四分位数差IQR,平均差系数AR、方差系数和标准差系数等。
常用的是标准差系数,标准差系数将简单标准差及加权标准差分别除以相应的平均数,用以反映变量值离差的相对水平,它的计量单位为百分比。
其计算公式为:
式中,为标准差系数,
为简单标准差或加权标准差,
为平均数
10.某地区今年和去年相比商品零售价格提高12%,则用同样多的货币今年比去年少购买( )的商品
A.10.71%
B.21.95%
C.12%
D.13.64%
答案:A
假设去年 1 块钱买 5 斤糖,那么去年一斤糖的价格为 0.2元/斤
今年和去年相比商品零售价格提高12%,所以今年一斤糖的价格为 0.2*1.12=0.224 元/斤
所以用同样多的货币今年比去年少购买
11.置信概率表达了区间估计的
A.精准性
B.可靠性
C.显著性
D.规范性
答案:B
12.AARRR模型分别对应用户生命周期中的每个阶段。以下不属于某个阶段的是
A.Activation
B.Revenue
C.Requirement
D.Acquisition
答案:C
AARRR是Acquisition、Activation、Retention、Revenue、Referral,五个单词的缩写,分别对应用户生命周期中的五个阶段。
- 用户获取(Acquisition)
- 用户激活(Activation)
- 用户留存(Retention)
- 获得收益(Revenue)
- 推荐传播(Referral)
13.下面哪一项是属于用户自主访问流量?
A.通过淘宝搜索来的流量
B.用户从自己的购物车,收藏夹里来的流量
C.通过一套搜索来的流量
D.从商城首页来的流量
答案:B
参考:淘宝直接访问的流量是什么?自主访问是什么流量? 自主访问(主要来源有:直接访问、店铺收藏、产品收藏、购物车、我的淘宝):是指访客自发地主动访问您的店铺,就是这种直接访问的手段。直接访问:访客直接在浏览器里输入您店铺的链接或者通过浏览器收藏夹里您店铺的链接而进入您店铺
自主访问流量是指:访客通过以下渠道进入您店铺的流量为自主访问流量:宝贝收藏、直接访问、我的淘宝首页、购物车、店铺收藏、已买到商品。
题目中A是搜索来的,当然不能算自主访问的,C一套搜索来的,同理,D,商城首页也是靠搜索或类目来的。
14.以下哪个指标,是指只访问了入口页面(例如网站首页)就离开的访问量与所产生总访问量的百分比
A.页面转化率
B.页面二跳率
C.页面点击率
D.页面跳出率
答案:D
转化率指在一个统计周期内,完成转化行为的次数占推广信息总点击次数的比率。计算公式为:转化率=(转化次数/点击量)×100%。例如:/10名用户看到某个搜索推广的结果,其中5名用户点击了某一推广结果并被跳转到目标URL上,之后,其中2名用户有了后续转化的行为。那么,这条推广结果的转化率就是(2/5)×100%=40%。
转化率=转化次数/访问次数。对竞价而言,是关键词和访问页面的精准的指标。转化率可以用来衡量网络营销的效果。如果我们在A、B两个网站同时投放了广告,A网站每天能带来100次用户访问,但是只有1个转化,B网站每天能带来10次用户访问,但是却有5个转化。这就说明B网站带来的转化率更高,用户更加精准,网络营销效果更好。
页面二跳率:当网站页面展开后,用户在页面上产生的首次点击被称为“二跳”,二跳的次数即为“二跳量”。二跳量与到达量(进入网站的人)的比值称为页面的二跳率
页面跳出率:跳出率是指当网站页面展开后,用户仅浏览了该页面就离开该网站的比例。即指在只访问了入口页面(例如网站首页)就离开的访问量与所产生总访问量的百分比。跳出率越低说明流量质量越好,用户对网站的内容越感兴趣
跳出率计算公式:跳出率=访问一个页面后离开网站的次数/总访问次数
页面退出率:退出率是指从该页面离开网站的次数占该网页总浏览次数的比例。
访问率是有多少不同的人参观访问一个网站查看广告以及这些人们成为一个广告瞄准的对象的百分比。
点击率是指网站页面上某一内容被点击的次数与被显示次数之比,即clicks/views,它是一个百分比。反映了网页上某一内容的受关注程度,经常用来衡量广告的吸引程度。
15.订单表tbl_table
用户表 tbl_user
(1)2020年第一季度(1-3月),全国整体业务同比下滑最大三个城市是哪几个?(用sql实现计算逻辑)
select distinct city
from
(
select b.city,
sum(case when a.orderdate between '2020-01-01' and '2020-03-31' then a.salesamount else 0 end) as sum_1,
sum(case when a.orderdate between '2019-01-01' and '2019-03-31' then a.salesamount else 0 end) as sum_0
from tbl_table a left join tbl_user b
on a.userid = b.userid
)
order by (sum_1-sum_0)/sum_0
limit 3
(2) 公司希望各条业务线完成双十一100%的订单增长目标,帮助供应链团队计算下2020年双十一当天各省不同轮胎需要备多少库存(用sql实现轮胎条数计算的逻辑)
-- 双十一100%的订单增长 :2020各省轮胎数 = 2019 各省轮胎数* 2 。
-- 由于没有具体的销量,只能用订单数代替销量.
selet
b.Province
,(count a.orderid ) *2 as luntai_predicted_value
from tbl_table a
left join tbl_user b on a.userid=b.userid
group by b.Province
having a.orderdata = '2019-11-11' and a.catagory = 轮胎
// 这里认为各省轮胎的ID都相同
(3)查询2020年上半年(1-6月),上海地区销售额排名前10的商品ID。需要的字段:商品ID
select
o.pid, SUM(o.salesamount)
from tbl_table a left join tbl_user b
where
a.orderdate BETWEEN '2020/01/01' AND '2020/06/30'
AND b.City like '%上海市%'
group by a.pid
order by SUM(salesamount) desc
limit 10;
(4)查询2020年7月所有订单中,有且仅有轮胎和保养两个品类的订单数
SELECT pid, COUNT(*)
FROM tbl_order
WHERE category NOT IN ('车品','美容')and orderdate between '2017/7/1 00:00' and '2017/7/31 23:59'
GROUP BY pid