假设检验

总体均值是否有显著性差异

引例

可以通过样本均值来推断总体均值,(总体样本量太大),通过统计方法

假设检验流程

功能:

总体均值相等的检验

前提:

总体服从正态分布

步骤:

  • 总体方差是否相等
  • 原假设,备择假设
  • 总体均值是否相等
  • 原假设,备择假设

依据:

小概率原理(0.05)(高精度——0.01)

方差分析

引例

  • 均衡数据
  • 非均衡数据

方差分析流程

数据格式

功能

总体均值相等的检验

前提

  • 来自正态总体
  • 方差相同

步骤

  • 提出原假设,个体均值相等——不全相等
  • 构造F统计量
  • 计算统计量的值与临界值比较并下结论

依据

小概率原理(0.05)

一元线性回归

一元回归模型

一元线性回归模型y = ax + b

  • 回归系数(x)
  • 常数项,截距项(intercept)
F检验:回归方程显著性检验,同时检验
  • 目的
    检验y与解释变量x之间的线性关系是否显著
  • 步骤
  • 提出原假设H0——备择假设H1_a,b不全为0
  • 构造F统计量
  • 计算统计量的值与临界值比较并下结论
t检验:回归系数显著性检验
  • 目的 : 分别检验y与每个解释变量之间的线性关系是否显著
  • 步骤:
  • 提出原假设H0——备择假设H1_a,b不全为0
  • 构造t统计量
  • 计算统计量的值与临界值比较并下结论
R^2检验:拟合优度的检验

意义:判断系数(R^2)越大,解释变量对因变量的解释程度越高,解释变量引起的变动占总变动的百分比越高,观察点在回归直线附近越密集

模型的改进->去除截距项

model y = x ; -> model y = x / noint ;

画图

散点图

data ex;
do x = 0 to 100 by 10; /*一步长10取样本点*/
y = sin(x);
z = exp(x / 50);
output;
end;
proc plot; /* 文本格式画图  */
plot y*x='*' z*x='o'/overlay;  /* 样本点分别以*与o表示,同一张图  */
run;

曲线

data ex;
do x = 0 to 100 by 10; /*一步长10取样本点*/
y = sin(x);
z = exp(x / 50);
output;
end;
proc gplot; /* 图片格式画图  */
plot y*x z*x/overlay;  /* 样本点分别以*与o表示,同一张图  */
symbol i = join;   /* 点连线(rl)  */
run;

曲面

data ex ;
do x= -5 to 5 by 0.2;
do y= -5 to 5 by 0.2;
z = x*x + y*y;
output;end;end;
proc g3d;   /* graph窗口的三维  */
plot y*x = z;
run;

频率直方图

data ex;
input x@@;
cards;
70 49 37 28 45 58 60 69 47 36 25 47 69 70 47
;
proc gchart;
vbar x/type = pct; /* vbar表示纵向直方图,type = pct表示图高为频率 */
run;

三维直方图

data ex;
input lei$ x@@;
cards;
a 70 a 49 a 37 a 28 a 45 b 58 b 60 b 69 b 47 b 36 b 25 b 47 b 69 b 70 b 47
;
proc gchart;
block lei; /*  三维直方图*/
run;

symbol i=join v=diomand;
表示画折线,空心菱形