假设检验
总体均值是否有显著性差异
引例
可以通过样本均值来推断总体均值,(总体样本量太大),通过统计方法
假设检验流程
功能:
总体均值相等的检验
前提:
总体服从正态分布
步骤:
- 总体方差是否相等
- 原假设,备择假设
- 总体均值是否相等
- 原假设,备择假设
依据:
小概率原理(0.05)(高精度——0.01)
方差分析
引例
- 均衡数据
- 非均衡数据
方差分析流程
数据格式
功能
总体均值相等的检验
前提
- 来自正态总体
- 方差相同
步骤
- 提出原假设,个体均值相等——不全相等
- 构造F统计量
- 计算统计量的值与临界值比较并下结论
依据
小概率原理(0.05)
一元线性回归
一元回归模型
一元线性回归模型y = ax + b
- 回归系数(x)
- 常数项,截距项(intercept)
F检验:回归方程显著性检验,同时检验
- 目的
检验y与解释变量x之间的线性关系是否显著 - 步骤
- 提出原假设H0——备择假设H1_a,b不全为0
- 构造F统计量
- 计算统计量的值与临界值比较并下结论
t检验:回归系数显著性检验
- 目的 : 分别检验y与每个解释变量之间的线性关系是否显著
- 步骤:
- 提出原假设H0——备择假设H1_a,b不全为0
- 构造t统计量
- 计算统计量的值与临界值比较并下结论
R^2检验:拟合优度的检验
意义:判断系数(R^2)越大,解释变量对因变量的解释程度越高,解释变量引起的变动占总变动的百分比越高,观察点在回归直线附近越密集
模型的改进->去除截距项
model y = x ; -> model y = x / noint ;
画图
散点图
data ex;
do x = 0 to 100 by 10; /*一步长10取样本点*/
y = sin(x);
z = exp(x / 50);
output;
end;
proc plot; /* 文本格式画图 */
plot y*x='*' z*x='o'/overlay; /* 样本点分别以*与o表示,同一张图 */
run;
曲线
data ex;
do x = 0 to 100 by 10; /*一步长10取样本点*/
y = sin(x);
z = exp(x / 50);
output;
end;
proc gplot; /* 图片格式画图 */
plot y*x z*x/overlay; /* 样本点分别以*与o表示,同一张图 */
symbol i = join; /* 点连线(rl) */
run;
曲面
data ex ;
do x= -5 to 5 by 0.2;
do y= -5 to 5 by 0.2;
z = x*x + y*y;
output;end;end;
proc g3d; /* graph窗口的三维 */
plot y*x = z;
run;
频率直方图
data ex;
input x@@;
cards;
70 49 37 28 45 58 60 69 47 36 25 47 69 70 47
;
proc gchart;
vbar x/type = pct; /* vbar表示纵向直方图,type = pct表示图高为频率 */
run;
三维直方图
data ex;
input lei$ x@@;
cards;
a 70 a 49 a 37 a 28 a 45 b 58 b 60 b 69 b 47 b 36 b 25 b 47 b 69 b 70 b 47
;
proc gchart;
block lei; /* 三维直方图*/
run;
symbol i=join v=diomand;
表示画折线,空心菱形