(1).一元线性回归:数学模型定义

                  模型参数估计

                检验、预测及控制

1.回归模型:          可线性化的一元非线性回归

        (2).多元线性回归:数学模型定义

               模型参数估计

               多元线性回归中检验与预测

               逐步回归分析

希腊字母表α 阿尔法, β 贝塔, γ 伽玛,δ 德尔塔 ε 伊普西隆, ζ 泽塔, η 伊塔, θ 西塔, ι 约塔, κ 卡帕, λ 兰姆达,μ 米欧 ,ν 纽,

         ξ 克西, ο 欧米克隆, π 派, ρ 柔 ,σ 西格玛, τ 陶 ,υ 玉普西隆, φ 弗爱, χ 凯, ψ 普赛

2.一般的,称由y=β0+β1*x+ε确定的模型为一元线性回归模型:记作

                              y=β0+β1*x+ε    y(预测变量)、β0(y轴截距)、β1(斜率)、ε(随机误差)

                              E(ε)=0,D(ε)=σ^2  E(数学期望)、D(方差)

 β0为固定系数,β1称为回归系数,自变量x也称为回归变量

                              Y=β0+β1*x      称为y对x的回归直线方程

3.一元线性回归分析的主要任务是:

(0).预处理数据,可用性以及可靠性

(1).用试验值(样本值)对β0、β1和σ作点估计

(2).对回归系数β0、β1作假设检验

(3).在x=x0处对y做预测,对y作区间估计

% 对于数据预处理:数据误差的统计处理
% 用样本均值进行呼叫的前提是样本值中不含异常数据,根据正态分布误差理论,误差超过3s的概率仅为0.0027
在通常认为是变化范围适度的一系列数据中,会出现非常大或非常小的值,这表明可能的固有变异性,这些数值在一定条件下,就可以舍去不用
% 从附件得数据量……,采用……准则……
%拉伊达(PauTa)准则
%v(b)=|x(b)-x(均)|>3σ 1<=b<=n
%其中 σ(预测值)=s=sqrt(1/(n-1)*sum(x-mean(x)).*2)
%剔除后余下数据在计算:
%直到:|x(b)-x(剔除后的均值)|<3σ----->合理数据,无极端值
源代码:X=mean(x)%均值
σ=s=sqrt(1/(n-1)*sum((x-mean(x)).*2))%方差
v(b)=abs(x-mean(x))%筛选数据绝对值
% 回归分析三步走:回归模型,回归方程,显著性检验,回归方程预测
%回归分析--->直线拟合,设方程y(预测)=β0+β1*x
%通常采用最小二乘法求解参数的估计
%Q(β0,β1)=sum(y-y(预测)).^2=sum(y-β0-β1*x).^2
%得到解:y(预测)=β0+β1*x

SST=sum(y-mean(y).^2) %设y(i)与y(平均)的总离差平方和
SSR=sum(((y-β0-β1*x)-mean(y)).^2)%设回归值y与均值y的总离差平方和
SSE=sum((y-(y-β0-β1*x)).^2)%设y(i)与回归值y的总离差亦即残差平方和e(i).2
%这是回归不能解释的部分,文章下方将单独警醒残差分析
SST=SSR+SSE
由数据的……,即y波动主要有x变化而引起,其他一切因素是次要的
为检验建立的方程是否有合理性:即检验回归系数是否为0
%F检验法:H(0):β1=0 H(0):β1!=0
F=SSR/(SSE/(n-2))--Fα(1,n-2)
当F<=Fα(1.n-2)时,认为b=0不真,称方程是显著的,反之,不显著
(F检验对回归方程作显著性检验)方差分析表
方差来源 偏平方和 自由度 方差 F值 Fα 显著性
回归 SSR 1 MSR=SSR/1 F=MSR/MSE Fα(1.n-2)
剩余 SSE=SST-SSR n-2 MSE=SSE/(n-2)
总和 SST n-1
若F>=F0.01(1,n-1) 高度显著
F0.05(1.n-2)<=F<=F0.01(1,n-1) 显著
F<F0.05(1,n-2) 不显著
% r检验---->拟合程度测定