什么是回归?就是一个连续方程,这就是回归,为啥起这么恶心的名字?

回归最早是遗传学的术语,大概是19世纪后期,指的是不管父母的身高有多少,后代身高都会向平均身高靠近,叫做回归。比如平均身高160,A的父母平均身高170,B的父母平均身高150,A身高是165, B身高155这种现象。很多计量术语都是从生物学借鉴,比如,对照组和实验组,也是最早研究药效用的,计量经济学就是仿照生物计量学命名的。这么说来也不差。
线性回归的英文regression towards the mean。mean在英文中是平均值的意思。均值衰退?就类似于均值的波动吧,这就是回归的含义了。

那自回归呢,我们可以理解为自己与自己的回归,在时间序列上,也就是昨天的你、前天的你,对今天的你的影响。因为,用到的因素都是你自己,只是时间不同,所以这种回归叫做自回归。

自回归模型,是统计上一种处理时间序列的方法,是用同一变量之前各期的表现情况,来预测该变量本期的表现情况,并假设它们为线性关系。因为这是从回归分析中的线性回归发展而来,只是不是用来预测其他变量,而是用来预测自己,所以叫做自回归。

昨天的你,前天的你,都可以用来预测今天的你,只是预测的结果是否准确,受到很多因素的影响。

也许,你的身高变化不仅受到自己的影响,还受到气候、家庭,甚至空气、水源的影响,但是在你刚刚建立的模型中,他们都是被忽略掉的。

他们藏在了一个地方:随机扰动项。

也许根据你的模型,你今天应该达到1.70,但是你只有1.65,那就是你的模型中可能有些因素被你忽略掉了,它也对你的身高有影响,它就是随机扰动项。

由于随机扰动项包含了所有无法用解释变量表示的各种因素对被解释变量的影响,即模型中略去的经济变量对被解释变量的影响。

如果其中被略去的某一因素或某些因素随着解释变量观测值的不同而对被解释变量产生不同的影响,就会使随机扰动项产生异方差性。

你可以这样理解,如果你的身高,受到昨天、前天的身高的影响,而这个随机扰动项也受到昨天、前天身高的影响,那这个扰动项也会随着每天的数据变化,这就是异方差。

异方差一般可归结为三种类型:
(1) 单调递增型:随X的增大而增大,即在X与Y的散点图中,表现为随着X的增大Y值的波动越来越大。
(2)单调递减型:随X的增大而减小,即在X与Y的散点图中,表现为随着X值的增大Y值得波动越来越小。
(3)复杂型:与X的变化呈复杂形式,即在X与Y的散点图中,表现为随着X值的增大Y值的波动复杂多变没有系统关系。

下面这张图就表示了单调递增的异方差性。

arcgis 回归分析 arch回归结果分析_线性回归

嗯,实际上就是随着时间收敛,还是发散,还是根本没有信息。

ARCH模型的英文直译是:自回归条件异方差模型。

粗略地说,该模型将当前一切可利用信息作为条件,并采用某种自回归形式来刻画方差的变异,对于一个时间序列而言,在不同时刻可利用的信息不同,而相应的条件方差也不同,利用ARCH模型,可以刻画出随时间而变异的条件方差。

在这里,异方差变成了条件异方差,其本质是一样的,只是约束条件变成了:一切可利用信息。

ARCH模型的基本思想是指在以前信息集下,某一时刻一个扰动项的发生是服从正态分布。该正态分布的均值为零,方差是一个随时间变化的量(即为条件异方差)。并且这个随时间变化的方差是过去有限项噪声值平方的线性组合(即为自回归)。这样就构成了自回归条件异方差。

但这个模型不能解释为什么存在异方差,只是描述了条件异方差的行为。