文章目录

  • 一、时间序列与平稳序列
  • 1.时间序列的概念
  • 2.重要的时间序列——平稳序列
  • 3.特殊的平稳序列——白噪声
  • 4.多平稳序列的相互关系
  • 回顾总结


一、时间序列与平稳序列

1.时间序列的概念

时间序列,就是按照时间次序排列的随机变量列,其最重要的特征就是具有时间关系,即处于不同时间的随机变量可能具有一定的联系。生活中有许多时间序列,如每个月的平均气温、股市每天的收盘价等等,都是时间序列。

任何时间序列,经过合理的变换后都可以看作由三个部分叠加而成:趋势项,周期项和随机噪声项。趋势项大体刻画了时间序列的变化趋势,是一个固定的、可以预测的项;周期项是具有一定周期的时间序列,比如一年四季每个季节有各自的特征,就可以用周期项来刻画;随机噪声则是随机干扰,一般被视为独立的零均值序列。

以上关系概括说来,就是
两个时间序列的相关性 python 时间序列有两个变量_方差
在实际生活中,时间不能倒流,所以时间序列往往只能够发生一次,即获得一次观测。两个时间序列的相关性 python 时间序列有两个变量_时间序列_02的一组实际数值两个时间序列的相关性 python 时间序列有两个变量_时间序列分析_03是时间序列的一次实现或一条轨道。

在获得观测值后,要对时间序列进行以上的分解,才能够获得具有实际意义的分布。有一些常用的分解方式,如分段趋势分解,回归直线法,二次曲线回归法,逐步平均法等等。

随机过程中将时间指标分成连续集与离散集两种,即两个时间序列的相关性 python 时间序列有两个变量_时间序列_04的取值可以是连续的两个时间序列的相关性 python 时间序列有两个变量_协方差_05或离散的两个时间序列的相关性 python 时间序列有两个变量_时间序列分析_06,我们将重点放在离散时间序列上。

2.重要的时间序列——平稳序列

时间序列的趋势项和季节项往往可以用非随机的函数进行刻画,剩下的随机噪声项,往往会具有某种平稳波动性,即在某条直线上下跳跃。平稳序列是用来描述某一种具有平稳波动性序列的序列,其定义如下。

如果时间序列两个时间序列的相关性 python 时间序列有两个变量_时间序列分析_07满足:

  1. 两个时间序列的相关性 python 时间序列有两个变量_时间序列分析_08,即二阶矩存在;
  2. 两个时间序列的相关性 python 时间序列有两个变量_方差_09,即均值一致;
  3. 两个时间序列的相关性 python 时间序列有两个变量_时间序列_10,即自协方差只与时间差有关。

就称两个时间序列的相关性 python 时间序列有两个变量_时间序列分析_07是平稳时间序列,称两个时间序列的相关性 python 时间序列有两个变量_方差_12两个时间序列的相关性 python 时间序列有两个变量_时间序列分析_07的自协方差函数。

从平稳序列的定义可以看出,它的平稳表现在两个方面,一是均值、方差的平稳性,即均值、方差与时间无关;二是相关性的平稳性,即序列中的任意两个随机变量自协方差函数,只与时间差有关,而与它们的绝对位置无关。

需要注意,自协方差函数是包含分布的方差的,因为两个时间序列的相关性 python 时间序列有两个变量_协方差_14。这也说明了方差与时间无关,因为对任何两个时间序列的相关性 python 时间序列有两个变量_两个时间序列的相关性 python_15,其方差都是两个时间序列的相关性 python 时间序列有两个变量_时间序列_16,是一个常数。如果两个时间序列的相关性 python 时间序列有两个变量_两个时间序列的相关性 python_17,那么随机变量就是一个常数,没有讨论的必要,因此我们总假定两个时间序列的相关性 python 时间序列有两个变量_方差_18

从平稳序列的定义来看,它最重要的元素无疑是自协方差函数,这刻画了序列内部的关系。首先,很显然对于任何实时间序列,其自协方差序列都是实数列,除此外自协方差函数有以下三条重要性质

1、对称性,即两个时间序列的相关性 python 时间序列有两个变量_方差_19对所有两个时间序列的相关性 python 时间序列有两个变量_时间序列_20成立。

2、非负定性,即对任何两个时间序列的相关性 python 时间序列有两个变量_时间序列分析_21两个时间序列的相关性 python 时间序列有两个变量_方差_22阶自协方差矩阵
两个时间序列的相关性 python 时间序列有两个变量_协方差_23
总是非负定的。

3、有界性,即对任何两个时间序列的相关性 python 时间序列有两个变量_时间序列_20,有两个时间序列的相关性 python 时间序列有两个变量_协方差_25

同时满足以上三条性质的实数列称为非负定序列,平稳序列的自协方差函数就是非负定序列,并且可以证明,每个非负定序列都可以是一个平稳序列的自协方差函数。这里建立了非负定序列与平稳序列的对应性。

接下来对平稳序列的这三条性质进行证明。对称性最显然,由定义就可以直接看出,即
两个时间序列的相关性 python 时间序列有两个变量_方差_26
非负定性,即自协方差矩阵是非负定矩阵,对于任何一个二次型要证明其非负,就任取一个常数向量,计算
两个时间序列的相关性 python 时间序列有两个变量_时间序列_27
这个证明过程中,需要牢记的是二次型的写法,即将二次型写成一个双重求和的结果,每一项是两个时间序列的相关性 python 时间序列有两个变量_时间序列_28与二次型矩阵的第两个时间序列的相关性 python 时间序列有两个变量_时间序列分析_29项乘积;并且将双重求和转化成一个单次求和的函数,这个思想也很重要。

有界性,用到柯西不等式,将随机变量中心化,即两个时间序列的相关性 python 时间序列有两个变量_方差_30,那么两个时间序列的相关性 python 时间序列有两个变量_时间序列分析_31两个时间序列的相关性 python 时间序列有两个变量_方差_32,就有两个时间序列的相关性 python 时间序列有两个变量_时间序列_33,这里小于等于号就是柯西不等式的结果。

由有界性可以知道两个时间序列的相关性 python 时间序列有两个变量_时间序列分析_34,与相关系数有很大的相似之处,所以我们将两个时间序列的相关性 python 时间序列有两个变量_时间序列_35定义为平稳序列的自相关系数,也就是自协方差函数的归一化。在某些情况下,自相关函数甚至比自协方差函数还要重要。

我们再将目光投射到三条性质中,最不平凡的那条,即非负定性上。既然我们知道两个时间序列的相关性 python 时间序列有两个变量_时间序列_36,有两个时间序列的相关性 python 时间序列有两个变量_协方差_37,那么作为临界情况的等号成立时意味着什么呢?显然等号很难对于所有两个时间序列的相关性 python 时间序列有两个变量_时间序列_38都成立(除非两个时间序列的相关性 python 时间序列有两个变量_两个时间序列的相关性 python_39,但这是没有意义的),所以我们讨论对某个特定的两个时间序列的相关性 python 时间序列有两个变量_时间序列_38等号成立的情况。由于
两个时间序列的相关性 python 时间序列有两个变量_协方差_41
我们不妨定义两个时间序列的相关性 python 时间序列有两个变量_时间序列分析_42,那么两个时间序列的相关性 python 时间序列有两个变量_时间序列_43,也就说明两个时间序列的相关性 python 时间序列有两个变量_时间序列_44是常数,结合其均值来看应该有两个时间序列的相关性 python 时间序列有两个变量_时间序列_45两个时间序列的相关性 python 时间序列有两个变量_协方差_46指全是1的列向量)。由于我们规定两个时间序列的相关性 python 时间序列有两个变量_两个时间序列的相关性 python_47,那么一定存在一个下标最大的分量两个时间序列的相关性 python 时间序列有两个变量_时间序列分析_48,使得两个时间序列的相关性 python 时间序列有两个变量_协方差_49可以被两个时间序列的相关性 python 时间序列有两个变量_时间序列分析_50线性表示。这时,我们称两个时间序列的相关性 python 时间序列有两个变量_两个时间序列的相关性 python_51是线性相关的。

并且进一步看,由于自协方差函数与序列位置无关,即
两个时间序列的相关性 python 时间序列有两个变量_方差_52
所以对任何一组的连续的两个时间序列的相关性 python 时间序列有两个变量_两个时间序列的相关性 python_53,都有两个时间序列的相关性 python 时间序列有两个变量_时间序列分析_54可以被两个时间序列的相关性 python 时间序列有两个变量_时间序列_55线性表示,并且表示系数是相同的。这一性质,表明对于退化的两个时间序列的相关性 python 时间序列有两个变量_时间序列分析_56,任何两个时间序列的相关性 python 时间序列有两个变量_方差_57都可以被两个时间序列的相关性 python 时间序列有两个变量_两个时间序列的相关性 python_58线性表示,这进一步说明了对于任意的两个时间序列的相关性 python 时间序列有两个变量_方差_59两个时间序列的相关性 python 时间序列有两个变量_两个时间序列的相关性 python_15,它们一定是线性相关的,不管是不是连续增长的时间指标两个时间序列的相关性 python 时间序列有两个变量_时间序列_04

事实上,用多元统计的观点看,设两个时间序列的相关性 python 时间序列有两个变量_方差_62,那么两个时间序列的相关性 python 时间序列有两个变量_方差_63,即随机向量的协方差矩阵,那么自然有
两个时间序列的相关性 python 时间序列有两个变量_时间序列分析_64
两个时间序列的相关性 python 时间序列有两个变量_两个时间序列的相关性 python_65的时候,显然有两个时间序列的相关性 python 时间序列有两个变量_时间序列分析_66

需要注意的是,平稳序列并不一定是平稳但散乱的,也可以具有很强的周期性,其典型例子就是调和平稳序列两个时间序列的相关性 python 时间序列有两个变量_两个时间序列的相关性 python_67,它的自协方差函数是两个时间序列的相关性 python 时间序列有两个变量_方差_68,具有很强的周期性,所以观测样本也会具有周期性。

3.特殊的平稳序列——白噪声

白噪声是一种最为简单,但也颇具地位的平稳序列,其定义如下。

两个时间序列的相关性 python 时间序列有两个变量_方差_69是一个平稳序列,如果对任何两个时间序列的相关性 python 时间序列有两个变量_方差_70,都有
两个时间序列的相关性 python 时间序列有两个变量_方差_71
就称两个时间序列的相关性 python 时间序列有两个变量_方差_69是一个白噪声,记作两个时间序列的相关性 python 时间序列有两个变量_两个时间序列的相关性 python_73

关于其方差和协方差的另一种写法是
两个时间序列的相关性 python 时间序列有两个变量_时间序列_74
这里两个时间序列的相关性 python 时间序列有两个变量_方差_75是克罗内克(Kronecker)函数,当两个时间序列的相关性 python 时间序列有两个变量_时间序列分析_76两个时间序列的相关性 python 时间序列有两个变量_两个时间序列的相关性 python_77,否则两个时间序列的相关性 python 时间序列有两个变量_两个时间序列的相关性 python_78

白噪声又可以细分为以下几类:

  • 两个时间序列的相关性 python 时间序列有两个变量_方差_69是独立序列时,称为独立白噪声(定义只保证了不相关);
  • 两个时间序列的相关性 python 时间序列有两个变量_协方差_80时,称为零均值白噪声;
  • 两个时间序列的相关性 python 时间序列有两个变量_时间序列分析_81时,称为标准白噪声;
  • 两个时间序列的相关性 python 时间序列有两个变量_方差_69服从正态分布且是独立序列时,称为正态白噪声。

4.多平稳序列的相互关系

多平稳序列的相互关系,指的是对于两个平稳序列两个时间序列的相关性 python 时间序列有两个变量_方差_83两个时间序列的相关性 python 时间序列有两个变量_协方差_84,它们之间具有的相互性质。具体可以细分为正交平稳序列和不相关平稳序列,其定义如下:

正交的:如果两个时间序列的相关性 python 时间序列有两个变量_两个时间序列的相关性 python_85,都有两个时间序列的相关性 python 时间序列有两个变量_时间序列_86,就称两个时间序列的相关性 python 时间序列有两个变量_时间序列分析_87是正交的。

不相关的:如果两个时间序列的相关性 python 时间序列有两个变量_两个时间序列的相关性 python_85,都有两个时间序列的相关性 python 时间序列有两个变量_两个时间序列的相关性 python_89,就称两个时间序列的相关性 python 时间序列有两个变量_协方差_90是不相关的。

这两个定义很好从字面意义上理解。正交是垂直的推广,在线性代数中两个向量两个时间序列的相关性 python 时间序列有两个变量_时间序列分析_91正交被定义为其内积两个时间序列的相关性 python 时间序列有两个变量_方差_92,在平稳序列中,就是乘积的期望为0;不相关就是二者不对对方产生影响,所以乘起来求期望与分开求期望相乘得到的结果理应是一样的。如果两个时间序列的相关性 python 时间序列有两个变量_时间序列_93,那么正交序列和不相关序列本身等价,也就是说,对于零均值平稳序列,其正交性和不相关性是等价的。

为什么要讨论这两种特殊的关系呢?我们以后可能会对平稳序列进行求和,即两个时间序列的相关性 python 时间序列有两个变量_时间序列分析_94,如果两个时间序列的相关性 python 时间序列有两个变量_两个时间序列的相关性 python_95本身也能够是平稳序列那再好不过了。幸运的是,两个时间序列的相关性 python 时间序列有两个变量_时间序列分析_96是正交、不相关序列时,都能让两个时间序列的相关性 python 时间序列有两个变量_两个时间序列的相关性 python_95是平稳序列。

要证明两个时间序列的相关性 python 时间序列有两个变量_两个时间序列的相关性 python_95是平稳序列,就要证明其二阶矩有限、期望平稳、自协方差函数仅与时间差有关。期望平稳是显然的,有两个时间序列的相关性 python 时间序列有两个变量_方差_99;二阶矩有限也是显然的,有
两个时间序列的相关性 python 时间序列有两个变量_时间序列_100
接下来对正交、不相关序列,分别求两个时间序列的相关性 python 时间序列有两个变量_两个时间序列的相关性 python_95的自协方差函数。首先是正交的情况,有
两个时间序列的相关性 python 时间序列有两个变量_两个时间序列的相关性 python_102
然后是不相关的情况,立马得到两个时间序列的相关性 python 时间序列有两个变量_两个时间序列的相关性 python_103。这两个数都是两个时间序列的相关性 python 时间序列有两个变量_方差_104的函数,这就证明了对正交、不相关平稳序列,其和仍然是平稳序列。

加和的自协方差函数不方便记忆,可以记以下的简化结论:对于零均值的正交平稳序列两个时间序列的相关性 python 时间序列有两个变量_时间序列分析_96,他们的和两个时间序列的相关性 python 时间序列有两个变量_时间序列分析_106仍是平稳序列,且两个时间序列的相关性 python 时间序列有两个变量_时间序列分析_107

回顾总结

  1. 任何时间序列经过适当的变换,都可以拆解为趋势项、季节项、随机噪声,并且趋势项和季节项一般被认为是非随机函数。
  2. 平稳序列是二阶矩存在、期望一致、自协方差只与时间差有关的时间序列,满足这三个条件就是平稳序列,这一般被用来验证序列的平稳性。
  3. 平稳序列中最重要的是自协方差函数两个时间序列的相关性 python 时间序列有两个变量_协方差_108,这是一个实数列,满足对称性、非负定性、有界性三个性质。
  4. 满足对称性、非负定性、有界性的实数列被称为非负定序列,一个非负定序列一定是某个平稳序列的自协方差函数。但非负定性的验证比较麻烦,所以验证一个序列是非负定序列一般是证明它是某个平稳序列的自协方差函数。
  5. 如果两个时间序列的相关性 python 时间序列有两个变量_时间序列分析_109退化,则两个时间序列的相关性 python 时间序列有两个变量_方差_110线性相关,并且可以证明任何下标不小于两个时间序列的相关性 python 时间序列有两个变量_方差_22的项两个时间序列的相关性 python 时间序列有两个变量_协方差_112都可以用两个时间序列的相关性 python 时间序列有两个变量_时间序列分析_113两个时间序列的相关性 python 时间序列有两个变量_时间序列分析_114两个时间序列的相关性 python 时间序列有两个变量_方差_115项线性表示。
  6. 平稳序列是特殊的时间序列,白噪声两个时间序列的相关性 python 时间序列有两个变量_两个时间序列的相关性 python_73是特殊的平稳序列,它的主要特征是序列不相关性,也就是序列之间任意两个不同的随机变量无关,一样需要满足均值、方差的一致性。
  7. 白噪声中,又有独立白噪声、零均值白噪声、标准白噪声、正态白噪声几类特殊白噪声。
  8. 平稳序列正交指两个时间序列的相关性 python 时间序列有两个变量_时间序列_86,不相关指两个时间序列的相关性 python 时间序列有两个变量_两个时间序列的相关性 python_89,对零均值平稳序列这两个定义是等价的。
  9. 平稳的正交、不相关序列加和仍然是平稳序列,且对于零均值的情况,自协方差函数为两个分开的自协方差函数之和。