- 时间序列分析与量化交易(2)||实用
时间序列分析是现代计量经济学的重要内容。
概率分布的阶矩:
1. 一阶矩:均值
2. 二阶矩:方差
3. 三阶矩:偏度(Skewed Distributions)
4. 四阶矩:峰度(Kurtosis),随机变量概率密度函数尾部的厚尾(宽度)
一元时间序列分析-基本概念
平稳性
- 严格平稳过程(Strictly Stationary Process):序列
的 概率测度在时间的平移变换下保持不变。
- 弱平稳过程(Weakly Stationary Process)
如果一个时间序列概率分布的所有阶矩都不随时间变化,那它就是严格平稳的;
如果只是一阶矩和二阶矩不随时间变化,那它就是弱平稳。
金融文献中,通常假定资产收益率序列是弱平稳的。
弱一个时间序列是非平稳的,我们只能研究其在研究期间的行为,每个时间序列数据集都是特定的一幕,就无法把结论推广到其他期间。也就不存在预测的价值了。
自协方差(Auto - Covariance)
自协方差决定是如何与它自身的先前值相关的,对于一个平稳的时间序列,它只依赖于
与
之差。
白噪声过程(White Noise Process)
如果时间序列是一个有有限均值和有限方差的、独立同分布的随机变量序列,则称时间序列
为白噪声。
白噪声序列,自相关系数为零。实际应用中,如果所有样本的自相关函数接近为零,则认为这个序列为白噪声序列。
若一个随机过程满足: 则称之为白噪声过程(White Noise Process)
单位根
当时间序列含有单位根时,它就是一个非平稳时间序列。
单整性
若一个非平稳时间序列,必须经过
次差分后才能变成一个平稳的、可逆的
时间序列,则称
具有
阶单整性。
一元时间序列分析-随机时间序列模型
随机时间序列
若对每一个固定的,
是一个随机变量,则
为随机时间序列。
AR(Auto-Regressive Model)自回归模型
如果时间序列可以表示为:
其中:
:白噪声,
则称为一阶自回归过程,简称
。
以上称为p阶自回归过程,记作
。
模型阶
的决定有两种方式:
- 偏自相关系数(Partial Auto-Correlation Function,PACF)
- 信息准则函数
- 赤池信息准则(AIC)
- 施瓦茨(Schwarz)贝叶斯信息准则(SBIC)
MA(Moving-Average Model)
如果时间序列可以表示为:
以上称为q阶的移动平均(Moving-Average )过程,记作
。
ARMA(Auto-Regressive Moving Average Model)自回归移动平均模型
如果时间序列可以表示为:
以上称为自回归移动平均模型,记作
。
ARIMA 单整自回归移动平均模型
Box和Jenkins1976年提出ARIMA(p,d,q),该模型是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值及其随机误差项的现值和滞后值进行回归所建立的模型。
单位根检验(Unit Root Test)
检验时间序列是否平稳,需要先检验单位根是否存在。
ADF检验(Dickey-Fuller1979)
DF检验仅在是白噪声序列时才有效,特别的如果随机误差项
是自相关的,DF检验无效。
解决办法是利用因变量的p阶滞后来扩展检验,扩展的DF(Augmented Dickey-Fuller,ADF)检验模型如下:
菲利普-配荣检验(Phillips-Perron,PP)
PP检验针对的是回归模型的干扰项存在异方差或序列自相关的现象。
多元时间序列分析方法-基本概念
ARMA模型要求时间序列是平稳的;(实际经济运行中的大多数时间序列都是非平稳的)
ARIMA模型通过差分法消除时间序列的非平稳趋势建立平稳的时间序列;(但是解释性降低)
1987年Engle和Granger提出协整(Cointegration)理论,解决非平稳时间序列的建模困境。
协整关系
经济运行中,单组时间序列变量大多都是随机游走的,但是他们的某个线性组合确可能是平稳的,因为他们可能收到某些共同因素的影响。
两个或两个以上同阶单整的非平稳时间序列变量的线性组合是平稳时间序列,则这些变量之间就存在协整关系。
协整检验
协整检验用来检验非平稳变量之间是否存在长期均衡关系。
如果非平稳变量之间存在协整关系,则他们之间的离差即非均衡误差是平稳的(这里可能就是文章《沪深300股票聚类可视化案例||tushare完整可运行代码逐行解释》中为什么采用作为输入数据的理论依据吧?!)。
- E-G两步法(Engle-Granger1987年提出,用于检验两变量之间的协整关系)
- Johansen检验(1988年,基于向量自回归模型(Vector Autoregression,VAR),检验多变量)
各类相关模型简记
误差修正模型(Error Correction Model, ECM)
传统的经济模型通常表示的是变量之间的一种长期均衡关系,但是经济变量之间在短期来看往往是非均衡的。因此,建模时需要用数据的动态非均衡过程来逼近经济理论的长期均衡过程。最常见的就是ADl(Autoregressive Distributed Lag,自回归分布滞后模型)。误差修正模型包含在ADL中。
向量自回归模型(VAR,
,1980)
如果事先并不知道哪个变量为被解释变量,哪个变量为解释变量,因而很难确定变量之间的协整关系。
VAR用于解决此问题,VAR中不去分内生变量和外生变量,而是全部看成内生变量。
脉冲响应函数(Impulse Response Function)
是指系统对其中某一个变量的一个冲击或信息所作出的反应。
预测方差分解(Variance Decompositions,
,1980)
向量自回归模型的预测方差分解是一种判断经济序列变量间动态相关性的重要方法,能定量的把握变量间的影响关系。
本质是一个新生计算过程,是将系统的预测均方误差分解为系统中各变量冲击所做的贡献。
自回归条件异方差(Autoregressive Conditionally Heteroscedastic,ARCH,$R \cdot Engle$1982) 非线性模型
广义自回归条件异方差(Generalized ARCH,$Bollerslev$1986)
- 时间序列分析与量化交易(2)||实用
Reference
- 《金融计量学》张宗新 中国金融出版社