文章主要是总结一学期所学,完成的基于 ARIMA-GARCH 模型人名币汇率分析与预测。为了防止抄袭搬运,文章中不附带代码、摘要、数据。
时间序列应用广泛,不能仅仅局限于理论学习,代码实践更为重要。
主要流程如下
文章目录
- 第一章 绪论
- 1.1研究的背景
- 1.2 研究的目的和意义
- 1.3论文的主要工作
- 1.4论文的技术方法
- 1.5数据的选择
- 1.6理论基础
- 第二章 模型的建立
- 2.1 模型的假设与说明
- 2.2 ARIMA 模型的建立
- 2.2.1 数据的初步分析
- 2.2.2 ARIMA 模型的定阶问题
- 2.2.3 ARIMA 模型的显著性检验
- 2.2.4 ARIMA 模型的预测
- 2.3 ARIMA-GARCH 模型的建立
- 2.3.1 GARCH 模型的条件检验
- 2.3.2 GARCH 模型的拟合分析
- 2.3.3 ARIMA-GARCH 组合模型
- 2.3.4 ARIMA-GARCH 的预测
- 第三章 结论分析与模型改进方案
- 3.1 结果分析和改进
- 致谢
- 参考文献
- 附录
- 使用数据
- 代码与程序
- 文章总结
第一章 绪论
1.1研究的背景
人民币汇率,尤其是中美汇率,一直是国际经济环境和国内民生环境的焦点。2014年以后,中美汇率较十年前的整体态势发生了变化。人民币不再保持单方面升值的趋势,而是出现长期大幅度双向波动的情况,并且呈现整体贬值的态势。2015年人名币汇率进入两边波动的新常态。在这种情况下,持续关注和重视中美汇率的发展形势对于国家经济发展和人民日常生活就显得尤为重要。
汇率是国际金融与经济关系重要的连接手段,是国与国、国与地区以及地区与地区之间的经济杠杆,对小到百姓生活、大到国家发展都起着重要的作用。中国作为世界经济体系下的一员,对世界经济发展可谓举足轻重,同时也要遵循整个国际金融环境的规律。1973年,牙买加体系取代崩溃的布雷顿森林体系成为国际货币新体系。新的阶段,世界经济环境下的汇率以浮动为主,汇率波动性主要表现为频率增加、幅度增大。这种波动性为世界经济发展带来巨大的风险,国家、地区、跨国金融机构甚至民众都受到巨大的考验。在大环境下,我们国家经济的发展需要经受多重考验,特别是在加入WTO之后。随着我国金融环境与国际金融环境的交流不断增加,就需要我国的金融环境更加开放,我国汇率制度就必须进行不断改革。
为了能够在考验之中保持竞争性,就需要我们能够找到合理而行之有效的方法。时间序列分析方法是己经证明其在汇率问题研究上是一种可靠的方法。能够为汇率研究提供理论基础的支持,在研究汇率的历史数据时发现内含的规律,然后建立恰当的模型对汇率进行模拟和预测,为经济发展提供巨大的帮助。
1.2 研究的目的和意义
在解决汇率问题上,因为人为原因和环境原因,影响汇率的因素太多,我们不可能一一考虑到,所以我们只能得到一组数量有限的样本数据。而时间序列分析方法恰恰能够在这有限的样本上模拟出准确恰当的数学模型,再通过这个模型获得一定精度的统计特征。尽管这些由模型得出的统计特征并不完全准确,但是十分接近真实结果,同时又能够比得到真实结果节省到大量时间,提供可操作性。时间序列分析的目的主要体现在两个方面,第一个就是获得观测样本序列产生的随机机制,也就是建立数学模型;第二个就是在历史数据的基础上,对观测样本序列未来的可能取值给出预测[1]。
新冠疫情下国际金融环境风云变换。时间序列分析方法一直是汇率问题研究的有效方法,本文将会分别使用ARIMA模型和ARIMA-GARCH组合模型对2019年9月与2020年11月一整年的中美汇率进行实例分析,希望能够为汇率研究提供理论基础的支持,同时能够在恰当的模型中对汇率进行模拟和预测,从而能够为国家的经济发展、金融公司的财富积累和个人的金钱行为起到引导与建议的作用。
1.3论文的主要工作
本文主要工作是研究时间序列分析方法,并将这一方法应用到疫情前后中
美汇率的预测问题上来。本文的数据是选取以天为单位 2020 年 9 月 1 日到 2020年 11 月 14 日全年共 441 个样本,然后应用时间序列分析方法,主要是 ARIMA模型和 GARCH 模型。在实证分析时,需要用到借助统计工具,包括 R 软件、SPSS软件、Pycharm、Excel。借助软件进行分析、模拟以及最后的预测,为关于中美汇率相关的工作提供帮助。
1.4论文的技术方法
1.5数据的选择
选取2020年9月1日到2020年11月14日的每100美元兑人民币数量
1.6理论基础
- 波动聚集性:金融资产价格的变化往往是大的波动后跟随大的波动,小的波动后跟随小的波动,也就是它的波动具有正相关性高波动率和低波动率往往会各自聚集在某一时间段,而且高波动率和低波动率聚集的时期会交替出现。此外,金融的波动性还呈现非对称性特征,即收益率的正负对未来波动率的影响并不对称。
- ARIMA 模型:叫做差分整合移动平均自回归模型,又称整合移动平 均自回归模型(移动也可称作滑动),是时间序列预测分析方法之一。ARIMA(p, d,q)中,AR 是“自回归”,p 为自回归项数;MA 为“滑动平均”,q 为滑动平 均项数,d 为使之成为平稳序列所做的差分次数(阶数)。
- ARCH 模型:ARCH 模型全称“自回归条件异方差模型”,解决了传统的计量经济学对时间序列变量的第二个假设(方差恒定)所引起的问题。GARCH 模型称为广义 ARCH 模型,是 ARCH 模型的拓展,。传统的计量经济学对时间序列变量的第二个假设:假定时间序列变量的波动幅度(方差)是固定的,不符合实际,比如,人们早就发现股票收益的波动幅度是随时间而变化的,并非常数。这使得传统的时间序列分析对实际问题并不有效。
- 白噪声序列:白噪声序列,是指白噪声过程的样本实称,简称白噪声。白噪声序列的特点表现在任何两个时点的随机变量都不相关,序列中没有任何可以利用的动态规律,因此不能用历史数据对未来进行预测和推断。
- 平稳序列:平稳序列(stationary series)是基本上不存在趋势的序列。这类序列中的各观察值基本上在某个固定的水平上波动,虽然在不同的时间段波动的程度不同,但并不存在某种规律,其波动可以看成是随机的。
第二章 模型的建立
2.1 模型的假设与说明
为了方便问题的研究,不妨忽略一些对问题影响较小的因素,做出如下的假设:
- 不同的渠道收集到的数据存在差异,确定我们收集的数据为准确的,有价值
- 文中所有用到的显著性水平α = 0.05,p 值大于显著性水平接受原假设否则接受
备择假设 - 数据为完整数据,无需进行数据处理。模型的训练集数据为为 2019 年 9 月 1日至 2020 年 11 月 13 日,测试集数据为 2020 年 11 月 14 日 2020 年 11 月
18 日 - 数据指的是每 100 美元兑人民币的数量
2.2 ARIMA 模型的建立
2.2.1 数据的初步分析
首先根据选择的 441 个数据画出时间序列的折线图。使用数据分析软件,使
用折线图对 441 个数据进行了模拟。
首先对图 1 进行观察,能够得出,时序图局部波动明显,整体上表现出下降、上升、下降的趋势,并不存在季节性和奇异点,能够初步判断该时间序列是一个非平稳序列。为了保证判断的正确性,我们接下来会用到相关系数进行进一步的探究
再利用Rstudio进行Adf检验 p-value = 0.9459>α=0.05,确认该序列为非平稳序列。面对这种情况,通常是对时间序列进行差分处理,然后再进行平稳性判断。若是差分后的时间序列仍然不是平稳序列,我们需要接着进行差分处理,直到找到平稳序列。但是差分的次数d并不是可以无限大的,通常差分的次数是1到2次。所幸,本次研究的时间序列经过1次差分后便变现出平稳性了。
图2是时间序列的一次差分图,图像均匀地分布在0值两边,趋势性己经几乎没有影响,一次差分序列基本平稳。为了进一步进行确定,我们还对一阶差分序列进行了平稳性检验。通过ADF检验得到的结果是P-value < 0.01,也就是小于显著水平 0.05,所以我们可以认为一阶差分序列通过了平稳性检验。
2.2.2 ARIMA 模型的定阶问题
时间序列经过一阶差分后,已经转换成一个平稳序列,所以我们需要确定p和q的值。为此,我们查看一阶差分序列的图3(ACF图)F与图4(PACF图)。
ACF图和PACF图都没有明显的截尾和拖尾特征,不好判断阶数。所以我们需要其他方法进行辅助。首先我们考虑逐个建模比较AIC准则进行判断。详细情况如下:
同时R提供了简洁的方法,使用auto.arima函数自动寻找最优模型。最终择优选择了初步模型为ARIMA(1,1,0)。
2.2.3 ARIMA 模型的显著性检验
模型建立后要求对其显著性进行检验,也就是确定模型对原始数据的拟合程度。检验的原则是拟合模型是否基本提取到了原始数据的所有相关信息,残差序列是否为高斯序列。如果残差序列为白噪声序列的话,说明拟合效果良好;反之,模型拟合失败,我们则需要尝试其他模型。对残差序列的平稳性检验通过函数实现,LB检验如表如下p值都大于0.05如上表,该序列白噪声序列。
同时也对参数进行显著性检验,结果如下表,参数显著非零。
最后,我们还做出模型的拟合图5:
可以看出拟合线与原始数据线十分接近,拟合效果良好。最终确认模型ARIMA(1,1,0)。
2.2.4 ARIMA 模型的预测
我们会根据中美汇率在2019年9月1日到2020年11月11日期间的数据利用模型ARIMA(1,1,0)对中美汇率未来的个统计日的数据进行预测。利用ARIMA(1,1,0)模型,我们预测的结果呈现在表4中。 同时我们还得到了汇率的图6预测图:
红线表示真实数据走向,蓝线表示ARIMA(1,1,0)模拟出来的走势。走势基本符合实际情况,人民币一直在升值,可取之处是该模型能够预测短期内的变化趋势,缺点则是它不能给出精准的数值以及反映数值间的波动性。
2.3 ARIMA-GARCH 模型的建立
2.3.1 GARCH 模型的条件检验
在之前的模型建立中我们对序列进行差分,通过了平稳白噪声检验。然而对残差序列进行白噪声检验是发现改残差序列为非白噪声序列。从图6也可知残差为偏态分布。为了进一步确认,在R软件我们通过JB检验函数显示p值远小于0.05,说明改残差序列没有正态性。给出了图7残差序列分布图以及图8 QQ图[7]。通过观察,初步判断该时间序列的残差序列为非正态分布。
对残差序列的进一步分析:残残似乎还蕴含了更多的信息,考虑进行ARCH效应
检验表5中p值小于显著性水平0.05 ,接受备择假设,即改模型存在arch效应。
2.3.2 GARCH 模型的拟合分析
对残差建立Garch(1,1)模型并画出条件方差图9进行分析:
条件方差在100-120 190-210 400~420天出现峰值
符合匹配
阶段一:(19.12-20.01)国内新冠疫情升温叠加美伊冲突升级,全球风险偏好阶段性回落;套息交易逆转带动避险情绪升温,美元指数回升的同时人民币汇率表现趋弱。
阶段二:(20.3.1-4)海外疫情持续发酵叠加油价暴跌,波动率抬升引发美元流动性条件持续收紧,基本面和流动性双重影响下全球进入第二轮风险资产抛售阶段,美元升值,人民币兑美元被动贬值。这一时段人民币对非美货币仍相对强势。
三阶段:(20.9-20.11)疫情防控有效,贸易发展,人民币快速升值。
结论:残差的方差确实会随着时间变化,符合历史发展,这对我们观察汇率波动有很多的帮助。
2.3.3 ARIMA-GARCH 组合模型
通过R软件ugarchspec以及ugarchfit函数获得ARIMA-GARCH组合模型如下:
2.3.4 ARIMA-GARCH 的预测
图10中黑线表示真实数据走向,蓝线表示ARIMA(1,1,0)-GARCH(1,1)模拟出来的走势。走势基本符合实际情况,人民币一直在升值,可取之处是该模型能够预测短期内的变化趋势,缺点是在长期预测时就会失去准确性,预测出现较大的偏差。我们将预测的结果反映在表6:
第三章 结论分析与模型改进方案
3.1 结果分析和改进
本文主要的研究目的就是利用时间序列分析方法对中美汇率进行模拟与预测,主要使用的是ARIMA模型与ARIMA-GARCH模型。两个模型各有特点,各有优势。在两个模型中,模型都是基于中美汇率在2019年9月1日到2020年11月13年共441个工作日数据建立的,并且都进行了7个工作日的预测。在ARIMA模型中,预测值的走势基本符合汇率的真实走势,就是人民币整体地表现出升值的趋势。但ARIMA模型对汇率因为突发事件造成的影响没有反应。而相对于ARIMA模型,ARIMA-GARCH组合模型在精确度上和实际值更接近,说明该模型在短期预测上具有很好的特性。在长期方面,由于突发事件出现,ARIMA-GARCH模型预测的准确度降低,但仍然要优于ARIMA模型。两个模型都对汇率的整体走势有着比较良好的预测,就是人民币短期内会有些许升值,但在长期走势上是趋于稳定的。总而言之,两个模型在预测上的效果并不是非常好,不能够对中美汇率走势进行准确的预测。但是两个模型同样具有应用价值,就是能够为中美汇率短期变化趋势给出方向性的判断。
美国作为一个超级大国,同时是最大的经济体。而中国国民生产总值也己经跃居世界第二,仅次于美国。两个国家无论在国家发展战略上,还是在民生交流生活上都有着密不可分的联系。所以,中美汇率在两国之间,甚至在全球都备受关注。两个模型在中美汇率的预测上都给出了短期内整体趋势的判断,能为关心中美汇率者就变化方向提供帮助。
本文的研究虽然取得了一定的进展,但还有很多不足与缺陷。由于时间的限制以及个人的学识限制,并没有透彻地解析时间序列分析方法比较深远的内涵。从文中的预测结论就能看出,模型的建立并不完美,有着许多需要改进的地方。由于数据的原因,并不能够完美的适用到ARIMA模型与ARIMA-GARCH模型,所以产生的结果并不是最理想。应该尝试时间序列分析方法中的其他的知识与方法。
致谢
时光茬蒋,不知不觉间,一学期的学习己经接近尾声。“诚以待人,毅以处世”。的集大精神也已经铭刻于心。
在这里,我要特别感谢我的指导老师靳珊,在这篇论文中给了我很多指导。靳珊老师学识渊博、学术水平精湛,同时为人和善幽默又不失严禁的态度。
在我看来这门时间序列课其实很有意义,最主要的是理论加实践的学习模式,真正地做到了学以致用。
论文的完成过程是艰辛的,但是收获确实丰富的。尽管因为掌握的知识有限,最后模型的拟合存在缺陷,但是我相信后期的学习一定可以把这部分完善起来。
最后的最后再次诚挚地感谢靳珊老师一学期的辛苦付出。
参考文献
[1]JONATHAN D, CRYRR, CHAN K S.Time series analysis with applications in R [M].潘红宇等译,机械工程出版社,20I1.
[2]波动聚集性:皮天雷. 我国沪市波动聚集性GARCH效应的实证研究[J]. 管理科学, 2003, 16(006):31-35.
[3]ARIMA模型:许立平, 罗明志. 基于ARIMA模型的黄金价格短期分析预测[J]. 财经科学, 2011, 2011(001):26-34.
[4]GARCH模型:吴雄伟, 谢赤. 银行间债券市场回购利率的ARCH/GARCH模型及其波动性分析[J]. 系统工程, 2002, 20(005):88-91.
[5]白噪声序列:吴玉霞, 温欣. 基于ARIMA模型的短期股票价格预测[J]. 统计与决策, 2016, 000(023):83-86.
[6]平稳序列:吴玉霞, 温欣. 基于ARIMA模型的短期股票价格预测[J]. 统计与决策, 2016, 000(023):83-86.
[7]https://www.zhihu.com/search?type=content&q=Q-Q%E5%9B%BE