确定研究目的以及确定因变量和自变量

研究目的:建立指数平滑模型,预测接下来的 14 天的数值。

目录

确定研究目的以及确定因变量和自变量

数据预处理

缺失值处理

创建时间序列

分割训练集和测试集

简单指数平滑法构建模型

霍特模型AAN(相加误差,相加趋势,无季节性)

温斯特模型AAA(相加误差,相加趋势,有季节性)

最终模型与预测


数据预处理

缺失值处理

发现存在七个缺失值,用对应序列平均值填充,观察缺失值位置,发现数据出现连续缺失,故取数据前后间隔一个点,取两点的平均值填充。

R语言 幂函数 回归 r语言指数回归_R语言 幂函数 回归

创建时间序列

由实验发现,以365天为一周期,观察加法分解图,发现该序列的会出现明显的断层,周期太长导致大部分数据无法被预测。

R语言 幂函数 回归 r语言指数回归_缺失值_02

以14天为一周期,观察序列图,发现数据呈现较小的长期趋势,明显的季节性。

R语言 幂函数 回归 r语言指数回归_r语言_03

 

R语言 幂函数 回归 r语言指数回归_缺失值_04

观察加法分解图与乘法分解图,两者分解结果一致,故只展示加法分解图,观察到明显的季节性,较小的长期趋势。

R语言 幂函数 回归 r语言指数回归_缺失值_05

分割训练集和测试集

R语言 幂函数 回归 r语言指数回归_r语言_06

简单指数平滑法构建模型

通过ets函数分别构建加法模型和乘法模型,并得出它对应的均方误差。

R语言 幂函数 回归 r语言指数回归_缺失值_07

观察结果得,加法模型的均方误差为167.3827,乘法模型的均方误差为167.4004,可得加法模型优于乘法模型,后续其他模型优先使用加法

霍特模型AAN(相加误差,相加趋势,无季节性)

通过ets函数,以是否添加阻尼趋势分别构建霍特模型,得到对应的均方误差。

R语言 幂函数 回归 r语言指数回归_r语言_08

观察结果得,添加了阻尼趋势的霍特模型,均方误差为166.7646,没有添加阻尼趋势的霍特模型,均方误差为158.602,得出没有添加阻尼趋势的霍特模型优于添加了阻尼趋势的霍特模型。

温斯特模型AAA(相加误差,相加趋势,有季节性)

通过ets函数,以是否添加阻尼趋势分别构建温斯特模型,得到对应的均方误差。

R语言 幂函数 回归 r语言指数回归_R语言 幂函数 回归_09

观察结果得,添加了阻尼趋势的温斯特模型,均方误差为85.89375,没有添加阻尼趋势的温斯特模型,均方误差为84.13115,得出没有添加阻尼趋势的温斯特模型优于添加了阻尼趋势的温斯特模型。

最终模型与预测

通过上述均方误差对比,我们选用不添加阻尼趋势的温斯特模型,并重新使用所有数据集训练并预测,得到预测结果。

结论

判断模型优劣也可以通过summary(),它可以查到更多判断条件,R语言还自带zzz模型可智能选取最优模型,判断条件以AIC标准,AIC越小模型越好,AIC评价模型兼顾了模型的简洁性和精确性,而本次实验仅支持精确性。新人博主,文章有什么不对,还望指正。