通过图形来表征数据。通过图形,将数据的特征可视化,包括模式,异常的观测值,随着时间的变化特征,变量间的关系。这种图形化的方法要尽量与其他的预测方法相结合。数据的种类决定了预测时使用的方法,同时也决定了合适的图表技术。

 

时间图

对于时间序列数据,时间图显然是个合适的分析起点。连续的观测值依照时间顺序,用直线连接。下面的图,反映的是Ansett Airlines统计的在澳大利亚两最大城市间的周经济舱乘客数量。

 

深度学习生成的预测图有什么规律_图形化

 

从图中可以得到以下几点:

在1989年的一段时期,没有乘客-----这主要归因于一次产业纠纷。

在1992年,数量有一段减少期。那时正值进行部分经济舱座位更改为商务舱座位的试验。

1991年的下半年,乘客数量大幅增长。

每年开始,都有数量上的大幅减小。主要是受假期影响。

在序列中存在着较长时期的波动,1987年增长,1989年下降,而在1990到1991间又出现增长。

存在一些缺失观测值的时期。

 

任何模型都需要考虑这些特点(因素),以便更高效的预测未来乘客流量。

 

下图是个更简单的时间序列图(澳大利亚抗糖药病药物的月销量)。

 

深度学习生成的预测图有什么规律_数据_02

 

在图中,有着清晰的增长趋势。同时,在增长的同时,有着较为明显的季节性模式。每年年末,都会有一个突降点,主要归因于每年底的政府补贴计划,使得患者(提前)囤积药物。任何对这个序列的预测,都要考虑到季节性模式,同时,这种趋势本身变化的很缓慢。

 

时间序列模式

 

我们使用类似趋势(trend),季节性(seasonal)这样的词,来描述时间序列:

趋势,是数据中很长时期的增长或下降。

例如,上图抗糖药病药物中的增长趋势

 

季节性模式,当这个时间序列受到季节性因素的影响,例如一年中的某个时间点,一周中的某天。

 

周期,存在于数据中非固定长度时间的波动。这些波动归因于经济环境,常与“商业周期”有关。从上面关于经济舱乘客的数据中,一些波动是由于周期性因素。

 

有一点需要特别说明的是,周期性模式(cyclic patterns)和季节性模式(seasonal patterns)的区别。季节性模式有着固定和已知的长度(例如,某个模式对应的时间长度),而周期性模式的长度是可变和未知的。一个周期性的平均长度通常长于季节性的长度,同时,具有更大的变动峰值。

 

许多时间序列,同时包含趋势,周期和季节性。当选择一个预测方法时,我们首先要去识别出数据中的序列模式,然后选择合适的方式去捕获相应模式。