面板数据(Panel Data)是将“截面数据”和“时间序列数据”综合起来的一种数据类型。具有“横截面”和“时间序列”两个维度,当这类数据按两个维度进行排列时,数据都排在一个平面上,与排在一条线上的一维数据有着明显的不同,整个表格像是一个面板,所以称为面板数据(Panel Data)。

        实际上如果从数据结构内在含义上,应该把Panel Data称为“时间序列-截面数据”,更能体现数据结构本质上的特点。该数据为也被称为“纵向数据(Longitudinal Data)”,“平行数据”,“TS-CS数据(Time Series-Cross Section)”。它是截面上个体在不同时间点的重复测量数据。面板数据从横截面(cross section)看,是由若干个体(entity,unit,individual)在某一时点构成的截面观测值,从纵剖面(longitudinal section)看每个个体都是一个时间序列。

     从时空维度来看,可将计量经济学中应用的数据分三类:

1、横截面数据(Cross-sectional data)

  横截面数据是指在某一时点收集的不同对象的数据。它对应同一时点上不同空间(对象)所组成的一维数据集合,研究的是某一时点上的某种经济现象,突出空间(对象)的差异。横截面数据的突出特点就是离散性高。横截面数据体现的是个体的个性,突出个体的差异,通常横截面数据表现的是无规律的而非真正的随机变化。即计量经济学中所谓的“无法观测的异质性”。在分析横截面数据时,应主要注意两个问题:一是异方差问题,由于数据是在某一时期对个体或地域的样本的采集,不同个体或地域本身就存在差异;二是数据的一致性,主要包括变量的样本容量是否一致、样本的取样时期是否一致、数据的统计标准是否一致。

截面数据回归代码 截面数据 回归_横截面数据

图片来源于网络

2、时间序列数据(Time-series data)

  时间序列数据是指对同一对象在不同时间连续观察所取得的数据。它着眼于研究对象在时间顺序上的变化,寻找空间(对象)历时发展的规律。利用时间序列作样本时,要注意几个问题:一是所选择的样本区间内经济行为的一致性问题;二是样本数据在不同样本点之间不可比,需要对原始数据进行调整,消除其不可比因素;三是样本观测值过于集中,因而时间序列数据不适宜于对模型中反映长期变化关系的结构参数的估计;四是模型随机误差的序列相关问题。

截面数据回归代码 截面数据 回归_时间序列数据_02

图片来源于网络

3、纵向数据(Longitudinal data)或面板数据(Panel data)

  面板数据,即Panel Data,是截面数据与时间序列综合起来的一种数据资源。 在分析时,多用PanelData模型,故也被称为面板数据模型. 它可以用于分析各样本在时间序列上组成的数据的特征,它能够综合利用样本信息,通过模型中的参数,既可以分析个体之间的差异情况,又可以描述个体的动态变化特征。

截面数据回归代码 截面数据 回归_截面数据回归代码_03

图片来源于网络

 

举栗一个,栗子来源于网络! 

时间序列数据:北京一年来每天的平均温度。 

截面数据:北京,上海,深圳,广州某一天的平均温度。 

面板数据:北京,上海,深圳,广州这一年来每天的平均温度。  

适用范围:

        时间序列数据:某一个个体随时间变化产生的数据。 

        截面数据:许多个个体在同一个时间下由于个体不同而产生的数据。 

        面板数据:前两个的综合——许多个个体由于个体不同以及时间变化产生的数据。  

分析方法:

        时间序列数据:主要围绕时间变化,可看总体趋势,季节性,周期性,ARIMA(自回归,滑动平均,差分)等。 

        截面数据:主要围绕统计个体区别,可用线性回归,主元分析等。 面板数据:前两个的综合。

 

 

举栗二个,栗子来源于网络! 

如:城市名:北京、上海、重庆、天津的GDP分别为10、11、9、8(单位亿元)。这就是截面数据,在一个时间点处切开,看各个城市的不同就是截面数据。

如:2000、2001、2002、2003、2004各年的北京市GDP分别为8、9、10、11、12(单位亿元)。这就是时间序列,选一个城市,看各个样本时间点的不同就是时间序列。

如:2000、2001、2002、2003、2004各年中国所有直辖市的GDP分别为:

北京市分别为8、9、10、11、12;

上海市分别为9、10、11、12、13;

天津市分别为5、6、7、8、9;

重庆市分别为7、8、9、10、11(单位亿元)。

这就是面板数据。