动态面板模型与R

文章目录

  • 动态面板模型与R
  • @[toc]
  • 1 动态面板模型
  • 2 差分GMM
  • 3 水平GMM
  • 4 系统GMM
  • 5 R操作

1 动态面板模型

含义:线性面板模型中含有被解释变量滞后项。例如
python如何对变量滞后一期处理 解释变量滞后一期_矩阵
其中python如何对变量滞后一期处理 解释变量滞后一期_线性代数_02,python如何对变量滞后一期处理 解释变量滞后一期_线性代数_03python如何对变量滞后一期处理 解释变量滞后一期_矩阵_04为常数,python如何对变量滞后一期处理 解释变量滞后一期_矩阵_05为个体异质性,python如何对变量滞后一期处理 解释变量滞后一期_动态面板_06为扰动项,python如何对变量滞后一期处理 解释变量滞后一期_数据模型_07是常数项,python如何对变量滞后一期处理 解释变量滞后一期_数据模型_08是被解释变量滞后系数;python如何对变量滞后一期处理 解释变量滞后一期_python如何对变量滞后一期处理_09为自变量,python如何对变量滞后一期处理 解释变量滞后一期_矩阵_10为白噪声。称(1)为动态面板数据模型(Dynamic Panel Data,简记DPD)。也称方程(1)为水平方程,即原始方程。显然python如何对变量滞后一期处理 解释变量滞后一期_python如何对变量滞后一期处理_11(无论被解释变量在时间上如何变化,python如何对变量滞后一期处理 解释变量滞后一期_矩阵_05都是其组成部分)。如果按照静态面板的固定效应模型思路,即组内离差变换得到
python如何对变量滞后一期处理 解释变量滞后一期_python如何对变量滞后一期处理_13
其中python如何对变量滞后一期处理 解释变量滞后一期_动态面板_14,python如何对变量滞后一期处理 解释变量滞后一期_动态面板_15,python如何对变量滞后一期处理 解释变量滞后一期_动态面板_16。因此python如何对变量滞后一期处理 解释变量滞后一期_线性代数_17,故组内离差变换仍然存在固有的内生性,将这种内生性称为动态面板偏差。考虑差分变换将个体异质性去除,
python如何对变量滞后一期处理 解释变量滞后一期_线性代数_18
称为动态面板的差分方程;由于
python如何对变量滞后一期处理 解释变量滞后一期_动态面板_19
故使用差分方法后,动态面板的差分方程也存在内生性,且python如何对变量滞后一期处理 解释变量滞后一期_动态面板_20为内生解释变量。


2 差分GMM

在差分方程条件下,给定时间长度为python如何对变量滞后一期处理 解释变量滞后一期_动态面板_21的面板数据,由于python如何对变量滞后一期处理 解释变量滞后一期_python如何对变量滞后一期处理_22为内生变量,扰动项为python如何对变量滞后一期处理 解释变量滞后一期_python如何对变量滞后一期处理_23,因此工具变量可以取python如何对变量滞后一期处理 解释变量滞后一期_python如何对变量滞后一期处理_24,因为它既满足相关性,又满足外生性
python如何对变量滞后一期处理 解释变量滞后一期_数据模型_25
同理,python如何对变量滞后一期处理 解释变量滞后一期_数据模型_26都可视为内生变量python如何对变量滞后一期处理 解释变量滞后一期_数据模型_27的工具变量。这些变量都称作GMM式工具变量。差分方程的GMM式工具变量个数共有
python如何对变量滞后一期处理 解释变量滞后一期_矩阵_28
当然,这里需要假设解释变量python如何对变量滞后一期处理 解释变量滞后一期_数据模型_29是外生的。因此解释变量自身可以视为工具变量(这种工具变量称为标准型工具变量),此时工具变量个数为
python如何对变量滞后一期处理 解释变量滞后一期_python如何对变量滞后一期处理_30
其中python如何对变量滞后一期处理 解释变量滞后一期_数据模型_31为解释变量个数。现考虑差分方程的扰动项的方差协方差是否满足球形扰动假设。由于假定python如何对变量滞后一期处理 解释变量滞后一期_矩阵_10为白噪声,故差分方程(3)中新的扰动项
python如何对变量滞后一期处理 解释变量滞后一期_动态面板_33
一定存在一阶序列相关,证明如下
python如何对变量滞后一期处理 解释变量滞后一期_线性代数_34
但不存在高阶序列相关,证明
python如何对变量滞后一期处理 解释变量滞后一期_python如何对变量滞后一期处理_35
差分方程扰动项的方差
python如何对变量滞后一期处理 解释变量滞后一期_矩阵_36
故新的扰动项的一阶相关系数为
python如何对变量滞后一期处理 解释变量滞后一期_动态面板_37
二阶及以后的自相关系数为0。差分方程的动态面板的扰动项存在自相关,且存在内生性,这里我们用GMM工具变量解决。但是,工具变量个数远大于内生变量个数,需要用广义矩估计(GMM)方法(2SLS是在球形扰动假设下成立的)。对动态面板的差分方程使用GMM估计称作差分GMM估计法。


3 水平GMM

差分GMM的局限是:

  • 假定自变量为前定解释变量,但差分后python如何对变量滞后一期处理 解释变量滞后一期_python如何对变量滞后一期处理_38与差分方差中的扰动项python如何对变量滞后一期处理 解释变量滞后一期_线性代数_39可能存在相关性,进而导致解释变量也存在内生性问题;此时可将原解释变量的滞后项python如何对变量滞后一期处理 解释变量滞后一期_数据模型_40作为python如何对变量滞后一期处理 解释变量滞后一期_线性代数_41的工具变量;
  • 对于时间范围较长的数据,使用GMM式工具变量的个数是关于python如何对变量滞后一期处理 解释变量滞后一期_python如何对变量滞后一期处理_42的二次函数,随着时间跨度变长,工具变量增多,容易导致过度识别问题(因此需要限定GMM工具变量的滞后阶数)
  • 差分GMM方法消除了非时变变量(种族、性别、文化等),无法估计非时变变量的系数
  • 动态面板的持续性使python如何对变量滞后一期处理 解释变量滞后一期_动态面板_43受到过去历史的影响,造成影响的持续性,自回归系数可能趋近1

为解决最后两个问题,Arellano and Bover (1995)在水平方程
python如何对变量滞后一期处理 解释变量滞后一期_矩阵
的基础上,将python如何对变量滞后一期处理 解释变量滞后一期_python如何对变量滞后一期处理_45视为内生变量python如何对变量滞后一期处理 解释变量滞后一期_数据模型_46的工具变量

  • 相关性条件:

python如何对变量滞后一期处理 解释变量滞后一期_动态面板_47

python如何对变量滞后一期处理 解释变量滞后一期_线性代数_48

注:python如何对变量滞后一期处理 解释变量滞后一期_线性代数_49具有持续性。

  • 外生性条件:

python如何对变量滞后一期处理 解释变量滞后一期_动态面板_50

假定等式右边第一部分为0,即个体固定效应与工具变量不相关(现实数据不一定满足);等式右边第二项
python如何对变量滞后一期处理 解释变量滞后一期_动态面板_51
称满足上述条件工具变量满足,使用python如何对变量滞后一期处理 解释变量滞后一期_python如何对变量滞后一期处理_45对水平方差进行GMM估计,称为水平GMM方法


4 系统GMM

系统GMM即将差分GMM与水平GMM结合在一起(Blundell and Bond(1998)),在差分GMM基础上引入新的矩条件
python如何对变量滞后一期处理 解释变量滞后一期_数据模型_53
系统GMM优点与局限

  • 提高估计效率(小样本)
  • 可以估计非时变变量系数
  • 必须满足python如何对变量滞后一期处理 解释变量滞后一期_矩阵_54

5 R操作

第一步:使用计量包plm即可,安装与加载plm,并使用pgmm函数

install.packages("plm")
library(plm)
data("EmplUK", package = "plm") # 加载数据

数据不做介绍了。第二步:

## Arellano and Bond (1991), table 4 col. b
z1 <- pgmm(log(emp) ~ lag(log(emp), 1:2) + lag(log(wage), 0:1)
           + log(capital) + lag(log(output), 0:1) | lag(log(emp), 2:99),
           data = EmplUK, effect = "twoways", model = "twosteps")
summary(z1, robust = FALSE)

# Twoways effects Two steps model
# 
# Call:
# pgmm(formula = log(emp) ~ lag(log(emp), 1:2) + lag(log(wage), 
#      0:1) + log(capital) + lag(log(output), 0:1) | lag(log(emp), 
#         2:99), data = EmplUK, effect = "twoways", model = "twosteps")
# 
# Unbalanced Panel: n = 140, T = 7-9, N = 1031
# 
# Number of Observations Used: 611
# 
# Residuals:
#   Min.    1st Qu.     Median       Mean    3rd Qu.       Max. 
# -0.6190677 -0.0255683  0.0000000 -0.0001339  0.0332013  0.6410272 
# 
# Coefficients:
# Estimate Std. Error  z-value  Pr(>|z|)    
# lag(log(emp), 1:2)1     0.474151   0.085303   5.5584 2.722e-08 ***
# lag(log(emp), 1:2)2    -0.052967   0.027284  -1.9413 0.0522200 .  
# lag(log(wage), 0:1)0   -0.513205   0.049345 -10.4003 < 2.2e-16 ***
# lag(log(wage), 0:1)1    0.224640   0.080063   2.8058 0.0050192 ** 
# log(capital)            0.292723   0.039463   7.4177 1.191e-13 ***
# lag(log(output), 0:1)0  0.609775   0.108524   5.6188 1.923e-08 ***
# lag(log(output), 0:1)1 -0.446373   0.124815  -3.5763 0.0003485 ***
#  ---
# Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
# 
# Sargan test: chisq(25) = 30.11247 (p-value = 0.22011)
# Autocorrelation test (1): normal = -2.427829 (p-value = 0.01519)
# Autocorrelation test (2): normal = -0.3325401 (p-value = 0.73948)
# Wald test for coefficients: chisq(7) = 371.9877 (p-value = < 2.22e-16)
# Wald test for time dummies: chisq(6) = 26.9045 (p-value = 0.0001509)

动态面板主要关注过度识别检验Sargan与自相关AR(1)和AR(2)。怎么检验就不说了,具体方法help(pgmm),太困了不写了。


-END-

参考文献

陈强.高级计量经济学[M].高等教育出版社