一、简介

1.本篇博文是一篇关于线性回归的基本操作;时间序列的平稳性检验、协整检验和误差修正模型(在下一篇博文里延续传送门)等的博文。

2.博主是一个普普通通的大学生,没有很厉害的技术,写的内容都是不太正经的偏小白简单的,写的也是学校教过的知识消化后自己的见解,不是很学术研究的博文。

3.配置:Window 7旗舰版+64位操作系统+StataIC 14(64-bit)

二、数据描述性统计分析

1.导入数据

(1)打开StataIC软件,在软件的上栏目中找到下图圈出的图标,那个图标就是导入数据的入口

python 平稳性检验 平稳性检验excel_变量名


(2)点进去之后,StataIC软件会新弹出另一个窗口出来给你放数据,如下图。

python 平稳性检验 平稳性检验excel_变量名_02


(3)一般下载到的数据都是Excel文件格式的xsl文件,是无法直接用StataIC打开的。我们可以打开Excel文件,把需要的数据选择之后复制,再打开StataIC的数据界面粘贴。粘贴后StataIC会弹一个提示窗口,你只需按红色圈起来的那个Variable names的按钮就能把数据导入StataIC。因为有时候数据的第一行是变量名 (例:x,y,z),你就需要选Variable names;但你的x,y,z之类的变量是要作为数据的,就选择Data按钮。

python 平稳性检验 平稳性检验excel_python 平稳性检验_03


(5)最后导入成功数据就会出现下图页面。

python 平稳性检验 平稳性检验excel_变量名_04

2.设置时间序列

(1)tsset是定义数据是一个时间序列数据。如果想对数据文件定义year为时间变量,则输入命令:

tsset year

若你的数据文件里的时间变量名不为year,你就需要用你的变量名去替换掉我给的命令里的year,如:

tsset ***                  #***代表你的时间变量名

(2)输入命令,命令输入的地方在StataIC软件的最先下面,输入之后Enter键即可。

python 平稳性检验 平稳性检验excel_stata 数据分析_05


StatarIC对输入的内容有要求,和Java一样,不能用中字输入法去输入英文字符串,不然StataIC软件会报错。

(3)时间序列设置成功就会显示如下图:

python 平稳性检验 平稳性检验excel_数据_06


如果没有成功,输入栏上方就会显示红色英文句子。但一般出现短横线(如:-)即说明命令成功。

3.数据描述性统计分析

  1. 命令:sum

    结果如下图所示:
  2. 命令:sum 变量1 变量2,detail (更详细的描述性统计分析)

    结果如下图所示:

三、绘图——趋势图和散点图

1. 趋势图

  1. 命令:
line varname,title(图表名)xtitle(变量x的名称)ytitle(xxx)     #若是不需要显示名称,让括号里面为空即可
  1. 例:

命令:

line gdpr consr year,title(增长率)xtitle(年)ytitle()

python 平稳性检验 平稳性检验excel_时间序列_07


绘图结果会以新的窗口形式弹出来,结果如下图显示:

python 平稳性检验 平稳性检验excel_变量名_08

2、散点图

  1. 第一种:

(1)命令:

twoway(scatter varname1 varname2)(lfit varname1 varname2 )      

#varname1 varname2是变量1和变量2的名称的意思
  • 其中“ lfit"表示”linear fit"(线性拟合),形状为直线。
  • 如果想在散点图上同时画出二次回归曲线,直接将“ lfit"改为“qfit",(二次拟合),形状为曲线。

(2)例一(lfit):

输入命令:twoway (scatter infla unemp) (lfit infla unemp)

python 平稳性检验 平稳性检验excel_stata 数据分析_09


结果如下图所示:

python 平稳性检验 平稳性检验excel_stata 数据分析_10

(3)例二(qfit):

输入命令:twoway (scatter infla unemp) (qfit infla unemp)

python 平稳性检验 平稳性检验excel_变量名_11


结果如下图所示:

python 平稳性检验 平稳性检验excel_stata 数据分析_12


要区别于例一,一个为lfit,一个为qfit。

  1. 第二种:

(1)命令:

aaplot varname1 varname2               #varname1 varname2是变量1和变量2的名称的意思
  • 第一步:先安装外部命令aaplot,输入命令:ssc install aaplot
  • 第二步:输入命令 aaplot varname1 varname2

(2) 例:

输入命令:aaplot infla unemp

python 平稳性检验 平稳性检验excel_时间序列_13


结果如下图所示:

python 平稳性检验 平稳性检验excel_时间序列_14

3.变量差分后的趋势图

  1. 命令:
line dvarname1 dvarname2 时间变量名
  1. 例:

输入命令line dinfla dunemp year:

python 平稳性检验 平稳性检验excel_数据_15


结果如下图所示:

python 平稳性检验 平稳性检验excel_python 平稳性检验_16

四、数据相关性分析

第一步:

  1. 命令:
correlate varname1 varname2                #varname1 varname2是变量1和变量2的名称的意思
  1. 1.例:
    输入命令:correlate gdpr consr
  2. python 平稳性检验 平稳性检验excel_数据_17

  3. 结果如下图所示:
  4. python 平稳性检验 平稳性检验excel_python 平稳性检验_18


第二步:

  1. 命令:
pwcorr varname1 varname2,sig
  1. 1例:
    输入命令pwcorr gdpr consr,sig:
  2. python 平稳性检验 平稳性检验excel_python 平稳性检验_19

  3. 结果如下图所示:
  4. python 平稳性检验 平稳性检验excel_时间序列_20


五、数据平稳性分析

1.单位根检验

  1. 命令:
dfuller varname

例:

  • (1)输入命令(检验第一个变量gdpr)dfuller gdpr:
  • python 平稳性检验 平稳性检验excel_时间序列_21

  • 结果如下图所示:
    结论:gdpr不平稳
  • python 平稳性检验 平稳性检验excel_时间序列_22

  • (2)输入命令(检验第一个变量consr) dfuller consr:
  • python 平稳性检验 平稳性检验excel_python 平稳性检验_23

  • 结果如下图所示:
    结论:consr不平稳
  • python 平稳性检验 平稳性检验excel_python 平稳性检验_24

2.CF和PACF图

  1. 绘制自相关图,命令:
ac varname
  1. 绘制偏自相关图,命令:
pac varname
  1. 例一:
    (1)输入命令ac gdpr(做gdpr的自相关图):
  2. python 平稳性检验 平稳性检验excel_时间序列_25

  3. 结果如下图所示:
  4. python 平稳性检验 平稳性检验excel_stata 数据分析_26

  5. (2)输入命令ac consr(做consr的自相关图):
  6. python 平稳性检验 平稳性检验excel_stata 数据分析_27

  7. 结果如下图所示:
  8. python 平稳性检验 平稳性检验excel_python 平稳性检验_28


  9. 例二
    (1)输入命令pac infla:
  10. python 平稳性检验 平稳性检验excel_变量名_29

  11. 结果如下图所示:
  12. python 平稳性检验 平稳性检验excel_变量名_30

  13. (2)输入命令pac unemp:
  14. python 平稳性检验 平稳性检验excel_时间序列_31

  15. 结果如下图所示:
  16. python 平稳性检验 平稳性检验excel_时间序列_32


3.若序列不平稳,生成差分变量,再做单位根检验

  1. 生成差分变量

命令:

gen dvarname1=d.varname1                        #别忘了变量名前的d
gen dvarname2=d.varname2                        #varname1 varname2是变量1和变量2的名称的意思

例:

(1) 输入命令:

gen dgdpr=d.gdpr

gen dconsr=d.consr

python 平稳性检验 平稳性检验excel_stata 数据分析_33


python 平稳性检验 平稳性检验excel_python 平稳性检验_34


结果如下图所示:

python 平稳性检验 平稳性检验excel_python 平稳性检验_35


2. 对差分后的新变量,做单位根检验:

命令:

dfuller dvarname1                #别忘了变量名前的d

例:

  1. 输入命令:dfuller dgdpr
  2. python 平稳性检验 平稳性检验excel_时间序列_36

  3. 结果如下图所示:
    结论:dgdpr平稳
  4. python 平稳性检验 平稳性检验excel_数据_37

  5. 输入命令:dfuller dconsr
  6. python 平稳性检验 平稳性检验excel_变量名_38

  7. 结果如下图所示:
    结论:dconsr不平稳
  8. python 平稳性检验 平稳性检验excel_python 平稳性检验_39


六、总结
  • 由于俩时间序列是非平稳的,gdpr和consr都是一阶单整的。

七、后续

  • 下一篇博文会在这篇博文的基础上写关于协整检验和误差修正模型的操作。

python 平稳性检验 平稳性检验excel_数据_40


码字总结不易,点个赞吧(*・ω< )