一个回归分析的步骤:
1. 用scat x y
查看散点图
2. 使用适当的模型进行回归分析 ls
,估计出参数
3. 统计检验,包括拟合优度检验和模型显著性检验
4. 时间序列数据要做自相关性分析,横截面数据做异方差性检验
4. 检查是否有多重共线性
5. 用结果来分析现实情况
先找到数据,巧妇难为无米之炊;
如果找不到数据,试着把问题放大,比如找不到电影数据,将其放大,去找旅游业的数据
自相关性分析
两种主要方法:
1. 看图
2. DW方法
看图,意思是看残差曲线,如果曲线呈现了先正后负后又正,那么很可能存在自相关性;
DW方法:
全名Durbin-Watson检验,在ls
结束以后的分析数据当中就有它,经验上有如下的判断方法:
1. DW<1: 存在正的自相关性
2. DW>3: 存在负的自相关性
3. 1.5 < DW < 2.5: 不相关
所以处理自相关性的目标就是要让这个DW值尽量达到1.5和2.5之间。
一阶广义查分法:
ls y c x ar(1)
就这么输入即可,你会发现在这之后DW的值慢慢靠近1.5和2.5的范围了,如果仍然未达到要求,可以用多阶,在ar()
括号里面写2,3…