Part1学习内容:
(导论+Stata入门+数学回顾)
- 区分相关关系、因果关系、逆向因果关系(双向因果关系)
- 遗漏变量
1 经济数据分类
- 横截面数据(截面数据)
指的是多个经济个体的变量在同一时点上的取值。 - 时间序列数据
指的是某个经济个体的变量在不同时点上的取值。 - 面板数据
指的是多个经济个体的变量在不同时点上的取值。
2 Stata基本命令
- 查看数据集中的变量名称、标签等:.describe
- 查看变量a与b的具体数据:. list a b
- 连续滚屏显示命令运行结果:.set more off
- 恢复分页显示运行结果:.set more on
- 查看部分数据:. list a b in 1/5
- 通过逻辑关系定义数据集的子集:. list a b if a >= 16
- 删除满足一定条件的观测值:. drop if a >= 16
- 保留满足一定条件的观测值:. keep if a >= 16
- 将数据按照变量a的升序排列:. sort a
- 将数据按照变量a的降序排列:. gsort -a
- 画直方图:. histogram a, width(1) frequency
- 查看相关命令帮助:. help histogram
- 画a与b之间的散点图:. scatter a b
- 产生新变量:. gen n=_n
- 显示变量a的经验累积分布函数:. tabulate a
- 显示a与b之间的相关系数:. pwcorr a b star(.05)
3 数学回顾
3.1 微积分
- 导数
- 一元最优化
- 偏导数
- 多元最优化
- 积分
3.2线性代数
- 矩阵(零矩阵、方阵、对称矩阵、对角矩阵、单位矩阵)
- 矩阵的转置
- 向量
- 矩阵的加法
- 矩阵的数乘
- 矩阵的乘法
- 线性方程组
- 逆矩阵(可逆矩阵/非退化矩阵)
- 矩阵的秩
- 二次型
3.3概率与条件概率
- 概率
- 条件概率
- 独立事件
- 全概率公式
3.4分布与条件分布
- 离散型概率分布
- 连续型概率分布(概率密度函数、累积分布函数)
- 多维随机向量的概率分布(联合密度函数、边缘密度函数)
- 条件分布
3.5随机变量的数字特征
- 若Cov(X,Y)=0,则二者线性不相关
- Corr(X,Y)相关系数在-1到1之间
- 原点矩、中心矩
- 偏度、峰度、超额峰度(正态分布的偏度为0,峰度为3)
3.6迭代期望定律
3.7随机变量无关的三个层次概念
3.8常用连续型统计分布
- 正态分布
- 卡方分布
- t分布
- F分布(t分布的平方就是F分布)
3.9统计推断的思想