Part1学习内容:
(导论+Stata入门+数学回顾)

  • 区分相关关系、因果关系、逆向因果关系(双向因果关系)
  • 遗漏变量

1 经济数据分类

  • 横截面数据(截面数据)
    指的是多个经济个体的变量在同一时点上的取值。
  • 时间序列数据
    指的是某个经济个体的变量在不同时点上的取值。
  • 面板数据
    指的是多个经济个体的变量在不同时点上的取值。

2 Stata基本命令

  • 查看数据集中的变量名称、标签等:.describe
  • 查看变量a与b的具体数据:. list a b
  • 连续滚屏显示命令运行结果:.set more off
  • 恢复分页显示运行结果:.set more on
  • 查看部分数据:. list a b in 1/5
  • 通过逻辑关系定义数据集的子集:. list a b if a >= 16
  • 删除满足一定条件的观测值:. drop if a >= 16
  • 保留满足一定条件的观测值:. keep if a >= 16
  • 将数据按照变量a的升序排列:. sort a
  • 将数据按照变量a的降序排列:. gsort -a
  • 画直方图:. histogram a, width(1) frequency
  • 查看相关命令帮助:. help histogram
  • 画a与b之间的散点图:. scatter a b
  • 产生新变量:. gen n=_n
  • 显示变量a的经验累积分布函数:. tabulate a
  • 显示a与b之间的相关系数:. pwcorr a b star(.05)

3 数学回顾
3.1 微积分

  • 导数
  • 一元最优化
  • 偏导数
  • 多元最优化
  • 积分

3.2线性代数

  • 矩阵(零矩阵、方阵、对称矩阵、对角矩阵、单位矩阵)
  • 矩阵的转置
  • 向量
  • 矩阵的加法
  • 矩阵的数乘
  • 矩阵的乘法
  • 线性方程组
  • 逆矩阵(可逆矩阵/非退化矩阵)
  • 矩阵的秩
  • 二次型

3.3概率与条件概率

  • 概率
  • 条件概率
  • 独立事件
  • 全概率公式

3.4分布与条件分布

  • 离散型概率分布
  • 连续型概率分布(概率密度函数、累积分布函数)
  • 多维随机向量的概率分布(联合密度函数、边缘密度函数)
  • 条件分布

3.5随机变量的数字特征

  • 若Cov(X,Y)=0,则二者线性不相关
  • Corr(X,Y)相关系数在-1到1之间
  • 原点矩、中心矩
  • 偏度、峰度、超额峰度(正态分布的偏度为0,峰度为3)

3.6迭代期望定律

3.7随机变量无关的三个层次概念

3.8常用连续型统计分布

  • 正态分布
  • 卡方分布
  • t分布
  • F分布(t分布的平方就是F分布)

3.9统计推断的思想