假设检验
基本原理:全称命题不能被证明为真,但是可以被证伪。
如果我们需要验证一个假设,将它设置为备择假设,它的相反命题作为原假设,认为我们研究的假设的发生是小概率事件。如果可以推翻原假设,说明小概率事件发生了。
t检验
样本的均值是否存在显著差异
样本需要取自能够假设为正态分布的样本(检验正态分布:PP图看分布,偏度、峰度检验,偏度峰度联合检验法(Jarque-Bera),K-S检验)。
F检验
- F检验是检验两个正态分布的样本的方差是否存在显著差异
- 对多组样本之间比较
正定与半正定矩阵
考虑矩阵的特征值。
若所有特征值均不小于零,则称为半正定。
若所有特征值均大于零,则称为正定。
评估离散性的指标
- 方差与标准差、平均差
- 极差、四分位差
- 变异系数(又称“离散系数”(英文:coefficient of variation),是概率分布离散程度的一个归一化量度,其定义为标准差与平均值之比):用于对比两个变量,去量纲了。在进行数据统计分析时,如果变异系数大于15%,则要考虑该数据可能不正常,应该剔除
假定一枚硬币抛出落地后,正面及反面出现的概率分别为1/2,那么抛10次和抛100次硬币(分别称为P10和P100)相比,以下正确的说法是:
P100出现正面多于反面的概率比P10出现正面多于反面的概率大
P100正面次数的方差小于P10出现正面次数的方差
P100出现连续10次以上正面的概率约为1%
P100前10次都是正面的概率比P10前10次都是正面的可能性大
一堆硬币,一个机器人,如果是反的就翻正,如果是正的就抛掷一次,无穷多次后,求 正反的比例()
3:1
2:1
4:1
6:1