分布的类型:卡方分布、t分布、F分布……
分布的参数估计:根据样本估计总体分布的参数(均值,方差……)
- 点估计:均值、方差……
- 区间估计:在要求的置信区间下估计其他参数的区间。
1. 分布估计
对数据整体分布规律的估计,从大体上确定分布的趋势和规律。
(1) 总体分布:利用样本信息推断总体分布规律。
(2) 统计量的分布(抽样分布):由样本确定的诸如样本均值、样本方差等随机变量。三种源于正态分布的抽样分布:2分布(自由度为n的卡方分布为n个正态分布的平方和),t分布(标准正态分布除以卡方分布除以自由度的开方),F分布(卡方分布除以自由度的比)。(注意分位点的计算)
(3) 正态分布的统计量的分布:均值的分布是正态分布,均值等于原均值,标准差等于原标准差除以样本数);样本方差乘以样本数减一除以总体方差的分布为自由度为样本数减一的卡方分布;样本均值减去总体均值的差除以样本标准差除以样本数的开放的商的分布为自由度为样本数减一的t分布;
2. 参数估计
在确定总体分布的基础上,判断总体分布的参数(如方差、均值等)。
(1) 点估计:用样本的某一函数值来估计总体分布中的未知参数。利用计算样本均值作为总体均值。点估计是无偏的。所谓“无偏”,是指在大量重复抽样基础上的均值,是无偏的。因此,需要估计这个估计值距离真实值有多远。即估计值相对真实值的偏差。根据估计量的分布,在一定概率下,给出真实总体参数的可能范围,即区间估计。
(2) 区间估计:区间估计的目的在于提供基于样本得出的点估计与真实总体参数值的接近程度方面的信息。即有多大的置信度 / 置信水平使得某分布的参数在该置信区间内。
3. SPSS中的参数估计
使用描述性统计中的探索: