因子分析(factor analysis)是用少数的不可观察的潜变量表示多数可观察的相关的变量的一种统计方法,是一种降维技术. 做因子分析的前提是自变量之间有相关关系. 这里的潜变量就是我们所求的因子,自变量是因子的表征.

因子分析又分探索性因子分析和验证性因子分析,探索性因子分析是先不假定一堆自变量背后到底有几个因子以及关系,而是通过各种方法试图寻找出具体几个因子及关系. 而验证性因子分析是假设一堆自变量背后有几个因子,试图验证这种假设是否正确.因子分析有两个核心问题,一是如何构造因子变量,二是如何对因子变量进行命名解释。

因子分析模型是把原观测变量分解成公共因子和特殊因子两部分.

其中X是原始变量标准化后的数据,F是公共因子,是特殊因子,A是因子载荷矩阵,不可逆,表示变量X在公共因子F上的载荷,即X与F的相关程度, A中元表示第i个变量在第j个因子上的负荷,也称为投影.

因子分析的一般步骤

将原始数据标准化处理 X

计算相关矩阵C

计算相关矩阵C的特征值 r 和特征向量 U

确定公共因子个数k

构造初始因子载荷矩阵,其中U为r的特征向量

建立因子模型

对初始因子载荷矩阵A进行旋转变换,旋转变换是使初始因子载荷矩阵结构简化,关系明确,使得因子变量更具有可解释性,如果初始因子不相关,可以用方差极大正交旋转,如果初始因子间相关,可以用斜交旋转,进过旋转后得到比较理想的新的因子载荷矩阵A'.

将因子表示成变量的线性组合,其中的系数可以通过最小二乘法得到.

计算因子得分.