偏相关分析和多元回归分析偏相关分析步骤

转载

小屁孩 2024-03-21 14:23:46

偏相关分析和多元回归分析偏相关分析步骤_偏相关分析和多元回归分析

NO.03

ZEYI

06.2020

正文共： 2291字

预计阅读时间： 6分钟

嘿喽，我是则已。这是stata的第三期学习。

偏相关分析和多元回归分析偏相关分析步骤_多元相关性分析_02

前面学习了非参数检验，方差分析。今天来这学习：相关分析、主成分分析与因子分析。划线部分是自己要研究的变量。相关分析

偏相关分析和多元回归分析偏相关分析步骤_主成分分析matlab代码_03

研究各个变量之间的关系。不考虑变量之间的因果关系只研究其中的相关关系。方法有：简单相关分析，偏相关分析。 01

简单相关分析简单相关分析是将研究变量的线性相关程度并用统计指标表示出来。

偏相关分析和多元回归分析偏相关分析步骤_因子分析最少要有几个因子_04

输入命令:correlate month tem hour 得到结果如下：

偏相关分析和多元回归分析偏相关分析步骤_主成分分析matlab代码_05

结果分析:平均日照和温度具有较高的正相关性。还可以获取方差和协方差矩阵：correlatemonth tem hour,covariance

偏相关分析和多元回归分析偏相关分析步骤_两个特征是独立好还是正相关好_06

最后来检验相关性的显著性：pwcorr month tem hour,sig

偏相关分析和多元回归分析偏相关分析步骤_偏相关分析和多元回归分析_07

结果分析：month和tem相关性检验分析的P值是为0.3096，与hour是0.8687，hour与tem的是0.043。还有一种更精确的方法检验显著性：pwcorr month tem hour,sidak sig

偏相关分析和多元回归分析偏相关分析步骤_主成分分析matlab代码_08

结果分析：相关性的P值都有显著提高。

偏相关分析和多元回归分析偏相关分析步骤_主成分分析matlab代码_09

偏相关分析因为需要进行相关性分析的变量的取值会同时受到其他变量的影响，这时候需要把其他变量控制住，然后再分析变量的系数。

偏相关分析和多元回归分析偏相关分析步骤_多元相关性分析_10

输入命令: pcorr YW SX IQ 得到结果如下：

偏相关分析和多元回归分析偏相关分析步骤_多元相关性分析_11

结果分析：第一列可以得到偏相关系数p.corr，最后一列可得到显著性水平value。

偏相关分析和多元回归分析偏相关分析步骤_主成分分析matlab代码_09

在相关分析我们学习简单相关分析，偏相关分析。接下来是主成分分析与因子分析。

主成分分析与因子分析

偏相关分析和多元回归分析偏相关分析步骤_主成分分析matlab代码_03

变量特别多，之间还存在很强的相关关系或信息重叠，直接分析带来大量工作量，在不损失大量信息的前提下，用独立的较少变量替代原变量进行分析的方法叫主成分分析法与因子分析法。 01

主成分分析主成分分析是在较强相关关系的情况，带来多重共线性问题。将众多初始变量整合成少数几个相互无关的主成分变量，代替以前变量进行分析

偏相关分析和多元回归分析偏相关分析步骤_两个特征是独立好还是正相关好_14

先看看几个变量之间的关系，故进行相关性分析：correlate V2-V19 得到结果如下：

偏相关分析和多元回归分析偏相关分析步骤_多元相关性分析_15

结果分析:可以发现有些变量的相关性是非常高的，适合主成分分析法主成分分析：pca V2-V19

偏相关分析和多元回归分析偏相关分析步骤_因子分析最少要有几个因子_16

偏相关分析和多元回归分析偏相关分析步骤_主成分分析matlab代码_17

结果分析：ei指特征值指主成分的解释能力，特征值越大，表明主成分成分解释能力越强。pro指贡献率，贡献率越大，例如0.8023这个主成分解释了80%的数据的信息。cumulative指累计贡献率。最后一个表示各个主成分的表达式，即它如何由原先变量组合出来的。我们保留几个特征值大于1的主成分来建立模型：pca V2-V19,mineigen(1)

偏相关分析和多元回归分析偏相关分析步骤_主成分分析matlab代码_18

偏相关分析和多元回归分析偏相关分析步骤_两个特征是独立好还是正相关好_19

结果分析：可以看出只保留了两个主成分进行分析。unexplained指该变量未被系统提取的两个主成分所解释的比例。例如V2就损失比较大，大概有72%。当然我们也可以按照意愿限定提取主成分的个数，例如提取一个： pca V2-V19,components(1)

偏相关分析和多元回归分析偏相关分析步骤_多元相关性分析_20

偏相关分析和多元回归分析偏相关分析步骤_主成分分析matlab代码_09

因子分析法可以视为主成分分析法的深化，研究具有错综复杂关系的数据指标如何受少数几个内在的独立因子所支配，多用于处理多元分析中的降维处理。主要介绍主成分因子分析法。主成分因子分析法

偏相关分析和多元回归分析偏相关分析步骤_两个特征是独立好还是正相关好_22

输入命令:factor V2-V7,pcf 得到结果如下：

偏相关分析和多元回归分析偏相关分析步骤_因子分析最少要有几个因子_23

结果分析: LR卡方值是100.47。P值为0意味着模型非常显著。模型总共提取了六个因子，其中只有前两个因子的特征值是大于1的。Pro指因子的方差贡献率。提取的第一个公因子对V5解释力度小于对其他变量的解释力度。从uniqueness可以看出数据损失的信息量是比较小的。对因子结构进行旋转：rotate

偏相关分析和多元回归分析偏相关分析步骤_偏相关分析和多元回归分析_24

结果分析：最上部是旋转一般情况说明，第二部分表明旋转后一共提取了两个因子，卡方值和P值表明模型显著，第三部分是说明变量未被解释部分，和旋转的两个主因子对各个变量的解释程度。最后一部分因子旋转的情况，发现提取的两个公因子之间不存在相关关系。绘制因子旋转后的因子载荷图：loadingplot,factors(2) yline(0) xline(0)

偏相关分析和多元回归分析偏相关分析步骤_偏相关分析和多元回归分析_25