何为对应分析
- 定义:对应分析又称关联分析、R-Q型因子分析,主要是揭示变量样品之间的相互关系的多元统计方法
- 应用场景:主要用于市场细分、产品定位等方面研究
- 条件:变量是名义变量或定序变量,行变量的类别取值与列变量相互独立,行、列变量构成的交叉频数表中不能有0值或负数
- 优点:
- 名义变量划分的类别越多,这种分析的优势越明显
- 可以将名义变量或定序变量转变为间距变量
- 直观的在图形中展示变量各类别间的联系
- 缺点:
- 不能用于相关关系的假设检验
- 分析结果受易受到极端值的影响
- 实质是降维,将原始数据按照一定规则以二维平面图形式展现,在此过程中部分信息会丢失
一、多元对应分析【SP:降维–最优尺度】
情景1:单选与单选
案例背景介绍:
某次调研中,有这样的一些问题:
- QA4_3.综合来讲,您认为一汽马自达品牌怎么样? 10分表示您认为这个品牌非常好,1分表示您认为这个品牌非常不好。打分题
- Q2. 您的性别是?【单选】
4. Q3. 您的学历是?【单选】
- Q4. 您的职业是?【单选】
- Q5. 您的年龄是?【单选】
需求介绍:
对于一汽马自达品牌的评价【QA4_3】分成两种情况,“”1-7“【对一马评价低】”与“8-10”【对一马评价高】,对Q2 Q3 Q4 Q5进行多元对应分析
实际操作:
具体的操作流程如下:
- 针对QA4_3的结果划分成两组,生成新变量NQA4_3
IF (QA4_3 >= 1 & QA4_3 <= 7) NQA4_3=1.
IF (QA4_3 >= 8 & QA4_3 <= 10) NQA4_3=2.
VARIABLE LABELS NQA4_3 '对一马评价'.
VALUE LABELS NQA4_3
1 '对一马评价低'
2 '对一马评价高'.
EXECUTE.
- Q4题的选项15【其他请注明】与实际的需求没有啥用处,需要Missing掉
- 进行多元对应分析
手动操作: - 补充变量:将那些频数结果小的变量但是又不能丢弃的变量可以放到此处
- 语法批量:
MULTIPLE CORRES VARIABLES=NQA4_3 Q2 Q3 Q4 Q5
/ANALYSIS=NQA4_3(WEIGHT=1) Q2(WEIGHT=1) Q3(WEIGHT=1) Q4(WEIGHT=1) Q5(WEIGHT=1)
/MISSING=NQA4_3(PASSIVE,MODEIMPU) Q2(PASSIVE,MODEIMPU) Q3(PASSIVE,MODEIMPU) Q4(PASSIVE,MODEIMPU)
Q5(PASSIVE,MODEIMPU)
/DIMENSION=2
/NORMALIZATION=VPRINCIPAL
/MAXITER=100
/CRITITER=.00001
/PRINT=CORR DISCRIM QUANT(Q2 Q3 Q4 Q5 NQA4_3)
/PLOT=OBJECT(20) JOINTCAT(Q2 Q3 Q4 Q5 NQA4_3) (20)
DISCRIM (20).
通过修改上述语法中的变量名【NQA4_3 Q2 Q3 Q4 Q5】,可以实现批量快速获得所需的分析。
情景2:单选与多选
多选题的处理—数据重组【转置】
VARSTOCASES
/ID=id
/MAKE trans1 FROM QB2_1 QB2_2 QB2_3 QB2_4 QB2_5 QB2_6 QB2_7 QB2_8 QB2_9 QB2_10 QB2_11 QB2_12
QB2_13 QB2_14 QB2_15 QB2_16 QB2_17 QB2_18 QB2_19 QB2_20 QB2_21 QB2_22 QB2_23 QB2_24 QB2_25 QB2_26
QB2_27 QB2_28 QB2_29 QB2_30 QB2_31 QB2_32 QB2_33 QB2_34 QB2_35 QB2_36
/MAKE trans2 FROM QB201_1 QB201_2 QB201_3 QB201_4 QB201_5 QB201_6 QB201_7 QB201_8 QB201_9 QB201_10 QB201_11 QB201_12
QB201_13 QB201_14 QB201_15 QB201_16 QB201_17 QB201_18 QB201_19 QB201_20 QB201_21 QB201_22 QB201_23 QB201_24 QB201_25 QB201_26
QB201_27 QB201_28 QB201_29 QB201_30 QB201_31 QB201_32 QB201_33 QB201_34 QB201_35 QB201_36
/INDEX=索引1(36)
/KEEP= Q2 Q4 Q5 Q7
/NULL=drop.
注释:
- QB2、QB2-1是多选题,转置成单选的形式,转置的结果是trans1、trans2
- keep的意思是要保留那些变量
- null=drop 意思是将空的结果删除
多选题转置结果
由于转置【数据重组】操作是在原始数据库上操作的,因此需要将结果另存为一份新的数据库。后续的操作将在此数据库上操作。
二、简单对应分析【SP:降维–对应分析】
情景1:单选与单选
案例背景介绍:沿用前面的案例,此处不赘述
需求介绍:
以为NQ4_3【低、高】区分,对Q4题职业进行简单对应分析
实际操作:
手动操作:
针对上述的选择变量时有个小技巧,键盘上同时按着Q和4,可快速找到Q4变量。
此处是定义一下变量的取值范围,点击‘更新’。
语法批量:
CORRESPONDENCE TABLE=NQA4_3(1 2) BY Q4(1 14)
/DIMENSIONS=2
/MEASURE=CHISQ
/STANDARDIZE=RCMEAN
/NORMALIZATION=SYMMETRICAL
/PRINT=TABLE RPOINTS CPOINTS
/PLOT=NDIM(1,MAX) BIPLOT(20) RPOINTS(20) CPOINTS(20).
上述操作后没有跑出对应分析。具体的原因应该是只有一个维度,画不出对应分析图来。
情景2:单选与多选
将多选题重组成单选的形式,此时变成单选与单选操作,具体参照单选与单选的简单对应分析的操作步骤,此处不再重复介绍。
需求介绍:
以Q4题职业为区分,对QB2进行简单对应分析
实际操作:
手动操作:
语法批量:
CORRESPONDENCE TABLE=Q4(1 14) BY trans1(1 36)
/DIMENSIONS=2
/MEASURE=CHISQ
/STANDARDIZE=RCMEAN
/NORMALIZATION=SYMMETRICAL
/PRINT=TABLE RPOINTS CPOINTS
/PLOT=NDIM(1,MAX) BIPLOT(20).
三、结果展示【部分展示】