系数显示格式:选择“按大小排序”;
(5)结果
①相关性矩阵
主成分分析要求变量之间存在较强的相关性,如果原始变量之间的相关性较弱,就不适合使用主成分分析。
一般认为,当原始数据大部分变量的相关系数小于0.3,就不适合使用主成分分析;
本案例的相关性矩阵,大部分变量的相关系数大于0.3,可以使用主成分分析;
②KMO和Bartlett检验
原始数据之间的相关性分析,除了使用上面的相关性矩阵外,还需要进行相关性检验,也就是KMO和Bartlett检验。
一般要求KMO值应该大于等于0.6;
Bartlett检验的Sig值应该小于等于0.05;
本案例中KMO值维0.734,Bartlett检验的Sig值维0.000,进一步说明数据可以使用主成分分析;
③总方差解释
有几个变量就有几个主成分;
本案例一共有8个变量,一共有8个主成分;
“总计”栏下面的值就是相关性矩阵的特征值;例如第一个主成分的特征值是4.281,第二个主成分的特征值是1.252;
每个变量的特征值是1,现在有8个变量,总的特征值就是8;
那么第一主成分的方差百分比就是4.281/8=0.5351=53.51%;
第二主成分的方差百分比就是1.252/8=0.1565=15.65%;
第一主成分和第二主成分的累计贡献为53.51%+15.65%=69.16%;
怎样选取主成分的数量:
从总方差解释图,可以得出
前面三个主成分的总方差解释就可以达到82.87%,意思是选取前面的三个主成分就可以解释原来8个变量的82.87%变异量;前面分析了8个变量不便于做散点图,而三个变量就可以做三维的散点图了;
那就意味着用3个新变量,表示原来的8个变量,8个变量降为3个变量,这就是降维;
每个单独变量的特征值是1,如果一个主成分的特征值小于1,就表示这个主成分能能够解释的变异量比单个变量解释的还要少,这种主成分可以不用选择;
从总方差解释图中,得出第一主成分、第二主成分和第三主成分的特征值分别是4.281、1.252和1.096,第四个主成分的特征值是0.580,小于1,所以我们只用选取前面三个主成分即可,通过这种分析方法也可以选取主成分的数量;
⑤ 成分矩阵
成分矩阵又称之为因子载荷矩阵,数字表示的是主成分与对应变量的相关系数,
例如0.838表示的是第一主成分与Zscore(Mg)之间的相关系数是0.838;
从成分矩阵可以看出三个主成分反映的主要变量不同的,用红框表示;
第一主成分与Mg、Fe、K、Zn、Al、Ca和P的相关性较强;
第二主成分与Fe、Al和P的相关性较强;
第三主成分与Na的相关性较强;
⑥ 求主成分的表达式
我们最开始讲过,主成分就是原始变量的线性组合,用下面的方程式来表示:
ym= u1mx1+u2mx2+……+ummxm
从方程式中可以看出,我们只要把umm确定了,主成分就可以确定了,那么umm是怎样计算的,我们把前面的笔记温习一下:
u1……um,就是相关系数矩阵的特征向量;
对于每一个m,都有:
u112+u212+……+um12=1
u122+u222+……+um22=1 ……
u1m2+u2m2+……+umm2=1
主成分的载荷矩阵U与因子载荷矩阵A和特征值λ之间存在一定的数学关系:
也就是说知道A和λ就可以计算出U了,A就是因子载荷矩阵,也就是成分矩阵得到的值;λ就是相关系数矩阵得到的特征值,数据见下方:
先在Excel中把λ进行开方,得到
本文地址:百科问答频道 https://www.neebe.cn/wenda/929212_3.html,易企推百科一个免费的知识分享平台,本站部分文章来网络分享,本着互联网分享的精神,如有涉及到您的权益,请联系我们删除,谢谢!