股票投资选择中的主成分分析
A. spss中主成分分析
主成分分析,在进行有多个指标的综合评定时,客观全面的综合评价结果非常重要,然而往往多个指标之间通常存在信息不统一或者重复等众多因素,各指标的权重往往很难确认。主成分分析方法能够解决以上问题,主成分分析法是一种降维的统计方法,是考察多个变量间相关性一种多元统计方法。
二、spss主成分分析操作流程
导入数据。将已有数据整理后导入
spss导入数据
主成分分析操作流程。点击分析—降维—因子分析
spss主成分分析
将变量全部导入变量(V)中,点击描述,勾选相关描述性统计分析结果,点击继续。
描述统计
点击抽取—方法主成分—点击相关分析及输出结果,点击继续。
因子分析:抽取
选择得分。
因子得分
因子分析:选择按列表排除个案。最后点击确认按钮。
因子分析:选择
三、spss主成分分析输出结果
解释的总方差图
主成分得分系数
生成的6个主成分因子变量
四、结果解释
主成分分析结果中解释的总方差图看出总的解释力度为82.172%,生成6个新的解释变量,使用成份得分矩阵求F1、F2、F3、F4、F5、F6。
F1=0.077*ZX1+0.077*ZX2+0.078*ZX3+……+0.078*ZX26,
……
F6=-0.102*ZX1-0.484*ZX2-0.100*ZX3+……+0.085*ZX26
其中ZX1表示每个行业及区域指标的条数A变量对应的值
综合评分F的计算如下。
F=(44.741%/82.172%)*F1+(12.237%/82.172%)*F2+……+(4.344%/82.172%)*F6
这样就算出了每个行业及区域的综合排名,其中主成分分析模型解释力度有82.172%。
B. 在spss主成分分析中,如何指定提取的主成分个数,多谢!
因子分析---选项中有一项是特征根植大于1 或者说是指定主成分个数,默认是提取的特征根植为1。
有的时候就是有很多主成分的,你要分析的元素越多,主成分越多。具体是不是多了得看你的题目了。这种问题最好把题目都抛出来才好判断。
(2)股票投资选择中的主成分分析扩展阅读:
以前单独发行的SPSS AnswerTree软件整合进了SPSS平台。笔者几年前在自己的网站上介绍SPSS 11的新功能时,曾经很尖锐地指出SPSS的产品线过于分散。
应当把各种功能较单一的小软件,如AnswerTree、Sample Power等整合到SPSS等几个平台上去。看来SPSS公司也意识到了这一点,而AnswerTree就是在此背景下第一个被彻底整合的产品。
Classification Tree模块基于数据挖掘中发展起来的树结构模型对分类变量或连续变量进行预测,可以方便、快速的对样本进行细分。
而不需要用户有太多的统计专业知识。在市场细分和数据挖掘中有较广泛的应用。已知该模块提供了CHAID、Exhaustive CHAID和C&RT三种算法,在AnswerTree中提供的QUEST算法尚不能肯定是否会被纳入。
C. 在做主成分分析时,选取的主特征是原来数据的哪些特征
主成分分析要求数据接近正态分布,不一定要严格的正态分布条件,一般来说样本量在100以上就基本符合条件。 聚类分析对数据的要求是聚类的各组的组内方差较小,而组间方差较大,正常来说只要方法选择得当,这个要求会比较容易做到的。
D. 主成分分析中的主成分是指哪部分
主成分是标准化后的特征向量和原指标的线性组合,例如
第p主成分:Fp=a1iZX1+a2iZX2+……+apiZXp
其中a1i, a2i, ……,api(i=1,……,m)为X的协方差阵Σ的特征值所对应的特征向量,ZX1, ZX2, ……, ZXp是原始变量经过标准化处理的值,因为在实际应用中,往往存在指标的量纲不同,所以在计算之前须先消除量纲的影响,而将原始数据标准化
E. 主成分分析(PCA)主成分维度怎么选择
成分分析和因子分析有十大区别,在损失很少信息的前提下把多个指标转化为几个不相关的综合指标(主成分),且各个主成分之间互不相关,使得主成: 1.原理不同 主成分分析基本原理:利用降维(线性变换)的思想,即每个主成分都是原始变量的线性组合
F. 如何应用主成分分析剔除多余的变量比如已知7个变量指标,我想选取三四个主要的,该如何进行
Chemical markers’ fishing and knockout for holistic activity and interaction
evaluation of the components in herbal medicines.看看这篇文献,或许有启发。
G. 主成分分析的指标选择
指标太多了,也可能是存在共线性的变量导致的。我用的stata
还是先给原始数据做一下相关性分析,删一些高度相关的变量,避免共线性。
然后给变量标准化后做主成分分析,这一步spss自动就标准化了,如果也是stata的话要记得标准化。我自己这边试的结果是变量多于15类就算不出KMO了,控制在10个左右KMO能算出来,不过最好才0.6,最差0.4了都。。
没办法我的数据太少了,我做的是关于贪官的,数据少很坑……你经济类的应该能到0.7,加油额
H. 一篇文献中主成分分析的问题,急急急
由于我看不太清你的图表写的是什么?不过凭大概,解释一下每一列的意思吧!
第一列:主成分的个数。
第二列:每一个主成分的特征值,特征值越大,表示该主成分在解释原变异量时越重要。
第三列:为每一个因子可以解释变异量的百分比。
第四列:则为所解释变异量的累计百分比。
后面的,就是所提取出的两个主成分,以及解释的变异量、百分比、累计百分比。
I. 如何用主成分分析确定指标权重
1输入数据。
2点Analyze 下拉菜单,选Data Rection 下的Factor 。
3打开Factor Analysis后,将数据变量逐个选中进入Variables 对话框中。
4单击主对话框中的Descriptive按扭,打开Factor Analysis: Descriptives子对话框,在Statistics栏中选择Univariate Descriptives项要求输出个变量的均值与标准差,在Correlation Matrix 栏内选择Coefficients项,要求计算相关系数矩阵,单击Continue按钮返回Factor Analysis主对话框。
5单击主对话框中的Extraction 按钮,打开如下图所示的Factor Analysis: Extraction 子对话框。在Method列表中选择默认因子抽取方法——Principal Components,在Analyze 栏中选择默认的Correlation Matrix 项要求从相关系数矩阵出发求解主成分,在Exact 栏中选择Number of Factors;6, 要求显示所有主成分的得分和所能解释的方差。单击Continue按钮返回Factor Analysis主对话框。
6单击主对话框中的OK 按钮,输出结果。
统计专业研究生工作室原创,请勿复杂粘贴
J. 主成分分析只提取一个主成分可以吗
主成分分析只提取一个主成分是不可以的。应保留多少个主成分要视具体情况,很难一概而论,最终还得依赖于主观判断。当取一个和二个主成分都可行时,取一个的优点是可以对各样品进行综合排序(如果这种排序是有实际意义的)。
如果只提取了一个主成分,可能是数据存在问题,也有可能是这些变量之间本身就存在很强的相关性,所以主成分分析只能提取一个主成分。
(10)股票投资选择中的主成分分析扩展阅读:
主成分分析,是考察多个变量间相关性一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关.通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。
最经典的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(F1)越大,表示F1包含的信息越多。因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分。
如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现在F2中,用数学语言表达就是要求Cov(F1, F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,……,第P个主成分。