主成分分析与应用研究文献综述

 2022-08-26 05:08

主成分分析与应用研究文献综述

摘要:随着科技的发展,事物的发展越来越趋于复杂化,在研究过程中,往往由于事物特征个数太多,且彼此之间存在着一定的相关性,因而使得所观测的数据在一定程度上有信息的重叠。当特征较多时,在高维空间中研究样本的分布规律就更麻烦。而主成分分析是将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法,又称主分量分析。是把多个特征映射为少数几个综合特征,找出几个综合因子来代表原来众多的特征,使这些综合因子尽可能地反映原来的信息,而且彼此之间互不相关,从而达到简化的目的。

关键词:主成分分析,信息,简化

一、引言

主成分分析(principal component analysis,PCA)是多变量分析中最著名的方法技术,其核心是降维。该方法最早是由美国统计学家皮尔逊在1901年的生物学理论研究中引入的。主成分分析法的原理是以较少数的综合变量取代原有的多维变量,使数据结构简化,把原来的指标综合成较少几个主成分,再以这几个主成分的贡献率为权数进行加权平均,构造出一个综合评价函数。1933年,HOTELLING将此想法应用于心理学研究。随后,主成分分析法大量运用在综合指标的评价中,例如城市创新能力综合评价、竞争力评价指标体系等,涉及经济、社会、海洋、安全等多个领域。与其他评价方法相比较,主成分分析法所确定的指标权数是基于数据分析而得到的,具有较好的客观性,能有效排除不相关指标的影响,从而进行有针对性的定量化评价,得出的综合指标之间相互独立,不仅简化了评价体系,而且减少了信息的交叉和冗余。

二、主成分分析基本原理

主成分分析主要是使用降维的方法,使用较少的变量来代替原有的较多的变量。在变量转换过程中,采用了映射的原理。也就是说,较少的变量是原有较多属性变量的线性表示。主成分分析是在模型计算时首先利用最小二乘法原理,抛弃细小的、无序的差异,保留最大的、有序的差异,最终得到只有少数几个主成分的数学模型,并使数据变得简单并容易理解和展示。从主成分的导出和计算上看,主成分是从原始数据的协方差矩阵或者相关系数矩阵出发,主成分的协方差矩阵应该是一个对角矩阵,主成分表达式系数矩阵A应该是一个正交矩阵为条件,导出主成分的协方差矩阵的对角线元素是协方差矩阵或相关矩阵的特征值,主成分的方差就是原始数据协方差矩阵或相关矩阵的特征值,主成分表达式系数就是协方差矩阵或相关矩阵特征值对应的特征向量。第一主成分能够最大限度地反映样本间的差异,是概括指标差异信息的最佳线性函数价,可以用第一主成分对样本综合排序。

三、主成分分析的应用

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。