首页 > Python资料 博客日记
PCA分析(主成分分析)--结果解读
2024-07-03 04:00:05Python资料围观159次
主成分分析(PCA)是一个很好的工具,可以用来降低特征空间的维数。PCA的显著优点是它能产生不相关的特征,并能提高模型的性能。
PCA用于减少用于训练模型的特征维度数量,它通过从多个特征构造所谓的主成分(PC)来实现这一点。
PC的构造方式使得PC1方向在最大变化上尽可能地解释了你的特征,然后PC2在最大变化上尽可能地解释剩余特征,PC1和PC2通常可以解释总体特征变化中的绝大部分信息。
PCA它允许我们在二维平面上可视化数据的分类能力
PC(主成分)A(分析)
一、得分图
得分图是最常用的主成分分析的图,对于一些较好的结果能够将不同的散点进行聚集并将同类型的散点看为一个整体,如上图所示一共三个整体,粉色整体与其余两个整体相距较远,因此分别与二则差异显著,而绿色和紫色整体间部分重叠即相聚较近因此样本点9的相似度较高,差异不显著。
二、碎石图
碎石图的作用之一就是能够让你在选择PC时进行提前抉择,看到底是选择PC1与PC2组合还是选择PC1与PC2组合和PC2与PC3组合......,而选择原则就是根据累计贡献率,一般认为60%是最低标准。贡献率:是指某个组成份方差除以所有主成分的方差之和,其具有最大贡献率的为PC1依次类推。方差最大的为PC1,第二大的为PC2依次类推。
补充:主成分的个数都是自己预先色设定好的,比如三种鲜花中的数据分别包含其花瓣长度、宽度、叶片长度、宽度等数十个指标,但其主成分为3个,即为其鲜花种类。这里理解起来可能比较抽象,但是大家可以想一下为什么我们要使用这个方法?我们用PCA分析的目的就是实现降维处理数据,比如三种鲜花数十个指标我们如果一一进行方差分析这将是无比巨大的工作量,而且也不一定能将结果讲的清楚,我们在图像中利用主成分在横轴和纵轴另这一个线性组合整体代表了以前一值为横坐标和纵坐标的情形。
三、载荷图
不管是组成份1(PC1)还是PC2,都是完全包含各个度量指标的,而PC的e个数在这个例子中是由花种类决定的且二者相等。
PC轴坐标代表的实际意义如图所示,按照对应关系分别为线性组合的系数,同时足矣相关性的描述(越近正相关性越强)
##素材来源:
标签:
相关文章
最新发布
- 【Python】selenium安装+Microsoft Edge驱动器下载配置流程
- Python 中自动打开网页并点击[自动化脚本],Selenium
- Anaconda基础使用
- 【Python】成功解决 TypeError: ‘<‘ not supported between instances of ‘str’ and ‘int’
- manim边学边做--三维的点和线
- CPython是最常用的Python解释器之一,也是Python官方实现。它是用C语言编写的,旨在提供一个高效且易于使用的Python解释器。
- Anaconda安装配置Jupyter(2024最新版)
- Python中读取Excel最快的几种方法!
- Python某城市美食商家爬虫数据可视化分析和推荐查询系统毕业设计论文开题报告
- 如何使用 Python 批量检测和转换 JSONL 文件编码为 UTF-8
点击排行
- 版本匹配指南:Numpy版本和Python版本的对应关系
- 版本匹配指南:PyTorch版本、torchvision 版本和Python版本的对应关系
- Python 可视化 web 神器:streamlit、Gradio、dash、nicegui;低代码 Python Web 框架:PyWebIO
- 相关性分析——Pearson相关系数+热力图(附data和Python完整代码)
- Python与PyTorch的版本对应
- Anaconda版本和Python版本对应关系(持续更新...)
- Python pyinstaller打包exe最完整教程
- Windows上安装 Python 环境并配置环境变量 (超详细教程)