主成分分析(PCA)是一种常用的降维方法,主要用于数据处理、分析和特征提取。其目的是通过线性变换将高维数据映射到低维空间,同时尽可能保留数据中的主要信息和特征。例如,将具有多个特征的高维丰度表降维至二维,便于比较组间的总体差异。
输入文件
基因丰度表
一个包含行和列名称的制表符分隔文本文件,其中每一列代表一个样本,每一行代表一个特征(基因、物种、代谢物等)

分组信息表
一个制表符分隔的文本文件,包含行和列名称,列名固定为(SampleID,Category)。第一列为样本名称,第二列为对应样本的分组

输出文件

图中同一组的样本使用相同的颜色和图案。两个样本之间的距离越近,其物种组成结构越相似。因此,群落结构相似性较高的样本往往聚集在一起,而存在显著差异的样本则会相距较远