随机森林分析是一种广泛应用于分类与回归问题的机器学习方法。该方法通过构建随机森林模型,评估特征对分类的贡献度,挖掘标志性物种、代谢物或基因等关键驱动因子,并筛选出对样本分组预测准确率贡献最高的特征。
1.输入文件
1.1 样本分组与丰度表
一个包含行列名称的制表符分隔文本文件,每行代表一个样本:第一列为样本名称,第二列为分组信息(列名固定为Category),其余各列代表基因(或物种/代谢物等特征)。

2.Output

3.图中仅显示贡献度最高的15个特征,每个特征对应的点越靠近右侧,表示其对分组预测准确率的贡献越大。图中右侧有颜色块表示不同分组(对照组Control和实验组Treatment)中该特征的表达水平(高表达为红色,低表达为绿色)。