PICRUSt2 (Phylogenetic Investigation of Communities by Reconstruction of Unobserved States) 是一个从标记基因(一般是16S rRNA)测序数据预测功能丰度的软件。PICRUSt2集成了现有的开放源代码工具,以预测环境采样的16S rRNA基因序列的基因组。 OTU/ASV放置在参考树中,该树用作功能预测的基础。该参考树包含来自整合微生物基因组(IMG)数据库中细菌和古细菌基因组的20,000个完整16S rRNA基因。小工具运行需提交代表序列和制表符分隔特征表。
示例文件:
代表序列,后缀名为*.fasta、*.fa、*.fas、*.fna、*.fnn等

特征表(制表符分隔),每行一个特征(OTU),每列一个样本

小工具结果:
- out.tre,所有OTU代表序列构建的系统发育树文件。
KO_metagenome_out/,该结果路径中记录了细菌群落KO(KEGG Orthology)功能的丰度预测结果。
KO_metagenome_out/seqtab_norm.tsv,对于很多细菌而言,一个个体可能包含多条16S(多拷贝16S),因此在原始OTU 16S rRNA丰度表的基础上,根据物种所含16S rRNA拷贝数对物种丰度进行标准化,得到校正16S rRNA拷贝数后的OTU丰度表。
KO_metagenome_out/pred_metagenome_unstrat.tsv,该文件中即为预测得到的细菌群落功能丰度表,记录了各样本中所包含KO功能的丰度,丰度计算由上述校正16S rRNA拷贝数标准化后的OTU丰度表推断得到。功能以KO ID为名称,代表了特定的功能基因。
KO_metagenome_out/weighted_nsti.tsv,各样本预测功能的加权NSTI值,由OTU的NSTI值通过标准化后的丰度加权所得。
EC_metagenome_out/,该结果路径中记录了细菌群落酶(EC)功能的丰度预测结果。文件结构同上述KO_metagenome_out/,不再展示。
pathways_out/path_abun_unstrat.tsv,上述为预测得到的以KO ID为名称的KO功能,实则代表了特定的功能基因,将这些功能基因映射到具体的KEGG代谢途径(KEGG pathway)中,并统计各途径在各样本中的丰度,获得该表。
KO_predicted.tsv和EC_predicted.tsv,两个矩阵文件中记录了OTU对预测功能丰度的贡献,即可以理解为每个OTU所代表的物种个体基因组中,分别有多少数量的基因与对应的KO功能或酶功能有关。如果期望关注哪些OTU是否对群落功能是重要的,这些表格(该表仅代表了单个物种个体基因组的特征,可能还需结合OTU的丰度信息)可以提供参考
marker_predicted_and_nsti.tsv,记录了OTU代表物种基因组中,16SrRNA拷贝数以及功能预测的NSTI值信息。
Intermediate/,一些中间文件。
参考文献:
Douglas GM, Maffei VJ, Zaneveld JR, Yurgel SN, Brown JR, Taylor CM, Huttenhower C, Langille MGI. PICRUSt2 for prediction of metagenome functions. Nat Biotechnol. 2020 Jun;38(6):685-688. doi: 10.1038/s41587-020-0548-6. PMID: 32483366; PMCID: PMC7365738.
当前版本为1.0版本,上架时间为:2025-05-26
-
-
-
-
-