移动遗传元件 (Mobile genetic elements, MGEs) 如质粒、噬菌体、基因组岛、转座子和插入序列等是能够在细胞内外移动、携带编码特定功能基因的基因组片段,在生物体基因转移和基因重组方面以及物种进化方面起着不可小觑的推动和调节作用,并且一直是研究的热点。MGE 也是横向基因转移事件的指示物,代表着生物体对不同环境的主要适应性机制。
mobileOG-db是一个手动整理的蛋白质家族数据库,介导细菌移动遗传元件和噬菌体的整合/切除、复制/重组/修复、稳定性/防御或转移以及这些过程的相关转录调节因子。mobileOG-db 的创建过程涉及超过 15,000 个手动矫正,目前有 1,558 个参考文献和 2,444 个独特的功能注释。mobileOG-db数据库蛋白质被归入五个主要的移动OG类别之一,代表MGE相关分子机制的关键分支:复制/重组/修复(RRR)、整合/切除(IE)、稳定性/转移/防御(STD)、生物体间转移(T)和噬菌体相关的生物过程(P)。
输入文件:
二代测序组装结果文件,后缀名为*.fasta、*.fa、*.fas、*.fna、*.fnn等。
小工具结果:
mge.mobileOG.Alignment.Out.csv:
Sequence Title:参考序列;Query Title:查询序列;Pident:查询序列与参考序列之间的相似性百分比,值越高表示比对越相似(0-100范围);Bitscore:序列比对的统计量度,用于衡量比对质量(值越高表示比对越显著);mobileOG ID:mobileOG数据库中的唯一标识符,用于标注移动基因元件(如插入序列或噬菌体基因);Gene Name:基因的标准名称或功能描述;Best Hit Accession ID:最佳匹配序列的访问号(如GenBank或UniProt接入号);Major mobileOG Category:mobileOG中基因的主要功能类别;Minor mobileOG Category:mobileOG中基因的次要功能类别(如 "replication/recombination/repair" 表示复制/重组/修复),"NA" 表示无或不适用;Source Database:数据来源的数据库名称(如 "ISFinder" 或 "Plasmid RefSeq");Evidence Type:功能预测的证据类型(如 "Homology" 表示同源性证据,"Manual" 表示手动注释);Contig/ORF Name:重叠群(contig)或开放阅读框(ORF)的标识名称......
mge.summary.csv:
Specific Contig | Integrative elements | Bacteriophages | Insertion sequences | Multiple | Plasmids | Total Number of Hits | Percent Bacteriophages | Percent Insertion sequences | Percent Integrative elements | Percent Plasmids | Percent Multiple | Amount of Unique ORFs |
---|---|---|---|---|---|---|---|---|---|---|---|---|
NC_003318.1 | 0 | 0 | 5 | 1 | 7 | 13 | 0 | 38.46153846153847 | 0 | 53.84615384615385 | 7.6923076923076925 | 5 |
NC_003317.1 | 0 | 0 | 15 | 7 | 19 | 41 | 0 | 36.58536585365854 | 0 | 46.34146341463415 | 17.073170731707318 | 19 |
Specific Contig:被分析的重叠群标识符;Integrative elements:归类为整合性遗传元件的数量(如整合酶、转座子);Bacteriophages:噬菌体相关元件的数量;Insertion sequences:插入序列(IS)元件的数量(如转座酶);Multiple:同时属于多个类别的元件的数量;Plasmids:质粒相关元件的数量;Total Number of Hits:该重叠群中所有检测到的遗传元件总数(各分类数量之和);Percent Bacteriophages:噬菌体元件的百分比(噬菌体数量 / 总匹配数 × 100
);Percent Insertion sequences:插入序列元件的百分比;Percent Integrative elements:整合元件的百分比;Percent Plasmids:质粒元件的百分比;Percent Multiple:多重分类元件的百分比;Amount of Unique ORFs:该重叠群中唯一的开放阅读框(ORF)总数。
参考文献:
Brown C L, Mullet J, Hindi F, et al. mobileOG-db: a manually curated database of protein families mediating the life cycle of bacterial mobile genetic elements[J]. Applied and Environmental Microbiology, 2022, 88(18): e00991-22.
当前版本为1.0版本,上架时间为:2025-07-09