基因组PHI病原与宿主互作数据库注释,支持基于contig或预测得到的蛋白序列进行PHI数据库注释。
输入文件:
单菌基因组或宏基因组组装结果
蛋白序列文件
小工具结果:
prodigal.csv:
SequenceID:基因组序列的标识符;Feature_Type:特征类型,描述基因组中的特征类型;Start:基因起始位置;End:基因结束位置;GeneID:基因唯一标识符;Direction:基因方向,+表示正向链,-表示反向链;Partial:序列是否是部分序列,通常“00”表示该序列完整;Start_Type:编码区域起始的序列类型(例如:“ATG”表示典型的起始密码子);RBS_Motif:与序列相关的核糖体结合位点(RBS)序列;RBS_Spacer:起始密码子与核糖体结合位点之间的间隔长度(例如:“5-10bp”表示间隔为5到10个碱基对);GC_Content:序列的GC含量,表示序列中鸟嘌呤(G)和胞嘧啶(C)碱基的比例(例如:“0.556”表示56.6%的GC含量)。
gene_phi_anno.csv:
GeneID:基因的唯一标识符;ProteinID:蛋白质的唯一标识符;PHI_MolConn_ID:GenBank标识符;PHI_MolConn_ID:与PHI(Pathogen-Host Interactions,病原体-宿主相互作用)相关的分子连接标识符;Gene_name:基因名称;Pathogen_species:病原物种;Disease_name:引起的疾病名称;Host_description:宿主的描述信息;Experimental_host_species:实验中的宿主物种;Function:基因或蛋白质的功能描述;...
数据库版本:4.18
参考文献:
Martin Urban, Alayne Cuzick, James Seager, Nagashree Nonavinakere, Jahobanta Sahoo, Pallavi Sahu, Vijay Laksmi Iyer, Lokanath Khamari, Manuel Carbajo Martinez, Kim E Hammond-Kosack, PHI-base – the multi-species pathogen–host interaction database in 2025, Nucleic Acids Research, Volume 53, Issue D1, 6 January 2025, Pages D826–D838,
https://doi.org/10.1093/nar/gkae1084当前版本为1.0版本,上架时间为:2025-07-09