收藏流程

基于细菌gbk文件基因组全套注释流程

本流程支持基于细菌基因组GBK文件提取各类基因和注释信息,并进行其他各类功能注释分析。GBK文件可以来自于NCBI等公共数据库平台,也可以是使用各类软件制作的文件。本流程中的GBK文件,可以是细菌基因组完成图(单条染色体或多条染色体,包含或不包含质粒)和扫描图(草图、draft基因组)的GBK文件。

本流程支持基于细菌基因组GBK文件提取各类基因和注释信息,并进行其他各类功能注释分析。GBK文件可以来自于NCBI等公共数据库平台,也可以是使用各类软件制作的文件。本流程中的GBK文件,可以是细菌基因组完成图(单条染色体或多条染色体,包含或不包含质粒)和扫描图(草图、draft基因组)的GBK文件。

基因预测:

CDS预测:Glimmer(http://ccb.jhu.edu/software/glimmer/index.shtml,V3.02)

tRNA预测:tRNAscan-SE(http://trna.ucsc.edu/software/)

rRNA预测:Barrnap(https://github.com/tseemann/barrnap/)

基因功能注释:

比对软件:DIOMAND(V0.9.24.125,http://github.com/bbuchfink/diamond)

比对数据库:

NR:NCBI创建并维护的非冗余蛋白数据库,数据库内容较为全面,可作为基因注释结果的主要参考。

Swiss-Prot(https://web.expasy.org/docs/swiss-prot_guideline.html):由欧洲生物信息学研究所(European Bioinformatics Institute,EBI)维护的非冗余基因数据库,注释结果大多经过实验验证,可靠性较高,但收录基因数量很少。

Pfam(http://pfam.xfam.org/):依赖于由多序列比对和隐马尔可夫模型(HMMs),可给出基因中包含的所有结构域信息。

COG(http://www.ncbi.nlm.nih.gov/COG/):Clusters of Orthologous Groups of Proteins的缩写,可以对预测蛋白进行功能注释、归类以及蛋白进化分析。构成一个COG对应于一个古老的保守结构域,每个COG的蛋白被假定来自于同一个祖先蛋白。

GOhttp://www.geneontology.org/):基因本体论Gene Ontology的缩写,为标准化不同物种、不同数据库的生物学术语而创立的数据库,可获得标准化的功能描述信息。

KEGG(http://www.genome.jp/kegg/):是系统分析基因功能,联系基因组和功能信息的大型知识库,其丰富的通路信息有助于从系统水平去了解基因的生物学功能,例如代谢途径、遗传信息传递以及细胞学过程等一些复杂的生物过程。

基因组圈图绘制:Circos Version 0.69-6(http://www.circos.ca)

特定数据库注释:

基因组岛:IslandViewer 4

前噬菌体:PHASTER

CRISPR-Cas系统:CRISPRFinder

碳水化合物活性酶:CAZy(http://www.cazy.org/)

毒力基因:VFDB

耐药基因:CARD&ResFinder

病原菌与宿主互作:PHI(http://www.phi-base.org/)

跨膜蛋白:TMHMM

转运蛋白:TCDB

分泌蛋白:SignalP(http://www.cbs.dtu.dk/services/SignalP)

次级代谢产物合成基因簇:antiSMASH

基于细菌gbk文件基因组全套注释流程,支持用户自主上传数据,针对上传数据进行全套基因组注释分析,用户可在结果展示页面对所有分析结果分模块进行查看,并可进行结果的筛选、排序、下载等操作。

本流程为Version 1.0版本,上线时间为2025年10月10日。

  • 暂无推荐课程