收藏小工具

质粒鉴定(PLASMe)

使用PLASMe软件,从二代测序数据组装结果中鉴定质粒片段。
本流程已累计运行17次。
比较分析
请选择计算文件

运行状态

计算结果

下载计算结果

        质粒是可自我复制的细胞外移动遗传元素,许多细菌和古菌携带质粒。质粒包含编码质粒核心功能(例如转移、复制和分离)的基因,还携带可以帮助宿主在不利环境中更快适应的附属基因,如抗生素抗药(AMR)、毒力基因。这些附属基因可以在宿主间进行水平转移,从而在病原体之间传播AMR基因,极大地威胁人类健康。研究质粒则可以揭示细菌如何获得抗生素抗性特征的机制。
        质粒鉴定主要存在两个挑战。首先,质粒展现出高度的遗传多样性。除了频繁的突变,质粒在进化过程中还经历了大规模的结构变化,如插入、删除和易位。这些快速的突变和结构变化可能导致质粒之间的序列相似性非常低。第二个挑战是质粒和染色体之间共享的基因或片段。质粒和染色体在共同进化过程中频繁发生基因转移。因此,质粒和染色体可以共享高度相似的区域,使得质粒筛选变得困难,特别是对于短contigs。

        PLASMe软件充分利用了基于比对和学习的方法的优势:其中的比对组件可以很容易地识别已知质粒,而使用Transformer 模型可以识别远源的质粒。通过将质粒序列编码为基于蛋白簇的token集定义的“语言”,Transformer可以通过位置编码和注意机制学习蛋白质的重要性及其相关性。

         PLASMe软件由香港城市大学电机工程系孙燕妮老师团队开发,目前软件版本号为Version 1.1。

        PLASMe软件的流程如下图所示。首先,过滤长度小于1k或大于350k的contigs。然后,将它们与质粒数据库使用BLASTN进行比对。如果contigs与参考序列的比对具有高的对齐覆盖度和一致度(默认为),则将其分类为质粒;否则,它们将根据其比对结果分配到相应的目(order),并调用对应的Transformer进行预测。

软件链接:https://github.com/HubertTang/PLASMe

文章信息: PLASMe: a tool to identify PLASMid contigs from short-read assemblies using transformer

                    Nucleic Acids Research, [IF 14.9]DOI:https://doi.org/10.1093/nar/gkad578


使用方法:输入二代测序组装结果文件,后缀名为*.fasta、*.fa、*.fas、*.fna、*.fnn等。

此版本为1.0,上架时间为20250613