本工具是使用NCBI开发的SKESA软件对细菌基因组二代测序数据进行高质量组装。
软件版本:Version 2.4.0
软件介绍:
SKESA - Strategic K-mer Extension for Scrupulous Assemblies
SKESA是一款用于微生物基因组的从头序列读长组装器。它采用保守启发式算法,旨在在基因组的重复区域制造断裂。这使得其能够保持出色的序列质量,同时不会显著影响序列的连续性。
软件链接:https://github.com/ncbi/SKESA
软件文章:
Alexandre Souvorov, Richa Agarwala and David J. Lipman. SKESA: strategic k-mer extension for scrupulous assemblies. Genome Biology 2018 19:153. doi.org/10.1186/s13059-018-1540-z
Alexandre Souvorov, Richa Agarwala. SAUTE: sequence assembly using target enrichment. BMC Bioinformatics 22, 375 (2021). doi.org/10.1186/s12859-021-04174-9
特别提示:
(1)本工具主要针对于微生物测序数据进行组装,尤其是细菌基因组数据;
(2)本工具仅支持单个样品的组装,支持使用*.fq、*.fq.gz、*.fastq、*.fastq.gz格式的二代测序数据;
(3)测序量大小不能超过2Gb;
(4)可以提供原始数据,本工具会自动进行质控并生成clean reads用于组装;
(5)二代测序数据支持Illumina测序仪、华大测序仪等主流机型的双末端测序数据,读长PE150、PE250、PE300;
(6)基于二代测序数据组装的结果中,仍旧会含有较多gap,如果要想获得完整基因组,需要对组装结果进行单独的人工优化组装或者使用三代测序数据,基于我们平台微生物基因组的组装分析流程进行组装。
输入文件:
二代原始测序数据
输出结果:
基因组组装结果文件(*_skesa.fasta),推荐使用notepad++打开;
原始数据质控结果(*.html),统计原始数据质控前后的结果,使用网页打开;
此版本为1.0,上架时间为20250616