二代组装

单样本组装对计算资源的需求相对较小，推荐使用组装质量最好的MetaSPAdes。共组装一般输入数据量很大，推荐使用Megahit

MEGAHIT

conda activate meta

megahit -1 pe_1.fq -2 pe_2.fq -o out --presets meta-large

--kmin-1pass ：如果排序深度较低且构建 k_min 图时使用的内存过多

--presets meta-large ：如果宏基因组很复杂（即生物多样性很高，例如土壤宏基因组）

--cleaning-rounds 1 --disconnect-ratio 0 ：获得较少的修剪装配（通常是较短的重叠群）

参考：https://github.com/voutcn/megahit?tab=readme-ov-file

SPAdes组装二代、三代测序数据

illumination：原始数据，三代组装好的数据

##illumina混合nanopore组装：

./spades.py -1 [illumina1.fq] -2 [illumina2.fq] --nanopore[ont.fasta] -t 52 -m 400 -o hybrid_nanopore

##illumina混合pacbio组装：

./spades.py -1 [illumina1.fq] -2 [illumina2.fq] --pacbio [pacbio.fa] -t 52 -m 400 -o hybrid_pacbio

singularity 版本

singularity pull spades.sif docker://docker-0.unsee.tech/pegi3s/spades
singularity exec  spades.sif spades.py \\
        -o hybridSPAdes \\
        --meta \\
        -1 /home/liuli/liuli/new/liuli/meta/illumiona/L1EHK3003588-LH_meta1.R1.clean.fastq \\
        -2 /home/liuli/liuli/new/liuli/meta/illumiona/L1EHK3003588-LH_meta1.R2.clean.fastq \\
        --nanopore ./LH_meta1.ont.fq \\
        -t 70 -m 900 \\
        ****-k 21,31,41,61,81,101,121
 sbatch --job-name=hisat2 --nodes=1 --ntasks=1 --cpus-per-task=4  --account=liuli  --wrap="/usr/bin/singularity exec  spades.sif spades.py -o cleanSPAdes_retry --meta -1 ./READ_QC/final_pure_reads_1.fastq -2 ./READ_QC/final_pure_reads_2.fastq --nanopore ./LH_meta1.ont.fq -t 70 -m 100 --only-assembler"

参考：https://www.jianshu.com/p/f2bbca9a3fe3

三代组装

flye --nano-raw lh_meta1.fasta --out-dir out_lh --threads 16

Oxford Nanopore

常规 ONT 数据的默认模式是 --nano-raw

最新 ONT 数据库，请使用新的 --nano-hq 模式

对于 Q20 data, use a combination of --nano-hq and --read-error 0.03

如果有纠错 ONT 读取（使用 Canu 等方法），请使用 --nano-corr