单样本组装对计算资源的需求相对较小,推荐使用组装质量最好的MetaSPAdes。共组装一般输入数据量很大,推荐使用Megahit
conda activate meta
megahit -1 pe_1.fq -2 pe_2.fq -o out --presets meta-large
--kmin-1pass :如果排序深度较低且构建 k_min 图时使用的内存过多
--presets meta-large :如果宏基因组很复杂(即生物多样性很高,例如土壤宏基因组)
--cleaning-rounds 1 --disconnect-ratio 0 :获得较少的修剪装配(通常是较短的重叠群)
参考:https://github.com/voutcn/megahit?tab=readme-ov-file
illumination:原始数据,三代组装好的数据
##illumina混合nanopore组装:
./spades.py -1 [illumina1.fq] -2 [illumina2.fq] --nanopore[ont.fasta] -t 52 -m 400 -o hybrid_nanopore
##illumina混合pacbio组装:
./spades.py -1 [illumina1.fq] -2 [illumina2.fq] --pacbio [pacbio.fa] -t 52 -m 400 -o hybrid_pacbio
singularity 版本
singularity pull spades.sif docker://docker-0.unsee.tech/pegi3s/spades
singularity exec spades.sif spades.py \\
-o hybridSPAdes \\
--meta \\
-1 /home/liuli/liuli/new/liuli/meta/illumiona/L1EHK3003588-LH_meta1.R1.clean.fastq \\
-2 /home/liuli/liuli/new/liuli/meta/illumiona/L1EHK3003588-LH_meta1.R2.clean.fastq \\
--nanopore ./LH_meta1.ont.fq \\
-t 70 -m 900 \\
****-k 21,31,41,61,81,101,121
sbatch --job-name=hisat2 --nodes=1 --ntasks=1 --cpus-per-task=4 --account=liuli --wrap="/usr/bin/singularity exec spades.sif spades.py -o cleanSPAdes_retry --meta -1 ./READ_QC/final_pure_reads_1.fastq -2 ./READ_QC/final_pure_reads_2.fastq --nanopore ./LH_meta1.ont.fq -t 70 -m 100 --only-assembler"
参考:https://www.jianshu.com/p/f2bbca9a3fe3
flye --nano-raw lh_meta1.fasta --out-dir out_lh --threads 16
Oxford Nanopore
常规 ONT 数据的默认模式是 --nano-raw
最新 ONT 数据库,请使用新的 --nano-hq 模式
对于 Q20 data, use a combination of --nano-hq and --read-error 0.03
如果有纠错 ONT 读取(使用 Canu 等方法),请使用 --nano-corr