3d-DNA&juicer下载
**conda activate hifi
##3d-dna**
wget <https://github.com/aidenlab/3d-dna/archive/refs/tags/201008.tar.gz>
tar zxvf 201008.tar.gz
**##juicer**
git clone <https://github.com/theaidenlab/juicer.git>
cd juicer
ln -s CPU scripts
cd scripts/common
wget <https://hicfiles.tc4ga.com/public/juicer/juicer_tools.1.9.9_jcuda.0.8.jar>
ln -s juicer_tools.1.9.9_jcuda.0.8.jar juicer_tools.jar
要求环境
LastZ (version 1.03.73 released 20150708) – for diploid mode only
Java version >=1.7
Bash >=4
GNU Awk >=4.0.2
GNU coreutils sort >=8.11
3D-DNA的使用
#根据asm结果获得contig
awk '/^S/{print ">"$2;print $3}' no_chloroplast_lh_green.hic.p_ctg.gfa > lh_green.fa
#为基因组创建索引
bwa index lh_green.fa ##bwa版本0.7.18
#根据基因组构建创建可能的酶切位点文件
python ./hic/juicer-1.6/misc/generate_site_positions.py MboI lh_green lh_green.fa
#获取每条contig的长度
awk 'BEGIN{OFS="\\t"}{print $1, $NF}' lh_green_MboI.txt > genome.chrom.sizes
#运行juicer
bash ./hic/juicer-1.6/scripts/juicer.sh -d ./rawfile -D ./hic/juicer-1.6/ -z ./lh_green.fa -y ./lh_green_MboI.txt -p ./genome.chrom.sizes -s MboI -t 70
# -g: 自定义名称
# -s: 酶切类型(询问公司), HindIII(AAGCTAGCTT), MboI(GATCGATC) , DpnII(GATCGATC), NcoI(CCATGCATGG),具体是什么酶切类型可以咨询测序公司
# -z : 参考基因组文件
# -y: 限制性酶切位点文件位置
# -p: 染色体大小文件
# -C: 将原来的文件进行拆分,必须是4的倍数,默认是90000000, 即22.5M reads
# -S: 和任务重运行有关,从中途的某一步开始,"merge", "dedup", "final", "postproc" 或 "early"
# -d: Hi-C 数据的存放目录
# -D: juicer的位置目录,我本人在/home/lixingze/software/juicer/
# -t: 线程数
##如若出现报错,自行在splits文件夹中对hic数据进行
ln -sf ../fastq/xz1_no_chloroplast_R2.fastq.gz
ln -sf ../fastq/xz1_no_chloroplast_R1.fastq.gz
##运行3d-dna
bash /backup/liuli/green/hifi/3d-dna-master/run-asm-pipeline.sh -r 2 lh_green.fa /backup/liuli/green/rawfile/aligned/merged_nodups.txt
USAGE: ./run-asm-pipeline.sh [options] <path_to_input_fasta> <path_to_input_mnd>
# <path_to_input_fasta> 输入参考基因组序列文件
# <path_to_input_mnd> 输入之前分析得到的merged_nodups.txt
# -m haploid/diploid 以特定模式运行,单倍体或二倍体(默认为单倍体)
# -i input_size 指定阈值输入Contigs/scaffolds大小(默认值为15000)。小于输入值的Contigs/scaffolds将被忽略。
# -r 2 指定错误联接更正的迭代轮数(默认值为2)。
# -s stage 快进到以后的组装步骤,可以进行polish, split, seal, merge, finalize
juicebox调整3d-DNA输出的结果
得到lh_green..hic和lh_green..assembly,导入到juicebox
lh_green.*.hic的导入


lh_green.*.assembly的导入

如若结果不好,可更换hic和assembly的版本
只需关注染色体之间的互作行为,完成染色体边界的划分
蓝色为染色体边界

蓝色箭头所指序列应该为下方染色体,左看右看都与下方染色体有互作,因此应当划分到下方。
再次运行3d-DNA
bash /backup/liuli/green/hifi/3d-dna-master/run-asm-pipeline-post-review.sh -r lh_green_san.review.assembly lh_green.fa ./rawfile/aligned/merged_nodups.txt