多序列比对

mafft --anysymbol /home/biyunya/iqtree/xuzhanwu/OG0001136.fa> OG0001136.aln

iqtree建树

先JTT快速建树,然后删除支持值低的树枝

##最佳匹配模型
for i in  $(ls *aln);do ~/iqtree/iqtree-2.2.2.6-Linux/bin/iqtree2 -m MFP -bb 1000 -alrt 1000 -T AUTO -s "$i";done 
##快速方法
for i in  $(ls *aln);do ~/iqtree/iqtree-2.2.2.6-Linux/bin/iqtree2 -m JTT -bb 1000 -alrt 1000 -T AUTO -s "$i";done 

单个文件建树

mafft --anysymbol hds.fa> hds.aln
iqtree2 -m MFP  -bb 1000 -alrt 1000 -s hds.aln -T AUTO

串联法建树

Gblocks seqkit mafft 
for i in *.fa
do
    file=${i%.fa*}
    mafft --maxiterate 1000 --localpair "${file}.fa" > "${file}.aln"        ## 多序列比对
   (也可以添加一步,将蛋白文件转为 cds 文件再进行后续的分析,pal2nal.pl "${file}.aln" "${file}.cds" -output fasta > "${file}.cds.aln)
    Gblocks "${file}.aln" -b4=5 -b5=h -t=p -e=.gb          ## 提取保守序列
    seqkit seq "${file}.aln.gb" -w 0 > "${file}.new.aln"           ## 多行序列并为一行
    awk '{if (NR%2==1) print substr ($1, 1, 4); else print $0}' "${file}.new.aln" > "${file}.final.aln" ## ID 修饰
done

 seqkit concat *.final.aln > all.fa
#拟合最佳模型
#conda install bioconda::modeltest-ng

modeltest-ng -i all.fa -d aa -o modeltest -p 1