mafft --anysymbol /home/biyunya/iqtree/xuzhanwu/OG0001136.fa> OG0001136.aln
先JTT快速建树,然后删除支持值低的树枝
##最佳匹配模型
for i in $(ls *aln);do ~/iqtree/iqtree-2.2.2.6-Linux/bin/iqtree2 -m MFP -bb 1000 -alrt 1000 -T AUTO -s "$i";done
##快速方法
for i in $(ls *aln);do ~/iqtree/iqtree-2.2.2.6-Linux/bin/iqtree2 -m JTT -bb 1000 -alrt 1000 -T AUTO -s "$i";done
mafft --anysymbol hds.fa> hds.aln
iqtree2 -m MFP -bb 1000 -alrt 1000 -s hds.aln -T AUTO
Gblocks seqkit mafft
for i in *.fa
do
file=${i%.fa*}
mafft --maxiterate 1000 --localpair "${file}.fa" > "${file}.aln" ## 多序列比对
(也可以添加一步,将蛋白文件转为 cds 文件再进行后续的分析,pal2nal.pl "${file}.aln" "${file}.cds" -output fasta > "${file}.cds.aln)
Gblocks "${file}.aln" -b4=5 -b5=h -t=p -e=.gb ## 提取保守序列
seqkit seq "${file}.aln.gb" -w 0 > "${file}.new.aln" ## 多行序列并为一行
awk '{if (NR%2==1) print substr ($1, 1, 4); else print $0}' "${file}.new.aln" > "${file}.final.aln" ## ID 修饰
done
seqkit concat *.final.aln > all.fa
#拟合最佳模型
#conda install bioconda::modeltest-ng
modeltest-ng -i all.fa -d aa -o modeltest -p 1