antismash  lh.fa -t fungi --databases ./databases  --genefinding-gff3 braker.gff3 -c 48

lh.fa 基因组序列

-t 模式 包括真菌、细菌、植物

--databases /home/liuli/liuli/backup/super/antiSMASH/databases

--genefinding-gff3 注释信息

-c 48 cpu数量

gbk数据处理

for i in $(ls *gbk); do awk '
/^[[:space:]]+mRNA[[:space:]]/ {in_mrna=1; next}
in_mrna && /\\/ID=/ {
    if (match($0, /ID="([^"]+)"/, arr)) {
        print arr[1];
        in_mrna=0;
    }
}
' $i > $i.gene; done

R语言处理

my_dir <- "D:/lh/gene"
file_vector <- list.files(path = my_dir, full.names = TRUE)
data <- ls(pattern = "ctg0*")
for (file in file_vector) {
+     filename <- tools::file_path_sans_ext(basename(file))
+     assign(filename, read.delim(file, header=FALSE, comment.char="#"))  # 假设文件有标题行
+ }

for (df_name in data) {
+     
+     # 获取数据框
+     df <- get(df_name)
+     
+     # 计算第二列 V2 的频率表并转换为数据框
+     
+     df_2 <- merge(loss2,df,by="V1")
+     # 生成新数据框名称,例如 "df1_2"
+     new_df_name <- paste0(df_name, "_2")
+     
+     # 将新数据框保存到全局环境中,使用 assign() 函数
+     assign(new_df_name, df_2)
+ }