脚本:get_annotated_regions_from_gb.py
作用:将gb文件(氨基酸序列)转化为gene与intergene两个fasta文件(碱基序列)。
特性:该脚本可以对包含多物种叶绿体的gb文件进行提取(例如从ncbi批量下载得到的gb),gb文件中的所有叶绿体都会被执行相同的gene与intergene提取作业。
python get_annotated_regions_from_gb.py NC_047400.gb NC_047400.gb NC_047400.gb \
-o legume.cds -t CDS --mix
Gene sequence
Intergene sequence
多物种基因提取
参考资料:
How to assemble a target organelle genome using my own reference?