Install
openclaw skills install blast-species-identification提供基于BLAST的FASTA序列和OTU表Top ASV的物种注释,支持映射文件、延迟设置和断点续传功能。
openclaw skills install blast-species-identification提供BLAST物种注释工具的使用指南和快速调用功能。包含两个主要工具:
blast_annotation_tool.py - 对指定FASTA序列进行BLAST注释top_asv_blast.py - 从OTU表提取Top ASV并进行BLAST注释pip install biopython
# 基本用法:输入FASTA文件和输出目录
python3 blast_annotation_tool.py sequences.fasta results/
# 使用序列ID到样本名的映射文件
python3 blast_annotation_tool.py sequences.fasta results/ --mapping mapping.csv
# 跳过已存在的结果(断点续传)
python3 blast_annotation_tool.py sequences.fasta results/ --skip-existing
input: 输入FASTA文件路径 (必填)output: 输出目录路径 (必填)--mapping, -m: 序列ID到样本名的映射文件 (CSV格式)--delay, -d: 每次BLAST请求之间的延迟秒数 (默认: 3)--hits, -n: 每个样本保留的BLAST hits数量 (默认: 10)--skip-existing, -s: 跳过已存在的结果文件 (默认: False)# 基本用法
python3 top_asv_blast.py taxa_table.xls rep.fasta results/
# 跳过已存在的结果(断点续传)
python3 top_asv_blast.py taxa_table.xls rep.fasta results/ --skip-existing
# 自定义参数
python3 top_asv_blast.py taxa_table.xls rep.fasta results/ --delay 5 --hits 20
otu_table: OTU表文件 (.xls, .tsv, .csv) (必填)fasta: 代表性序列FASTA文件 (必填)output: 输出目录路径 (必填)--top-n, -n: 每个样本提取前N个ASV (默认: 1)--delay, -d: 每次BLAST请求之间的延迟秒数 (默认: 3)--hits: 每个ASV保留的BLAST hits数量 (默认: 10)--skip-existing, -s: 跳过已存在的结果文件 (默认: False)>ASV1
TAGGGAATCTTCCGCAATGGACGAAAGTCTGACGGAGCAACGCCGCGTGAG...
>ASV2
TAGGGAATCTTCCGCAATGGACGAAAGTCTGACGGAGCAACGCCGCGTGAG...
CSV格式,第一列为序列ID,第二列为样本名:
ASV1,D1-8
ASV2,J2-8
ASV3,D3-8
--delay参数避免请求过于频繁--skip-existing可实现断点续传当您需要进行BLAST物种注释时,只需说:
我会为您提供详细的参数说明和使用方法。