Install
openclaw skills install protein-mining自动化蛋白质挖掘完整流程,从文献调研到潜在蛋白确定,生成可发表的学术成果
openclaw skills install protein-mining本skill实现了系统化的蛋白质挖掘工作流,包含7个核心模块,每个模块产生可交付的实验结果和可视化图表,适用于高质量学术论文发表。
模块1:文献调研与靶标确定
01_literature_review.pdf - 文献综述报告01_target_proteins.csv - 靶标蛋白列表(含登录号、物种、功能注释)01_research_hypothesis.md - 研究假设和科学问题陈述模块2:蛋白序列收集
02_raw_sequences.fasta - 原始序列集02_filtered_sequences.fasta - 质控后序列集02_nr_sequences.fasta - 非冗余序列集02_sequence_statistics.csv - 序列统计信息02_length_distribution.png - 序列长度分布图模块3:隐马尔可夫模型构建
03_msa_alignment.fasta - 多序列比对结果03_protein_family.hmm - HMM模型文件03_model_validation.csv - 模型验证统计03_roc_curve.png - ROC曲线图模块4:跨物种序列搜索
04_hmm_search_results.tbl - HMM搜索原始结果04_candidate_proteins.fasta - 候选蛋白序列04_species_distribution.csv - 物种分布统计04_species_heatmap.png - 物种分布热图模块5:基于结构的搜索
05_predicted_structures/ - AlphaFold2预测结构05_plddt_scores.csv - 结构置信度评分05_foldseek_results.m8 - Foldseek搜索结果模块6:进化树构建与分析
06_refined_alignment.fasta - 优化后的多序列比对06_phylogenetic_tree.nwk - Newick格式进化树06_tree_visualization.pdf - 高质量进化树图06_positive_selection_sites.csv - 正选择位点模块7:候选蛋白优先级排序
07_feature_matrix.csv - 候选蛋白特征矩阵07_scoring_results.csv - 综合评分结果07_top_candidates.csv - Top 20候选蛋白列表07_experimental_design.md - 实验验证方案建议# 启动完整流程
protein-mining --target "ABC transporter" --species plants
# 分步执行
protein-mining --module 1 --target "ABC transporter"