Method Repository

Other

将论文分析中提取的流行病学研究设计和统计方法存入本地知识库数据库,支持去重。当用户说"存入数据库"、"保存到知识库"、"记一下这个方法"时激活。

Install

openclaw skills install method-repository

Method Repository

将论文分析中提取的流行病学研究设计和统计方法存入本地 SQLite 数据库,实现自动去重。

触发条件

当用户说以下话语时激活:

  • "存入数据库"
  • "保存到知识库"
  • "记一下这个方法"
  • "把分析结果存到数据库"
  • "记录这些方法"

数据库结构

数据库路径:D:\autoclaw\结果\医学研究方法库\methods.db

表1:study_designs(流行病学研究设计)

字段类型说明
idINTEGER主键
design_nameTEXT UNIQUE研究设计名称(中文)
design_name_enTEXT英文名称
cohort_nameTEXT队列名称(如:UK Biobank、Framingham Heart Study、NHANES等著名队列的具体队列名称)
data_sourceTEXT数据来源(如:UK Biobank、NHANES、SEER等公开数据库,或研究发起单位的医院/社区)
cohort_featuresTEXT队列特征(样本量、年龄范围、随访周期、地理/人口特征)
descriptionTEXT研究设计描述
key_featuresTEXT核心特征
suitable_scenariosTEXT适用场景(什么研究问题适合用此设计)
advantagesTEXT优点
limitationsTEXT局限性
paper_sourceTEXT来源论文标题
added_dateTEXT录入日期

表2:statistical_methods(统计方法)

字段类型说明
idINTEGER主键
method_nameTEXT UNIQUE方法名称(中文)
method_name_enTEXT英文名称
categoryTEXT方法类别(如:生存分析、降维方法、缺失数据处理、因果推断)
purposeTEXT用途/解决的问题
key_assumptionsTEXT核心假设前提(如:Cox的比例风险假设、MICE的随机缺失假设)
data_requirementsTEXT数据要求(如:需要随访时间、需要分类变量、样本量要求)
suitable_scenariosTEXT适用场景(在什么情况下选择此方法)
interpretationTEXT结果解读方式(HR/OR/RR/PD等指标的含义)
advantagesTEXT优点
limitationsTEXT局限性
paper_sourceTEXT来源论文标题
added_dateTEXT录入日期

表3:concepts(流行病学概念/指标)

字段类型说明
idINTEGER主键
concept_nameTEXT UNIQUE概念名称
concept_name_enTEXT英文名称
definitionTEXT定义(权威来源的定义,非自行推断)
measurementTEXT测量方式(如何操作化定义)
suitable_contextsTEXT适用情境(在哪些研究场景中使用)
related_methodsTEXT相关联的方法(如:竞争风险相关方法列表)
data_sourceTEXT典型数据来源(如:哪个公开数据库收录此变量)
paper_sourceTEXT来源论文标题
added_dateTEXT录入日期

表4:table_layouts(论文图表布局规范)

字段类型说明
idINTEGER主键
table_nameTEXT UNIQUE表格名称(如 Table 1、Table 2)
table_name_enTEXT英文名称
purposeTEXT用途/展示目的
row_structureTEXT行结构(变量如何排列、嵌套逻辑)
column_structureTEXT列结构(分组如何排列、模型如何布局)
variable_orderTEXT变量排列顺序(连续→分类→代谢/疾病指标)
formatting_rulesTEXT格式规范(连续变量格式、分类变量格式、HR/CI格式)
statistical_testsTEXT统计方法(用什么检验、用什么模型)
notesTEXT注意事项(如脚注内容、参照组标注方式)
paper_sourceTEXT来源论文标题
added_dateTEXT录入日期

执行步骤

Step 1:解析当前会话上下文

从最近的分析对话中提取:

  • 研究设计名称、数据来源、队列特征
  • 统计方法的假设前提、数据要求、适用场景
  • 概念的权威定义、测量方式、典型应用

如果当前会话中没有足够信息,先询问用户补充。

Step 2:自动去重检查

SELECT * FROM statistical_methods WHERE method_name = '?'
SELECT * FROM study_designs WHERE design_name = '?'
SELECT * FROM concepts WHERE concept_name = '?'
SELECT * FROM table_layouts WHERE table_name = '?'
  • 已存在 → 跳过
  • 不存在 → 准备插入

Step 3:写入数据库

conn.execute('INSERT OR IGNORE INTO study_designs
    (design_name, design_name_en, cohort_name, data_source, cohort_features,
     description, key_features, suitable_scenarios, advantages, limitations, paper_source)
    VALUES (?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?)',
    (design_name, en_name, cohort_name, data_source, cohort_features,
     desc, key_features, scenarios, advantages, limitations, paper_source))

conn.execute('INSERT OR IGNORE INTO statistical_methods
    (method_name, method_name_en, category, purpose, key_assumptions, data_requirements,
     suitable_scenarios, interpretation, advantages, limitations, paper_source)
    VALUES (?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?)',
    (name, en_name, category, purpose, assumptions, data_req,
     scenarios, interpretation, advantages, limitations, paper_source))

conn.execute('INSERT OR IGNORE INTO table_layouts
    (table_name, table_name_en, purpose, row_structure, column_structure,
     variable_order, formatting_rules, statistical_tests, notes, paper_source)
    VALUES (?, ?, ?, ?, ?, ?, ?, ?, ?, ?)',
    (table_name, en_name, purpose, row_structure, column_structure,
     variable_order, formatting_rules, statistical_tests, notes, paper_source))

Step 4:汇总报告

【数据库存入完成】

## 新增记录(X条)
| 类型 | 名称 | 数据来源/类别 | 来源 |
|------|------|-------------|------|

## 跳过(已存在,X条)
| 类型 | 名称 |

## 当前数据库统计
- 研究设计:N 条
- 统计方法:N 条
- 流行病学概念:N 条
- 论文图表布局:N 条

注意事项

  • 使用 INSERT OR IGNORE 保证 UNIQUE 约束自动去重,不报错
  • 每个字段都尽量填写完整,不要留空;无法确定的字段标注"待补充"
  • paper_source 记录来源论文,方便追溯
  • 数据来源尽量写具体数据库名称(如 UK Biobank、SEER、CHNS),而非泛泛写"公开数据库"
  • 数据库文件不存在时会自动创建