{"skill":{"slug":"true-seeing","displayName":"True Seeing","summary":"审核 AI 生成文章中的可验证事实，通过 web search 逐条校验，输出差异报告并支持用户审批替换。当用户需要事实核查、验证文章准确性、检查数据日期金额是否正确、去除 AI 幻觉内容、或 fact-check 一篇文章时使用。触发于\"事实核查\"、\"验一下这些数据\"、\"检查事实\"、\"去幻觉\"、\"fact ch...","description":"---\nname: true-seeing\ndescription: 审核 AI 生成文章中的可验证事实，通过 web search 逐条校验，输出差异报告并支持用户审批替换。当用户需要事实核查、验证文章准确性、检查数据日期金额是否正确、去除 AI 幻觉内容、或 fact-check 一篇文章时使用。触发于\"事实核查\"、\"验一下这些数据\"、\"检查事实\"、\"去幻觉\"、\"fact check\"、\"核实文章\"、\"核实这段话\"、\"帮我对一下数据\"、\"这篇文章里的数字对不对\"。不适用于语法纠错、翻译校对、纯观点验证、文风调整。\n---\n\n# True Seeing — AI 文章去幻觉校验\n\n## 目的\n\n识别文章中的可验证事实性陈述，通过 web search 逐条校验，输出差异报告供用户审批后替换。适用于 AI 生成内容的去幻觉化处理。\n\n## Pipeline 架构\n\n```\n[article] → Stage 1: extract → fact_list → Stage 2: verify → report → 🛑 用户审批 → Stage 3: replace → corrected article\n```\n\n三个阶段支持独立调用（`stage` 参数）或全流程顺序执行（默认）。\n\n**`stage=full` 模式的执行流程：**\n1. 执行 Stage 1 → 输出 fact_list\n2. 执行 Stage 2 → 输出 verification_report\n3. **暂停。向用户呈现差异报告，等待用户回复 user_selections。**\n4. 收到 user_selections 后执行 Stage 3 → 输出修正文章\n\nStage 2 完成后必须暂停等待用户审批，不得自动进入 Stage 3。\n\n## 输入参数\n\n| 参数 | 类型 | 必需 | 说明 |\n|------|------|------|------|\n| article | string | 是 | 待核查的文章全文或文件路径 |\n| stage | enum | 否 | `extract` / `verify` / `replace` / `full`（默认 `full`） |\n| fact_list | JSON | 条件必需 | `stage=verify` 时必需；Stage 1 的输出 |\n| verification_report | JSON | 条件必需 | `stage=replace` 时必需；Stage 2 的输出 |\n| user_selections | list[int] | 条件必需 | `stage=replace` 时必需；用户选择替换的有分歧事实编号 |\n\n## 数据契约\n\n### fact_list（Stage 1 输出 → Stage 2 输入）\n\n```json\n{\n \"article_summary\": \"文章主题一句话概括\",\n \"total_facts\": 5,\n \"facts\": [\n {\n \"id\": 1,\n \"category\": \"funding\",\n \"original_text\": \"XXX公司于2025年3月完成B轮融资5亿元\",\n \"position\": \"第2段第3句\",\n \"search_query\": \"XXX公司 B轮融资 2025年3月金额\"\n }\n ]\n}\n```\n\n### verification_report（Stage 2 输出 → Stage 3 输入）\n\n```json\n{\n \"summary\": { \"total\": 5, \"verified\": 3, \"corrected\": 1, \"remain\": 1 },\n \"verified\": [\n {\n \"id\": 1,\n \"original_text\": \"原文描述\",\n \"source_url\": \"https://...\",\n \"source_snippet\": \"网页上的对应描述\"\n }\n ],\n \"corrected\": [\n {\n \"id\": 2,\n \"original_text\": \"原文描述\",\n \"actual_fact\": \"实际查找到的信息\",\n \"source_url\": \"https://...\",\n \"source_snippet\": \"网页上的对应描述\",\n \"divergence_type\": \"number_mismatch | date_mismatch | event_nonexistent | entity_mismatch\"\n }\n ],\n \"remain\": [\n {\n \"id\": 3,\n \"original_text\": \"原文描述\",\n \"search_queries_tried\": [\"query1\", \"query2\"],\n \"note\": \"未找到可验证的搜索结果\"\n }\n ]\n}\n```\n\n---\n\n## Stage 1: Extract（事实抽取）\n\n### 输入\n- `article`：文章全文\n\n### 执行步骤\n\n1. **通读全文**，逐段扫描。\n\n2. **按 `references/fact-extraction-rules.md` 中的分类规则**，标记每一条可验证的事实性陈述。\n - 跳过：观点、推测、评价、定性描述（如\"市场前景广阔\"）。\n - 标记：包含具体数字、日期、金额、事件名称、人物+动作的陈述。\n\n3. **对每条标记事实**，记录：\n - `id`：自增编号，从 1 开始\n - `category`：分类标签（funding / pricing / date / event / statistic / personnel / product / other）\n - `original_text`：原文中的完整句子或分句\n - `position`：段落+句子位置描述\n - `search_query`：转化为适合 web search 的关键词查询（去掉虚词，保留实体+关键信息）\n\n4. **批量上限检查**：如果标记事实数量超过 30 条，仅保留前 30 条，在输出中附注\"发现 N 条事实，已截取前 30 条。如需继续，请将剩余部分作为新输入。\"。\n\n5. **输出 `fact_list` JSON**。\n\n6. **质量自检**：\n - 每条事实都有 id、category、original_text、position、search_query。\n - search_query 不包含虚词和上下文依赖词。\n - 总数 ≤ 30。\n\n### 停止条件\n- 文章为空或不含可验证事实 → 输出空 fact_list，附注\"未发现可验证事实\"。\n- 事实数量超过 30 条 → 截取前 30 条，附注截取说明。\n\n### search_query 构造规则\n- 提取核心实体（公司名、人名、产品名）\n- 保留关键数值和日期\n- 去掉修饰词和上下文依赖词\n- 如有歧义，生成 2 个备选查询（用 `|` 分隔）\n\n---\n\n## Stage 2: Verify（事实校验）\n\n### 输入\n- `fact_list`：Stage 1 输出的 JSON\n\n### 事实状态机\n\n每条事实在处理过程中有以下状态：\n\n| 状态 | 含义 |\n|------|------|\n| `Unverified` | 初始状态，待处理 |\n| `keywords-generated` | 已生成检索词，待搜索 |\n| `fact-fetch` | 已获取搜索结果，待比对 |\n| `Verified` | 终态：内容无误 |\n| `Corrected` | 终态：内容已修正 |\n| `Remain` | 终态：保持不变（无法验证或用户选择保留） |\n\n状态转换规则：\n\n```\nUnverified ──(生成检索词成功)──→ keywords-generated\nUnverified ──(生成检索词失败)──→ 留在 Unverified，回到大池子\n\nkeywords-generated ──(搜索成功)──→ fact-fetch\nkeywords-generated ──(搜索失败)──→ 留在 keywords-generated，等当前批次步骤 5 重试\n\nfact-fetch ──(比对：内容无误)──→ Verified\nfact-fetch ──(比对：内容有差异)──→ Corrected\nfact-fetch ──(比对：结果模糊/无法判定)──→ Remain\n```\n\n### 执行步骤\n\n1. **前置检查**：执行一次 `web_search`，查询 `\"test\"`，确认 Brave Search 可用。\n - 成功 → 继续。\n - 失败 → **abort**，向用户输出错误信息：\"web_search (Brave) 当前不可用，无法执行事实校验。建议过一段时间再试。\"，流程终止。\n\n2. **初始化**：将 fact_list 中所有事实放入 `unverified_pool`（大池子），创建空的 `done_pool`（已完成池）。\n\n3. **进入循环**（最多 5 轮）：\n\n **3a.** 从 `unverified_pool` 中捞出最多 5 条 Unverified 事实，形成当前批次的 `batch_pool`（小池子）。如果 `unverified_pool` 为空，跳到步骤 4。\n\n **3b.** 对 `batch_pool` 中的每条事实，按 `references/search-query-templates.md` 生成检索词：\n - 成功 → 状态变为 `keywords-generated`。\n - 失败 → 状态保持 `Unverified`，移出 `batch_pool`，放回 `unverified_pool`（大池子）。\n\n **3c.** 对 `batch_pool` 中所有 `keywords-generated` 的事实，使用 `sessions_spawn` 启动 sub-agent 并行搜索：\n - 每个 sub-agent 执行 `web_search`，取前 3 条结果用 `web_fetch` 抓取内容。\n - 搜索返回 ≥1 条包含原文实体的结果 → 状态变为 `fact-fetch`。\n - 搜索返回 0 条包含原文实体的结果，或工具返回错误 → 状态保持 `keywords-generated`，留在 `batch_pool`。\n\n **3d.** 对 `batch_pool` 中所有 `fact-fetch` 的事实，按 `references/verification-criteria.md` 逐要素比对：\n - 所有要素一致 → 状态变为 `Verified`。\n - 有关键要素不一致 → 状态变为 `Corrected`，记录 actual_fact + source_url + divergence_type。\n - 搜索结果与原文的实体/数值/日期无直接对应关系 → 状态变为 `Remain`，附注原因。\n\n **3e.** 对 `batch_pool` 中仍然停留在 `keywords-generated` 的事实（搜索失败的），换策略重搜一次：\n - 换策略规则：换用英文查询 / 去掉数值只搜实体+事件 / 扩大时间范围（按 `references/search-query-templates.md` 重试策略）。\n - 成功 → 回到步骤 3d 处理。\n - 失败 → 状态变为 `Remain`，附注\"搜索重试失败\"。\n\n **3f.** 当前批次处理完毕：\n - `batch_pool` 中已达终态（Verified / Corrected / Remain）的事实 → 移入 `done_pool`。\n - `batch_pool` 中仍有未达终态的事实 → 放回 `unverified_pool`。\n\n **3g.** 检查 `unverified_pool` 是否为空。空 → 跳到步骤 4。非空 → 回到 3a 开始下一轮。\n\n4. **循环结束**：\n - 循环 5 轮后 `unverified_pool` 中仍有 Unverified 事实 → 全部标记为 `Remain`，附注\"超过最大轮次（5轮）仍未验证\"，移入 `done_pool`。\n - 合并 `done_pool` 中所有事实，输出 `verification_report` JSON。\n\n5. **质量自检**：\n - Verified 事实都有 source_url。\n - Corrected 事实都有 actual_fact + source_url + divergence_type。\n - Remain 事实都有 search_queries_tried + note。\n - 无事实停留在中间状态（Unverified / keywords-generated / fact-fetch）。\n\n### 并行处理规则\n- 步骤 3c 中，当前批次内所有 `keywords-generated` 的事实同时启动 sub-agent 搜索，不逐条等待。\n- 每个 sub-agent 内部保持搜索节流（间隔 ≥ 2 秒）。\n- 单个 sub-agent 最多使用 2 个搜索查询 + 3 次 web_fetch。\n- 如果 sub-agent 执行失败，该条事实状态保持 `keywords-generated`，等步骤 3e 重试。\n\n### 停止条件\n- 前置检查 web_search 不可用 → abort，向用户报错。\n- 搜索结果全部为 429 → 当前批次暂停，已完成的批次结果保留，未完成的标记为 Remain 附注\"因 rate limit 中断\"。\n- 循环 5 轮结束 → 兜底，剩余 Unverified 标记 Remain。\n\n---\n\n## Stage 3: Replace（审批 + 替换）\n\n### 输入\n- `article`：原文\n- `verification_report`：Stage 2 输出的 JSON\n- `user_selections`：用户选择替换的有分歧事实编号列表\n\n### 执行步骤\n\n1. **呈现差异报告**，格式如下：\n\n```markdown\n# 事实核查报告\n\n## 有分歧的事实（Corrected）\n\n| 编号 | 原文事实 | 实际查找到的事实 | 出处 |\n|------|---------|----------------|------|\n| {id} | \"{original_text}\" | \"{actual_fact}\" | [来源]({source_url}) |\n\n## 无分歧的事实（Verified）\n\n| 编号 | 原文事实 | 佐证出处 |\n|------|---------|----------|\n| {id} | \"{original_text}\" | [来源]({source_url}) |\n\n## 未能验证的事实（Remain）\n\n| 编号 | 原文事实 | 备注 |\n|------|---------|------|\n| {id} | \"{original_text}\" | {note} |\n```\n\n2. **等待用户回复**，格式为：用户给出「有分歧的事实」表格中的编号（如 `2, 5`）。空回复或不修改 → 输出原文不变，流程结束。\n\n3. **根据 user_selections 执行替换**：\n - 在原文中定位对应编号的 `original_text`\n - 替换为 `actual_fact`\n - 在替换处追加 citation 标记 `[^fc-{id}]`（如 `[^fc-2]`），使用 `fc-` 前缀避免与原文已有脚注编号冲突\n - 在文末追加参考来源列表\n\n4. **输出修正后的文章**，文末附：\n\n```markdown\n---\n\n## 参考来源\n\n- [^fc-1] {source_url} — {source_snippet 摘要}\n- [^fc-2] {source_url} — {source_snippet 摘要}\n...\n```\n\n5. **质量自检**：\n - 替换后的文章保持原文结构，仅修改事实部分。\n - citation 编号 `[^fc-{id}]` 与参考来源一一对应。\n - 用户未选择的事实保持原样未修改。\n\n### 替换规则\n- 替换时保持原文句式结构，只替换有差异的事实部分，不重写整句。\n- 如果用户选择的编号包含 Remain 状态的事实，提示用户该事实无法验证，确认是否仍要保留原文。\n\n---\n\n## 故障处理\n\n| 故障场景 | 行为 |\n|---------|------|\n| 文章为空 | 输出错误信息：\"文章内容为空，无法执行事实核查\" |\n| fact_list 为空 | 输出：\"未发现可验证事实\"，流程结束 |\n| web_search 不可用 | abort，输出错误信息：“web_search (Brave) 当前不可用，无法执行事实校验。建议过一段时间再试。” |\n| 搜索结果全部 429 | 输出已完成部分，标记中断位置 |\n| 原文找不到对应位置 | 跳过该条替换，在输出中标注\"原文未找到匹配位置\" |\n| 用户选择的编号不存在 | 提示\"编号 X 不在差异列表中\"，忽略无效编号 |\n\n## 质量门槛\n\n执行完成后自检：\n\n- [ ] 每条事实都有明确的分类和编号\n- [ ] Verified 事实都有 source_url\n- [ ] Corrected 事实都有 actual_fact + source_url + divergence_type\n- [ ] Remain 事实都有 search_queries_tried + note\n- [ ] 替换后的文章保持原文结构，仅修改事实部分\n- [ ] citation 编号与参考来源一一对应\n- [ ] 用户未选择的事实保持原样未修改\n\n## 范围边界\n\n**做：** 校验文章中的可验证事实性陈述（数据、日期、金额、事件等）。\n**不做：** 语法纠错、观点验证、逻辑推理验证、翻译质量检查。\n**移交：** 如果文章需要专业领域事实核查（法律条文、医学数据），提示用户建议由领域专家复核。\n","tags":{"latest":"1.0.0"},"stats":{"comments":0,"downloads":331,"installsAllTime":0,"installsCurrent":0,"stars":1,"versions":1},"createdAt":1777738056405,"updatedAt":1778492830283},"latestVersion":{"version":"1.0.0","createdAt":1777738056405,"changelog":"Initial release: AI article fact-checker with state machine, parallel verification, and pseudo-quantification detection","license":"MIT-0"},"metadata":null,"owner":{"handle":"francisk","userId":"s171n0z34s9r66n5d000f58ejs85za45","displayName":"francisk","image":"https://avatars.githubusercontent.com/u/3042012?v=4"},"moderation":null}