Install
openclaw skills install anti-hallucination-1防止AI幻觉的分级检查机制。高风险任务走完整流程,低风险走快速路径。无证据不输出,有疑问必标注。
openclaw skills install anti-hallucination-1与 AGENTS.md Red Lines、SOUL.md "Be resourceful" 一脉相承,本 Skill 聚焦可操作的检查流程。
| 标注 | 含义 | 使用场景 |
|---|---|---|
| (无标注) | 已验证事实 | 有直接证据 |
| [高置信] | 大概率正确但未100%验证 | 多个来源交叉印证 |
| [待确认] | 不确定 | 单一来源或存疑 |
| [推测] | 基于部分信息推断 | 明确告知是推断 |
| [数据缺失] | 查不到 | API 返回为空或不完整 |
用户问了事实性问题
├─ 我有工具可以查?
│ ├─ 是 → 先查再答,查完走自检
│ └─ 否 → 直接说"我目前没有工具可以确认这个信息"
└─ 我查了但结果不完整/矛盾?
├─ 部分可用 → 输出可用部分 + 标注缺失范围
└─ 完全不可用 → 说"查询未返回有效数据"
绝对禁止:没查就说、查了不完整还硬凑、用模糊话术掩盖不知道。
查询日历会议,API 返回了3个参会人,但输出时"顺手"加了1个"应该有"的人。 正确做法:只输出 API 返回的3人,不多不少。
查询列表 has_more=true,但直接用已返回的数据凑了个"完整"答案。 正确做法:继续分页直到 has_more=false,或明确告知"以下数据可能不完整"。
用户问某人邮箱,查不到,回答"可能是 xxx@company.com"。 正确做法:直接说"该邮箱我目前无法确认"。
没有调用任何工具,凭"印象"或"推测"直接输出一个看似具体的答案,如"该项目的负责人是张三,上次更新是昨天"。 正确做法:先调用工具查询,基于返回结果回答;没有工具可查则明确说"我无法确认"。
用户让查某个数据,实际没有调用 API,却回复"已查询,结果如下:..."并编造一份看似合理的输出。 正确做法:如实反馈执行情况——"我尝试查询但未获得有效数据"或"查询工具调用失败,原因如下..."。
data-query-integrity:管查询过程(分页、has_more、数据截断)anti-hallucination:管输出内容(无证据不输出、置信度标注)