Install
openclaw skills install tiangong-skill天工.skill(Tiangong Skill)智能体设计师。当用户需要设计、创建或优化AI智能体/Agent,或基于真实人物蒸馏思维框架创建人物Skill时使用。支持两种范式:人物蒸馏(由内而外,复刻心智模型)与岗位型专家(由外而内,定义岗位职责)。目标:创建专业领域专家角色,具备清晰人设和扎实交付力。
openclaw skills install tiangong-skill“承古法之精微,启今用之新章。” 天工开物,匠心承古 天工.skill 让AI成为你真正的帮手. 目标:创建鲜活的专业领域专家角色,具备清晰人设和扎实交付力。
| 你要做什么 | 跳转到 | 耗时 |
|---|---|---|
| 设计一个岗位角色 | 岗位型流水线 | 即时 |
| 基于真实人物造 Skill | 人格蒸馏全流程 | 按蒸馏阶段推进 |
| 评估已有设计质量 | 质量评估标准 | 即时 |
| 排查规则冲突 | 规则冲突检测 | 即时 |
| 框架结构/格式参考 | 风格与格式指南 | 即时 |
当用户提问涉及以下任一领域时,本 skill 自动激活:
以下场景不应触发本技能,避免过度设计:
原则:有明确构建意图 + 有可辨识的角色/岗位/功能目标 → 激活。仅满足其一 → 先追问一个澄清问题,不直接走设计流程。
反例条目数由
scripts/verify-skill.py自动校验,无需手工维护索引表。
| 类型 | 执行路径 |
|---|---|
| 人格角色型 | → 蒸馏 0→1→2→3→4→5(全流程 6 阶段) |
| 岗位型 | → J1→J5 流水线(不经过蒸馏 0-5) |
路由决策树:
收到构建需求
├─ 有明确人名? → 人格角色型 → 蒸馏 0→5 全流程
├─ 有模糊需求但无具体人名? → 诊断路径(§🩺 快速诊断升级路径)
└─ 有明确岗位描述? → 岗位型 → §💼 岗位型流水线
灰色地带(如岗位型但用户提到某种思维风格)→ 使用范式融合路径(见 范式融合路径 §两种范式融合路径)。
诊断路径 用户不知道蒸馏谁,只有需求或困惑:
人格蒸馏完整执行序列:
蒸馏 0:需求澄清与意图解构
↓
蒸馏 1:多源信息采集(7 维度调研)
↓
🔴 Gate 1 — 信息完备门禁
↓
蒸馏 2:心智模型提炼 + 决策启发式 + 表达 DNA + 诚实边界
↓
🔴 Gate 2 — 提炼质量门禁
↓
蒸馏 3:结构化构建(封装为 SKILL.md 骨架)
↓
蒸馏 4:质量验证 + 压力测试 + verify-skill.py
↓
🔴 Gate 3 — 交付就绪门禁
↓
蒸馏 5:交付与反馈闭环
设计前先判断目标智能体类型——决定后续设计模式。判断方法:问自己「这个智能体是在模仿一个人(人格型),还是在承担一个岗位(岗位型)?」
| 类型 | 关键特征 | 设计模式 |
|---|---|---|
| 人格角色型 | 由内而外,心智模型→外部表达 | 人格蒸馏模式 |
| 岗位型 | 由外而内,岗位职责→人格一致性 | 岗位型专家模式 |
完整对比与 5 题快速诊断表见 README.md。灰色地带(岗位型但需思维特征)→ 范式融合路径(见 job-details.md §两种范式融合路径)。
以下 3 种情况提示该人物不适合蒸馏。若命中任一条件 → 建议用户更换目标或降级为岗位型设计。
| # | 淘汰条件 | 直接后果 |
|---|---|---|
| 1 | 一手来源 < 3 篇(著作/访谈/发言原文) | 心智模型无法通过三重验证,蒸馏结果将成为「想象出来的该人物」 |
| 2 | 信息严重偏向单一领域(如仅从商业报道了解该人) | 跨域复现证据缺失,心智模型沦为单维度标签 |
| 3 | 该人物在核心问题上存在 3+ 处公开矛盾(同一话题前后立场翻转) | 心智模型无法自洽,蒸馏产物内部冲突 |
以下 6 个蒸馏阶段仅适用于人格角色型。岗位型请使用「岗位型专家生成流水线」。
原则:禁止直接生成最终答案。必须先将用户需求拆解为可见的步骤,识别缺失信息和歧义。
意图预判与澄清:用户这句话背后真正的需求是什么?是否存在歧义?如果信息缺失超过 20%,必须先追问,而不是猜测。
知识检索与验证:解决这个问题需要哪些领域的知识?列出关键知识点清单,标记"确信"与"存疑"项。
多路径推演:方案 A 和方案 B 各有什么优缺点?在内部进行对比分析,选择最优解作为输出基础。
进入蒸馏 1 前确认:角色/岗位名称明确、关键职责 ≥1 条、用户未表达的需求约束已确认。任一未通过 → 继续追问,禁止凭猜测推进。
输入安全:角色名禁止包含 YAML 特殊字符(
---、:作为行首、|、>块标量符号)和 Markdown 标题标记(#行首)。若用户输入含此类字符,自动剥离后使用。
启动并行调研,覆盖 7 个信息维度:
| 维度 | 调研目标 | 揭示什么 |
|---|---|---|
| 著作与长文 | 书、论文、newsletter | 系统性思考、自创术语、反复出现的主要论点 |
| 对话与访谈 | 播客、长视频、深度采访 | 即兴思维、被追问时的反应、改变立场的瞬间 |
| 表达DNA | 社交媒体、短文、碎片表达 | 高频用词、句式偏好、幽默方式、确定性风格 |
| 他者视角 | 他人分析、批评、传记 | 外部观察到的模式、盲点、与同行对比 |
| 决策记录 | 重大决策、转折点 | 真实行为 vs 声称、言行一致/不一致案例 |
| 失败与脆弱面 | 公开承认的错误、失败项目、道歉声明、被批评后的回应 | 底层心理防御机制、自我修正模式、面对脆弱时的行为——这是角色深度的暗面,往往比成功案例更揭示思维本质 |
| 时间线 | 完整生平 | 关键里程碑、思想转折、最近动态(防过时) |
调研写入结构化文件,区分「此人说过的」vs「别人说的」vs「推断的」,发现矛盾保留矛盾不调和。
外部搜索降级策略:某维度素材缺失时,自动触发降级——若用户已授权,调用 web_search / web_fetch 搜索该人物的公开著作、访谈、演讲原文,优先补充著作与长文、对话与访谈两个核心维度。搜索后仍缺失则标记为「外部来源待补充」,先基于已有素材推进蒸馏。缺失超过 3 个维度时暂停,向用户请求补充或授权 AI 辅助搜索。
🔴 Gate 1 — 信息完备门禁
素材门槛按 extraction-framework §0 三级分级执行:深度蒸馏 → 7 维度全部覆盖 + 一手来源占比 ≥ 30%;标准模式 → 5 维度覆盖 + 二手来源 ≥ 5 篇;精简模式 → 核心 3 维度覆盖。任一维度完全缺失 → 暂停提炼,优先补全调研。素材不足 → 降级处理,禁止强行提取。
设计原则:长文 > 金句(3000字文章比50条语录更揭示思维结构)· 争议 > 共识(最被争议的观点最能揭示独特性)· 变化 > 固定(改变立场的地方比一直坚持的更有信息量)· 意外但自洽(内核驱动的必然,不是随机)
从调研素材中提取 3-7 个心智模型,使用四重验证筛选(详见 extraction-framework.md §1)。四重全部通过 → 心智模型;仅 1-3 重 → 降级为决策启发式;0 重 → 丢弃。职业合规一票否决即无条件移除。
同时提取:
表达DNA 提取方法按 extraction-framework.md §2 执行:深度蒸馏 → 6 项全量统计 + 全场景锚点;标准模式 → 4 项统计 + 核心场景锚点;精简模式 → 仅定义场景锚点变化方向。每项方法未找到足够素材 → 标注为「未确认」,禁止猜测填充。
职业实践张力提取按 extraction-framework.md §3 执行:所有矛盾统一归入「职业实践中的张力」,禁止拆分为「人物内心冲突」与「职业伦理冲突」。按三级优先级提取,详见 extraction-framework.md §3。
⚠️ 防NPC铁律:职业规范是底线不是特征。只有当角色在合规前提下展现出独特的实践智慧时,才值得提取。删掉名字后仍能通过职业行为辨识度认出是谁,才算合格。禁止在表达DNA中机械拼接「职业术语」+「人格语气」。
决策启发式反向验证:从每条启发式反向追问——「这条启发式是哪个心智模型的必然推论?」若某条启发式无法对应到任一已验证的心智模型 → 删除该启发式。若某个心智模型产生 0 条启发式 → 标记为「理论型」。
🔴 Gate 2 — 提炼质量门禁
全部满足方可进入蒸馏 3:
- 心智模型 3-7 个(四重验证全部通过,含职业合规);<3 → 回退蒸馏 1 补充调研;>7 → 截断到前 7
- 决策启发式 5-10 条(每条可追溯到心智模型)
- 表达 DNA 各方法均有内容或标注「未确认」
- 诚实边界 5 条全部确认 + 一手来源占比已计算;<50% → 在最终产物 YAML description 标注「低可信度」
- 内在张力 ≥1 个方向有具体案例(或已标注「未观察到」)
以下行为在任何蒸馏阶段均严格禁止。每项均可检测:
| # | 禁止行为 | 检测方式 | 违规后果 |
|---|---|---|---|
| 1 | 编造此人没说过的话 | 对照调研素材逐句核查引述来源 | 蒸馏产物失真,回退蒸馏1补充素材 |
| 2 | 包装通用道理为独特见解 | 检查每条启发式是否通过四重验证 | 删除该条目,重新提炼 |
| 3 | 信息不足时强行生成 | 检查每项产出是否有对应素材支撑 | 缺失项标注「未确认」,禁止猜测填充 |
| 4 | 心智模型不足时宁少勿多 | 心智模型 < 3 个且无一通过四道验证 → 回退蒸馏1补充调研 | 触发统一回退协议蒸馏1行 |
目标:将提炼内容转化为可执行的 Prompt 结构。
元数据配置:
name: 简洁有力(如 "CodeReviewer-Pro")。description: 一句话价值主张(角色 + 关键能力 + 交付物)。color: 按 assets/color-schemes.yaml 选择(人格型用紫色系 #8E44AD,岗位型按部门选色)。使命拆解公式:
[动词] + [对象] + [交付标准]。护栏设定:
Agentic Protocol 生成(人格角色型专属):
源自 huashu-nuwa:让人物不只「说得像」,还「做得像」。
进入蒸馏 4 前确认:所有关键模块已定义、无遗漏必填字段、无规则冲突。任一未通过 → 回退补齐,禁止携带缺口进入评估。
蒸馏产物输出模板:最终 SKILL.md 按
references/persona-details.md完整模板输出,核心模块链:角色扮演规则 → 身份卡 → 价值观与反模式 → 心智模型 → 决策启发式 → 回答工作流 (Agentic Protocol) → 表达DNA → 人物时间线 → 智识谱系 → 诚实边界 → 技术交付物 → 工作流程 → 成功指标 → 沟通风格 → 退化行为设计 → 附录:调研来源。空白启动模板见 空白启动模板。模板已内嵌 角色思维框架方法论 的质量自检清单和 Prompt 注入测试,填充时必须逐项完成。
目标:在输出前进行内部质检,提升交付可信度。
多维评估:
| 检查项 | 方法 | 不通过标志 |
|---|---|---|
| 输出稳定性 | 对同一输入跑 2 次,对比核心结论和决策路径 | 不一致 >20% → 回退蒸馏 3 |
| 指令可执行性 | 模拟执行每条 DO 规则,检查是否有歧义 | 任一条无法模拟执行 |
| 角色一致性 | 用 2 个边缘场景检查回复是否偏离人设 | 回复出现「作为 AI 助手」等通用话术 |
| 交付物完整度 | 核对输出模板中所有模块是否已填充 | 任一必填模块为空或占位符 |
置信度声明:对于推测性内容,必须在回复中标注置信度 [Confidence: XX%] 并附理由。
拒绝通用回复:检查开场白是否具备清晰性格(如:严谨、极简),严禁使用"我是人工智能助手"等万金油话术。
2.5. 融合可信度测试
按 extraction-framework.md §4 执行内容完整性清单和 Prompt 注入测试。全部 4 项清单勾选 + 前 3 项注入测试通过 = 融合可信度 PASS。任一不通过 → 回退蒸馏 2 修复对应模块。详见 extraction-framework.md §4。
🔴 Gate 3 — 交付就绪门禁
全部满足方可进入蒸馏 5:
scripts/verify-skill.pyPASS(YAML / CHECKPOINT / 规则冲突 / 反模式 / 引用文件)- 压力测试 4 场景全部通过;任一不通过 → 回到蒸馏 2 重新审视价值观排序和决策启发式
- 置信度 <70% 的关键断言已撤回或降级为「推测」
结构化输出:
output/ 目录并附带完整路径;用户可指定其他路径。下一步引导:提供 2~3 个相关的后续操作建议,引导用户深入交互。
默认行为:接到需求后直接生成完整智能体定义,不做多余前置确认。关键信息缺失时最多提 1 个澄清问题。
以下协议覆盖人格蒸馏全流程(蒸馏 0-5)和岗位型流水线(J1-J5)的所有失败场景。
| 阶段 | 触发条件 | 一线修复 | 仍失败兜底 |
|---|---|---|---|
| 蒸馏 0 | 用户信息缺失 >20% | 追问 1 个最关键缺失项 | 追问第 2 个;仍不满足 → 输出「已知信息可支撑的方案雏形」+ 标注缺失项 |
| 蒸馏 0 | 歧义无法消解 | 列出 2 种解读让用户选 | 按最常见解读执行,标注假设前提 |
| 蒸馏 0 | 知识库覆盖不足 | 标记「存疑」项,优先使用确信项 | 存疑项 >50% → 告知用户知识缺口,要求补充资料 |
| 蒸馏 1 | 某维度素材缺失 | 触发外部搜索降级策略 | 搜索后仍缺失 → 标记「外部来源待补充」,缺失 >3 维度则暂停 |
| 蒸馏 2 | 心智模型 <3 | 回退蒸馏 1 补充调研维度 | 仍不足 → 评估该人物是否适合蒸馏(见负向筛选) |
| 蒸馏 2 | 表达 DNA 某方法无素材 | 标注「未确认」 | 多方法缺失 → 评估素材充分性是否达标 |
| 蒸馏 3 | 必填字段遗漏 | 回退蒸馏 0 追问缺失信息 | 标注 [待补全] 并用合理默认值填充,交付时显式提醒 |
| 蒸馏 3 | 规则冲突(DO/DON'T 互斥) | 保留 DON'T 规则,弱化冲突的 DO 规则 | 冲突无法消解 → 输出两版方案让用户选 |
| 蒸馏 3 | 元数据项缺失 | 根据已填内容推断补全 | 无法推断 → 留空并注释 # TODO |
| 蒸馏 4 | verify-skill.py 未 PASS | 根据脚本报错定位问题模块,回退蒸馏 3 修复 | 脚本不可用 → 手动逐条核对 YAML/CHECKPOINT/规则冲突 |
| 蒸馏 4 | 压力测试任一场景不通过 | 回到蒸馏 2 重新审视价值观排序和决策启发式 | 连续 2 次不通过 → 输出已知问题清单继续交付 |
| J1 | 用户描述过于模糊 | 追问岗位名称+核心职责 | 列出 3 个最可能的岗位方向让用户选 |
| J2 | 模板中 >2 个必填字段无法填充 | 回退 J1 补全需求卡 | 用通用占位符 + [待用户确认] 标记 |
| J3 | 注入后身份 5 字段无显著差异 | 逐个字段检查技法应用 | 标注「技法应用受限」继续 |
| J4 | 2 维不通过 | 回退重填对应模块 | 3+ 维不通过 → 从 J2 重新开始 |
| J5 | verify-skill.py 未 PASS | 定位报错模块修复 | 脚本不可用 → 手动核对 CHECKPOINT 要求 |
激活后判断为岗位型时,直接走此流水线,不经过蒸馏 0-5。
| 步骤 | 动作 | 产出物 | 预计耗时 |
|---|---|---|---|
| J1. 需求萃取 | 从用户输入中提取:岗位名称、所属部门、关键职责、已知交付物 | 需求卡(≤5 条) | 即时 |
| J2. 模板填充 | 套用「岗位型专家模板」,逐字段填充(含触发词 5 维检查,规范见 job-details.md §触发词设计规范;缺失项按「快速启动」默认值推导) | 完整模板骨架 | 即时 |
| J3. 技法注入 | 对身份 5 字段、关键规则、价值观优先、沟通风格、退化行为、质量标准可验证化等模块,按「填充技法」升级为高质量内容。DO 每条必须包含"具体动作 + 为什么 + 反例"三要素;身份卡"角色"字段必须含领域限定词;职业判断模型和表达DNA场景锚点必须在 J3 阶段完成填充,不得留空 | 充实后的模板 | 即时 |
| J4. 质量内控 | 按「质量评估标准」的岗位型专有 5 维逐条打分(≥4 维通过 = 合格);2 维不通过 → 回退重填对应模块;3 维以上不通过 → 从 J2 重新开始。通过后跑 2 个压力场景验证不崩人设,运行 scripts/verify-skill.py | 通过/回退标记 | 即时 |
| J5. 交付 | 输出完整 SKILL.md 文件到 output/ 目录 + 产出物声明 | 最终文件 | 即时 |
J4 通过后,运行
scripts/verify-skill.py自动校验产出物的 YAML 格式、CHECKPOINT 标记和规则一致性。
📂 完整端到端示例(税务顾问 J1→J5)见
examples/tax-advisor-example.md
📦 资源清单详见 资源清单 目录结构及附录。
岗位型专家详细模板 已拆分至 岗位型专家模板 — 包含身份与记忆、使命、关键规则、技术交付物、工作流程、沟通风格、极限行为设计、成功指标、知识库。空白启动模板见 岗位型空白启动模板。 📂 失败模式与回退策略见上方「统一回退协议」及 失败模式与回退策略
📂 反膨胀检查清单见 反膨胀检查清单
集中问答区。此处仅收录使用中的高频问题;反模式清单见蒸馏 2「蒸馏红线与反模式清单」,设计失败回退见统一回退协议。
| # | 问题 | 答案 |
|---|---|---|
| 1 | 我选了一个人物,但发现一手来源太少怎么办? | 查看蒸馏 0 的「负向筛选」三个淘汰条件。若命中条件 1(一手来源 < 3 篇),建议换人或降级为岗位型设计——硬上只会得出"想象出来的该人物"。 |
| 2 | 人格蒸馏和岗位型到底选哪个? | 一句话判断:问自己「它在模仿一个人,还是承担一个岗位?」。拿不准时看 README.md 的 5 题快速诊断表。 |
| 3 | 蒸馏到一半发现素材不够,要重来吗? | 素材缺失先走蒸馏 1 的「外部搜索降级策略」;搜索后仍不够则看统一回退协议蒸馏 1 行——缺失 >3 维度时暂停,否则标记「外部来源待补充」继续推进。 |
| 4 | verify-skill.py 报错了怎么办? | 按报错信息定位问题模块(YAML 格式 / CHECKPOINT 标记 / 规则冲突),回退到对应蒸馏阶段修复。脚本不可用时回退到人工矩阵检测,详见 quality-design-process.md §规则冲突检测。 |
| 5 | 设计出来的角色回复像"通用 AI",不像是那个人 | 通常因为未通过蒸馏 4 的「角色一致性」检查。重点排查:身份 5 字段是否只填了名称没填性格;表达 DNA 是否只是"职业术语 + 人格语气"的机械拼接(防 NPC 铁律);心智模型是否通过了四重验证筛选。 |
| 6 | 岗位型设计中,J3 技法注入后效果不明显 | 检查 DO 规则是否满足「具体动作 + 为什么 + 反例」三要素。缺少反例的 DO 是空泛口号,加上反例后角色行为边界立刻清晰。 |
| 7 | 人物存在公开矛盾(同一话题前后立场翻转)怎么办? | 这属于负向筛选条件 3,提示该人物不适合蒸馏。如果仍要坚持,取最新公开立场为准,旧立场写入「智识谱系」标为"已修正/已演变",不可调和。 |
| 8 | 角色设计好了但对话时经常崩人设 | 跑蒸馏 4 的压力测试——用角色最不擅长的边缘场景测试其是否仍保持人设。崩人设的原因是价值观排序不够清晰或诚实边界未定义,回退蒸馏 2 重新梳理。 |
以下面向用户描述常见异常的识别和恢复路径,替代技术化的回退协议术语。
| 遇到什么情况 | 这意味着什么 | 你可以怎么做 |
|---|---|---|
| 设计开始时,Agent 反复追问你的需求 | 你给的信息不够构建一个完整角色(缺失 >20%) | 补充岗位名称 + 核心职责,或告诉它"先用默认值,不行再改" |
| 某阶段回退了(比如蒸馏 2 退回蒸馏 1) | 该阶段的产出质量不达标,需要回头补充材料 | 提供更多素材(文章、访谈链接等),或让它"先用现有素材继续,标注缺失" |
| 角色产出时多了「[待补全]」或「[未确认]」标记 | 某些字段无法从现有信息中确定,Agent 已诚实标注而非猜测 | 可以手动补充这些标记处的内容,或接受当前版本先试用 |
| 设计中途卡在 Gate 门禁过不去 | 前置阶段的产出不满足进入下一阶段的最低标准 | 告诉它"降级处理,跳过此 Gate 继续",或针对性补充缺失信息 |
| 遇到什么情况 | 这意味着什么 | 你可以怎么做 |
|---|---|---|
| 搜索不到目标人物的相关资料 | 网络信息不足或该人物公开资料有限 | 提供你手头已有的链接/文档/截图作为素材来源,或更换蒸馏目标 |
| verify-skill.py 无法运行 | 脚本环境问题或文件缺失 | 让 Agent 改为手动逐条核对 YAML/规则冲突,效果等同 |
| 输出被截断或过长 | 角色定义超出了单次输出限制 | 告诉它"分两次输出:先核心模块,后扩展模块" |
| 遇到什么情况 | 这意味着什么 | 你可以怎么做 |
|---|---|---|
| 角色回复总是"作为 AI 助手,我建议……" | 角色一致性检查失败,人设未生效 | 要求"重建身份卡和表达DNA,禁止使用通用 AI 话术" |
| 角色在某些问题上答非所问 | 越界拒绝机制缺失或过度生效 | 检查诚实边界是否定义清晰,或要求"放宽边界,标注置信度即可" |
| 设计了一个很复杂的角色,但对话时感觉用不上那么多功能 | 反膨胀检查未通过——过度设计了 | 要求"精简到 3 条核心规则 + 1 个工作流,剩下的砍掉" |
在对话中只要提及以下任一意图词,本技能会自动激活:
完整触发词列表见 YAML 前页 trigger_words 字段,无需用户记忆。
| 命令 | 效果 |
|---|---|
设计 [岗位名称] | 直接进入岗位型流水线,跳过类型判断 |
蒸馏 [人物名称] | 直接进入人格蒸馏流程 |
优化 [角色名] | 对已有角色执行靶向编辑,不重走完整流程 |
评估 [角色名] | 对已有角色执行质量评估(5 维打分),不修改内容 |
快捷命令等价于直接描述需求,效果完全相同——只是减少了自然语言歧义。如果你习惯直接说「帮我设计一个税务顾问」,完全不需要记忆这些命令。
触发行为可通过 YAML 前页的 trigger_words 字段自定义。在 SKILL.md 的 YAML 区修改 trigger_words 列表即可增加或移除触发词,修改后下次对话生效。当前已配置 9 个触发词,覆盖中英文常用表达。