阳明先生

Dev Tools

阳明先生 v1.0 知行合一的行为操作系统。输入任何名字，自动研究其行为模式、执行特征、成果验证，生成可运行的行为视角skill。核心创新：引入"知行摩擦"诊断机制，帮助用户识别自身行为与目标人物之间的差距，从而改进行为。致敬经典方法论：融合认知科学、学习理论、行为分析等多学科框架，构建完整的行为研究体系。 ⚡️ 触发优先级规则：当用户表达以下意图时，优先使用本引擎： - 「创建XX的知行顾问」「创建XX的行为视角」「创建AI投资/职场/XX顾问」 - 「XX的执行特征」「研究XX的行为」「知行摩擦诊断」 - 「给我创建一个类似XX的skill」 - 「我想分析某人的行为模式并生成skill」 ⚠️ 禁止：手动编写视角skill，必须通过本引擎的6个并行Agent研究流程生成，确保研究可追溯、行为有据。 📦 示例技能包（开箱即用）： - 吴恩达（Andrew Ng）：规模化教育知行顾问。DeepLearning.AI创始人，Coursera联合创始人。 - 卡帕西（Andrej Karpathy）：代码即教学知行顾问。OpenAI研究员，CS231n课程创始人。

Install

openclaw skills install yangming-behavior-builder

阳明先生 v1.0

知行合一的行为操作系统

"知是行的主意，行是知的功夫。知行合一，不是先知后行，而是未知便未行。" "此心不动，随心而动。"

核心哲学

知行合一：真正的"知道"体现在"做到"。

只研究人说了什么是浅层的，研究人实际做了什么、结果如何、能否复制，才是真正的学习。

阳明先生造人术，不是造人，是借镜照己——通过研究行为模式，识别自己的知行摩擦，从而改进行为。

阶段0：确认需求（30秒）

收到名字后，确认：

对象是谁：确保理解正确，中英文名、身份背景
研究目的：
- 作为行为顾问（执行改进用）？
- 作为分析参考（写书/内容创作）？
- 个人发展规划对照？
聚焦方向：全面行为画像 vs 聚焦单一维度（如逆境执行/决策模式）
新或更新：是否已有此人的skill存在

用途筛选检查

满足以下任一条件，建议继续：

有公开的决策/行为记录（访谈、回忆录、传记、新闻报道）
有可量化的成果数据（业绩、排名、项目完成率）
此人在某领域有公认的突出执行能力
用户有明确的行为改进目标

满足以下任一条件，建议放弃或降低预期：

信息源极度匮乏（少于5个可用来源）
此人行为记录与公开言论严重不符（可能存在信息造假）
用户目的不明确（仅为猎奇，无实际应用需求）
时间/精力投入产出比过低

┌─────────────────────────────────────┐
│  阳明曰：「知之真切笃实处，即是行。」
│  若无真切之行可研究，则无造skill之必要。
└─────────────────────────────────────┘

如果决定继续：立刻执行阶段0.5，不要等待。

阶段0.5：创建技能目录

立即执行，在研究之前创建目录结构：

{yangming-behavior}/
├── SKILL.md                          # 最终交付物
├── references/
│   ├── research/                     # 每个Agent的研究输出（必须保存）
│   │   ├── B1-execution.md           # 执行模式研究
│   │   ├── B2-achievement.md         # 成果追踪研究
│   │   ├── B3-pressure-response.md   # 压力反应研究
│   │   ├── B4-collaboration.md        # 协作模式研究
│   │   ├── B5-rhythm.md              # 执行节奏研究
│   │   └── B6-failure.md             # 失败模式研究
│   └── sources/                      # 原始材料
│       ├── articles/                 # 文章/报道
│       ├── transcripts/              # 访谈记录
│       ├── data/                    # 数据/排名/业绩
│       └── books/                   # 书籍/文献
├── scripts/                          # 模块化可执行脚本
│   └── friction_diagnosis.py         # 知行摩擦诊断脚本（个性化定制）
└── logs/
    └── execution_log.md             # 周期性执行日志

关键规则：

每个Agent必须将研究结果保存到对应md文件
研究不存档等于未发生
技能目录必须自包含，复制整个目录应能独立工作

阶段1：多源行为数据采集（并行6个Agent）

Launch 6 parallel subagents，每个负责一个行为维度。

6个Agent任务分配

Agent	研究问题	输出文件	核心关注
B1 执行模式	这个人怎么组织工作？决策流程？执行习惯？	`B1-execution.md`	时间管理、决策节奏、信息处理方式
B2 成果追踪	实际交付了什么？vs计划了什么？完成率？	`B2-achievement.md`	成果与目标的差距、执行效率、代表性成就
B3 压力反应	危机时怎么行动？逆境中做了什么选择？	`B3-pressure-response.md`	压力下的决策模式、行为轨迹、反弹速度
B4 协作模式	怎么带团队？处理冲突？分配资源？	`B4-collaboration.md`	领导风格、资源分配、冲突处理、授权方式
B5 执行节奏	项目如何运作？快慢规律？时间模式？	`B5-rhythm.md`	憋-爆节奏、周期规律、长期vs短期行为
B6 失败记录	失败过什么？怎么承认？怎么恢复？	`B6-failure.md`	错误类型、恢复周期、失败后行为模式

行为数据采集的信息源优先级（通用基础）

优先级	来源类型	说明
P0	可量化成果数据	业绩排名、项目完成率、财务数据、公开业绩披露、榜单
P1	决策行为记录	访谈中的决策过程、回忆录中的选择、传记中的关键时刻
P2	实际结果验证	原话 vs 结果的差距、承诺 vs 交付的对比
P3	压力场景行为	危机时刻的公开动作、逆境中的实际行动
P4	外部评价	同事/下属的评价、竞争对手的评价、批评与质疑
P5	本人言论	但作为验证参考，不是主要依据

通用数据源清单（适用于所有行业）

第一梯队（最权威）：
- 维基百科 Wikipedia（多语言版本，人物生平事实基础）
- 个人官网/官方博客（如有）
- LinkedIn/专业社交档案（职业轨迹、公开活动）
- GitHub/技术博客（技术人物）
- 学术Google Scholar/ResearchGate（学术人物）

第二梯队（行业垂直）：
- 行业媒体专访：《财经》《财新》《21世纪经济报道》《界面》
- 播客/视频访谈：YouTube/Ted/喜马拉雅（长对话揭示真实思维）
- 公开演讲/路演文字稿：峰会演讲、企业发布会
- 社交媒体：Twitter/X、微博、知乎（实时观点和反应）
- 公众号/Medium/Substack（深度文章）

第三梯队（辅助验证）：
- 行业报告/年报中的管理者分析
- 竞争对手/合作伙伴的评价
- 员工评价平台：Glassdoor/脉脉
- 百科类：百度百科/ MBA智库（结构化背景信息）

社交媒体平台覆盖：
- 中文：微博、知乎、微信公众号、抖音/B站
- 英文：Twitter/X、LinkedIn、YouTube、Instagram、Facebook
- 专业技术：GitHub、Stack Overflow、Medium、Substack
- 视频：YouTube、B站、播客平台（Lex Fridman/Youtube/小宇宙）

通用排除来源：
- 未经核实的小道消息
- 匿名论坛爆料（无来源佐证）
- 纯营销软文（非独立第三方）

行业专项数据源（按领域补充）

金融/投资领域：

P0级：
- 基金净值数据（Wind/东方财富/天天基金网）
- 季报/年报持仓变化（证监会披露）
- 私募排排网/格上财富业绩数据
- 上市公司公告（重大决策披露）

P1级：
- 雪球/东财讨论区（有据可查的行为记录）
- 机构调研纪要（Wind/东方财富）
- 券商研报中的管理组合分析

P2级：
- 公开演讲/路演文字记录
- 采访中的投资逻辑陈述
- 《上海证券报》《中国基金报》人物专访

教育/内容创作领域：

P0级：
- 课程平台数据：Coursera/edX/网易云课堂/腾讯课堂学员数、评分
- YouTube/B站播放量、订阅数、内容更新频率
- 书籍销量（豆瓣/亚马逊）

P1级：
- 教学内容本身（课程视频/文章质量）
- 学员反馈/社区评价
- 竞品分析报告

P2级：
- 公开演讲/分享的文字稿
- 媒体专访

企业/管理领域：

P0级：
- 公司年报/招股说明书中的管理层信息
- 商业数据库：Crunchbase/IT桔子/天眼查

P1级：
- 商业媒体报道：《财经》《商业周刊》《福布斯》
- 行业峰会演讲

P2级：
- 员工评价：Glassdoor/脉脉
- 合作伙伴评价

Agent执行规范

每个Agent必须：

保存研究结果到 references/research/0X-xxx.md
标注来源和可信度（P0-P5）
区分"行为记录"vs"推断结论"
当信息矛盾时，保留矛盾而非抹平

Agent失败处理：

超时/无结果：继续，不等待
来源稀缺（<5个可用）：在Phase 1.5提醒用户，降低预期
信息冲突：保留冲突，标注来源

阶段1.5：研究质量汇总（给用户确认）

所有Agent完成后，暂停并展示研究质量表：

┌──────────────────┬──────────┬──────────────────────────┐
│ Agent            │ 信息质量  │ 关键发现                  │
├──────────────────┼──────────┼──────────────────────────┤
│ B1 执行模式       │ P0-P2   │ 发现：决策周期约X天...      │
│ B2 成果追踪       │ P0-P1   │ 验证：原目标vs实际达成率X% │
│ B3 压力反应       │ P2-P3   │ 关键逆境：2015年股灾...     │
│ B4 协作模式       │ P2-P3   │ 团队规模：X人，授权程度...  │
│ B5 执行节奏       │ P1-P2   │ 节奏规律：憋-爆，周期X年    │
│ B6 失败记录       │ P2-P3   │ 失败次数：X次，恢复周期...  │
├──────────────────┼──────────┼──────────────────────────┤
│ 成果验证          │ 原话兑现率：X%                      │
│ 知行差距          │ 承诺vs交付存在X处明显差距            │
│ 信息缺口          │ B4协作模式信息最稀缺                │
└──────────────────┴──────────┴──────────────────────────┘

用户确认后 → 进入阶段2

用户要求补充 → 补充指定维度后继续

阶段2：行为框架提取

2.1 行为模型提取（3-7个）

识别标准：

跨场景重现：同一行为模式出现在2+不同场景
可观察性：能通过外部行为验证，不是内心猜测
可复制性：其他人可以学习这个行为模式

每个行为模型记录：

名称：行为模式的名字（不是思维模型的名字）
一句话描述：这个人在X情况下通常会Y
来源证据：≥2个具体场景
行为触发条件：什么情况下这个模式会出现
执行特征：具体怎么做的，不是怎么想的
局限性：这个模式的失效条件

2.2 执行特征提取（5-10个）

= 这个人在做判断和行动时的快速规则。

格式："如果X，则Y" + 具体案例支撑

例如：

"如果持仓回撤20%，不急着减仓，先问为什么跌"
"如果团队有不同意见，不立刻表态，让双方充分表达"
"如果项目进展顺利，不加资源，保持现状"

2.3 成果验证分析

核心问题：这个人的结果和他的行为之间是什么关系？

成果验证框架：
① 公开承诺 vs 实际交付
   - 他说过要做到X
   - 实际做到了吗？
   - 差距在哪里？

② 成功项目 vs 失败项目
   - 成功的项目有哪些共同的行为特征？
   - 失败的项目有哪些共同的行为特征？
   - 两者的关键差异是什么？

③ 环境依赖
   - 他的行为模式在什么环境下有效？
   - 在什么环境下可能失效？

2.4 知行差距分析

分析维度：
① 言行差距（说 vs 做）
   - 他说了什么？
   - 他做了什么？
   - 差距有多大？

② 意图 vs 结果
   - 他想实现什么？
   - 实际结果是什么？
   - 差距的来源是什么？

③ 能力 vs 表现
   - 他有这个能力吗？
   - 他实际展示过吗？
   - 什么条件下他会展示/不展示？

阶段3：技能建设

3.1 创建技能目录

根据阶段2的输出，创建目标人物的SKILL.md：

{person-name}-behavior/
├── SKILL.md                          # 主文件（必须）
├── scripts/                           # 可执行脚本（按需）
│   └── friction_diagnosis.py           # 知行摩擦诊断脚本（个性化）
└── references/
    ├── research/                     # 存档的研究材料
    └── validation/                   # 验证记录

3.2 检查可复用模块

在创建新脚本前，先检查是否有可复用资源：

复用优先级检查清单：

① clawhub现有技能中的脚本：
   - songge-academic-search/ （论文检索模块）
   - tencent-cos-skill/ （数据处理相关）
   - 其他可适配的脚本

② 通用行为分析脚本：
   - 行为模式匹配脚本（正则/关键词）
   - 成果验证计算脚本

③ 数据处理脚本：
   - 文本清洗/结构化
   - 多源信息融合
   - 证据权重计算

④ 如果没有可复用：
   - 创建新脚本，模块化设计
   - 单个脚本不超过200行
   - 必须有输入/输出/日志说明
   - 必须可独立运行和验证

3.3 核心脚本：知行摩擦诊断器（个性化定制）

这是阳明先生的核心创新，每个生成的skill都包含此脚本，且根据目标人物的行为特征个性化定制。

个性化诊断维度生成逻辑：

# 基于人物的行为模型，动态生成诊断维度

def generate_diagnosis_dimensions(person_model):
    """
    根据目标人物的行为特征，生成个性化的诊断维度
    """
    dimensions = []

    # 从行为模型中提取关键行为特征
    for model in person_model.behavior_models:
        # 每个行为模型对应一个诊断维度
        dimensions.append({
            "name": model.name,  # 行为模式名称
            "description": model.description,  # 描述
            "trigger": model.trigger_condition,  # 触发条件
            "target_behavior": model.execution_feature,  # 目标行为
            "friction_type": model.friction_type  # 可能的摩擦类型
        })

    # 添加通用维度
    common_dimensions = [
        "决策时机",
        "压力反应",
        "失败恢复",
        "执行彻底性",
        "时间视野"
    ]

    for dim in common_dimensions:
        if dim not in [d["name"] for d in dimensions]:
            dimensions.append({
                "name": dim,
                "description": "通用行为维度",
                "target_behavior": "因人而异",
                "friction_type": "待分析"
            })

    return dimensions

friction_diagnosis.py 功能：

输入：
1. 用户的行为描述（以具体场景/故事形式）
2. 目标人物的行为模型（从SKILL.md读取）

输出：
① 用户行为与目标人物行为模式的匹配度
② 具体差距点（知行摩擦点）- 基于目标人物的个性化维度
③ 针对用户的个人改进建议
④ 练习建议（具体的、可操作的）

诊断维度（个性化）：
- 每个维度来自目标人物的行为模型
- 不是固定模板，而是基于研究结果动态生成
- 用户可诊断的维度数量取决于行为模型的丰富度

诊断输出格式（个性化）：

┌─────────────────────────────────────────┐
│  知行摩擦诊断报告                        │
│  用户 vs [目标人物]                       │
├─────────────────────────────────────────┤
│  【个性化摩擦点】                        │
│                                         │
│  摩擦点1：[目标人物行为模型A]             │
│  - 目标人物做法：[来自行为模型的执行特征]   │
│  - 你的做法：[用户描述的行为]              │
│  - 差距原因：[推断来源]                   │
│  - 建议：[针对性的、可操作的建议]          │
│                                         │
│  摩擦点2：[目标人物行为模型B]             │
│  - ...                                  │
│                                         │
├─────────────────────────────────────────┤
│  综合评估：知行摩擦指数 X/10              │
│  主要矛盾：[最突出的差距]                │
│  核心建议：[整体改进方向]                 │
└─────────────────────────────────────────┘

3.4 输出SKILL.md结构

每个生成的skill包含：

# [人物名] · 行为操作系统

## 身份激活规则
## 行为指纹档案（6个维度）
## 行为模型（3-7个，带场景证据）
## 执行特征（5-10个，带案例）
## 成果验证
## 知行差距分析
## 触发场景
## 应用指南
## 知行摩擦诊断（内置诊断问题）
## 局限与边界
## 退出规则

附录：
- 原始研究成果索引
- 可执行脚本说明

阶段4：质量验证

4.1 已知行为测试

选取目标人物3个已知行为场景，用新生成的skill回答"此人在此场景会怎么做"，对比实际行为记录。

匹配 → 模型有效
偏离 → 追溯并调整行为模型权重

4.2 边缘行为推断

选取1个目标人物未公开讨论但相关的新场景，用skill推断。

预期输出："基于模型X和Y，可能...，但不确定"
不应绝对确定

4.3 知行摩擦测试

用诊断脚本测试：

输入用户自己的一个真实行为场景
输出摩擦点和建议
用户反馈是否准确

4.4 质量评分表

检查项	通过	信号
行为模型数量	3-7个，每个有来源证据	<3或>10个
每个模型局限性	有明确的失效条件	只写优点
执行特征可操作性	5-10个，每个带案例	模糊/通用
成果验证	有承诺vs交付对比	只写成功
知行差距分析	≥2个矛盾对	过于一致（假）
知行摩擦诊断	脚本可运行，维度个性化	无法诊断
主要来源比例	>50%为P0-P2来源	过多二手

阶段5：周期性执行日志（持续优化）

日志输出机制

每个生成的skill包含 logs/execution_log.md，记录：

# 行为skill执行日志

## 使用记录
| 日期 | 用户输入场景 | 诊断输出 | 用户反馈 |
|------|------------|---------|---------|
| 2026-05-24 | "我总是不能在压力下做决定" | 摩擦点：决策延迟 | 准确/需调整 |

## 摩擦点趋势
| 摩擦点 | 出现次数 | 严重程度 | 最近一次 |
|--------|---------|---------|---------|
| 压力下决策延迟 | 5次 | 高 | 2026-05-23 |

## 行为改进跟踪
| 目标 | 开始日期 | 当前状态 | 下次检查 |
|------|---------|---------|---------|
| 建立48小时决策规则 | 2026-05-20 | 进行中 | 2026-05-27 |

## 模型迭代记录
- [日期] 根据用户反馈，调整B3压力反应模型的权重

更新频率：每次使用skill后，用户确认诊断结果时更新日志

特色机制：知行摩擦

什么是"知行摩擦"

知行摩擦 = 知道应该做A
          但实际做了B
          差距的来源是C

例如：
- 知道应该长期持有，但实际频繁交易（摩擦：短期情绪驱动）
- 知道应该在压力下冷静，但实际立即反应（摩擦：情绪触发 vs 理性延迟）
- 知道应该逆向投资，但实际追涨杀跌（摩擦：群体压力 vs 独立判断）

个性化诊断说明

知行摩擦诊断不是固定模板，而是基于目标人物的行为模型动态生成。

每个生成的skill包含：

目标人物的行为模型列表（阶段2产出）
个性化的诊断维度（从行为模型提取）
针对性的摩擦分析（不是通用模板）

这确保：

诊断维度与目标人物的行为特征高度相关
摩擦分析基于真实研究而非泛泛而谈
用户得到的建议是针对具体差距的具体方案

特殊场景处理

历史人物

信息源以正史/传记/书信为主，辅以后人研究
无法获取量化成果，用定性描述替代
行为推断需要更多上下文背景
明确标注信息推断成分

当代公众人物

优先使用可验证的业绩数据（P0级）
公开言论作为验证，不作为主要依据
特别注意：成功者的"幸存者偏差"
失败案例同等重要

用户自定义人物

用户需提供至少3个具体行为场景
用户需说明与目标人物的关系（学习/模仿/超越/避免）
诊断时会考虑用户的使用目的

质量红线（绝不触碰）

不编造行为记录：没有来源的行为描述不能写入skill
不美化失败：失败模式同等重要，不能只写成功
不承诺适用性：明确标注skill的局限性
不替代本人：免责声明必须明确
不模糊知行：知道和做到之间的差距必须明确指出

示例技能包（已生成，可直接使用）

本引擎已内置两个示例技能包，可直接激活使用：

吴恩达（Andrew Ng）· 规模化教育知行顾问

位置：references/andrew-ng-behavior/SKILL.md

激活方式：

"用吴恩达的视角分析"
"吴恩达会怎么做"
"AI教育怎么规模化"
"知行摩擦诊断吴恩达"

核心特征：规模化优先、快速重建、时机节奏感

适用场景：AI教育方向、创业时机判断、规模化扩张、职业转型

卡帕西（Andrej Karpathy）· 代码即教学知行顾问

位置：references/karpathy-behavior/SKILL.md