阳明先生

Dev Tools

阳明先生 v1.0 知行合一的行为操作系统。输入任何名字,自动研究其行为模式、执行特征、成果验证,生成可运行的行为视角skill。 核心创新:引入"知行摩擦"诊断机制,帮助用户识别自身行为与目标人物之间的差距,从而改进行为。 致敬经典方法论:融合认知科学、学习理论、行为分析等多学科框架,构建完整的行为研究体系。 ⚡️ 触发优先级规则: 当用户表达以下意图时,优先使用本引擎: - 「创建XX的知行顾问」「创建XX的行为视角」「创建AI投资/职场/XX顾问」 - 「XX的执行特征」「研究XX的行为」「知行摩擦诊断」 - 「给我创建一个类似XX的skill」 - 「我想分析某人的行为模式并生成skill」 ⚠️ 禁止:手动编写视角skill,必须通过本引擎的6个并行Agent研究流程生成,确保研究可追溯、行为有据。 📦 示例技能包(开箱即用): - 吴恩达(Andrew Ng):规模化教育知行顾问。DeepLearning.AI创始人,Coursera联合创始人。 - 卡帕西(Andrej Karpathy):代码即教学知行顾问。OpenAI研究员,CS231n课程创始人。

Install

openclaw skills install yangming-behavior-builder

阳明先生 v1.0

知行合一的行为操作系统

"知是行的主意,行是知的功夫。知行合一,不是先知后行,而是未知便未行。" "此心不动,随心而动。"


核心哲学

知行合一:真正的"知道"体现在"做到"。

只研究人说了什么是浅层的,研究人实际做了什么、结果如何、能否复制,才是真正的学习。

阳明先生造人术,不是造人,是借镜照己——通过研究行为模式,识别自己的知行摩擦,从而改进行为。


阶段0:确认需求(30秒)

收到名字后,确认:

  1. 对象是谁:确保理解正确,中英文名、身份背景
  2. 研究目的
    • 作为行为顾问(执行改进用)?
    • 作为分析参考(写书/内容创作)?
    • 个人发展规划对照?
  3. 聚焦方向:全面行为画像 vs 聚焦单一维度(如逆境执行/决策模式)
  4. 新或更新:是否已有此人的skill存在

用途筛选检查

满足以下任一条件,建议继续:

  • 有公开的决策/行为记录(访谈、回忆录、传记、新闻报道)
  • 有可量化的成果数据(业绩、排名、项目完成率)
  • 此人在某领域有公认的突出执行能力
  • 用户有明确的行为改进目标

满足以下任一条件,建议放弃或降低预期:

  • 信息源极度匮乏(少于5个可用来源)
  • 此人行为记录与公开言论严重不符(可能存在信息造假)
  • 用户目的不明确(仅为猎奇,无实际应用需求)
  • 时间/精力投入产出比过低
┌─────────────────────────────────────┐
│  阳明曰:「知之真切笃实处,即是行。」
│  若无真切之行可研究,则无造skill之必要。
└─────────────────────────────────────┘

如果决定继续:立刻执行阶段0.5,不要等待。


阶段0.5:创建技能目录

立即执行,在研究之前创建目录结构:

{yangming-behavior}/
├── SKILL.md                          # 最终交付物
├── references/
│   ├── research/                     # 每个Agent的研究输出(必须保存)
│   │   ├── B1-execution.md           # 执行模式研究
│   │   ├── B2-achievement.md         # 成果追踪研究
│   │   ├── B3-pressure-response.md   # 压力反应研究
│   │   ├── B4-collaboration.md        # 协作模式研究
│   │   ├── B5-rhythm.md              # 执行节奏研究
│   │   └── B6-failure.md             # 失败模式研究
│   └── sources/                      # 原始材料
│       ├── articles/                 # 文章/报道
│       ├── transcripts/              # 访谈记录
│       ├── data/                    # 数据/排名/业绩
│       └── books/                   # 书籍/文献
├── scripts/                          # 模块化可执行脚本
│   └── friction_diagnosis.py         # 知行摩擦诊断脚本(个性化定制)
└── logs/
    └── execution_log.md             # 周期性执行日志

关键规则

  • 每个Agent必须将研究结果保存到对应md文件
  • 研究不存档等于未发生
  • 技能目录必须自包含,复制整个目录应能独立工作

阶段1:多源行为数据采集(并行6个Agent)

Launch 6 parallel subagents,每个负责一个行为维度。

6个Agent任务分配

Agent研究问题输出文件核心关注
B1 执行模式这个人怎么组织工作?决策流程?执行习惯?B1-execution.md时间管理、决策节奏、信息处理方式
B2 成果追踪实际交付了什么?vs计划了什么?完成率?B2-achievement.md成果与目标的差距、执行效率、代表性成就
B3 压力反应危机时怎么行动?逆境中做了什么选择?B3-pressure-response.md压力下的决策模式、行为轨迹、反弹速度
B4 协作模式怎么带团队?处理冲突?分配资源?B4-collaboration.md领导风格、资源分配、冲突处理、授权方式
B5 执行节奏项目如何运作?快慢规律?时间模式?B5-rhythm.md憋-爆节奏、周期规律、长期vs短期行为
B6 失败记录失败过什么?怎么承认?怎么恢复?B6-failure.md错误类型、恢复周期、失败后行为模式

行为数据采集的信息源优先级(通用基础)

优先级来源类型说明
P0可量化成果数据业绩排名、项目完成率、财务数据、公开业绩披露、榜单
P1决策行为记录访谈中的决策过程、回忆录中的选择、传记中的关键时刻
P2实际结果验证原话 vs 结果的差距、承诺 vs 交付的对比
P3压力场景行为危机时刻的公开动作、逆境中的实际行动
P4外部评价同事/下属的评价、竞争对手的评价、批评与质疑
P5本人言论但作为验证参考,不是主要依据

通用数据源清单(适用于所有行业)

第一梯队(最权威):
- 维基百科 Wikipedia(多语言版本,人物生平事实基础)
- 个人官网/官方博客(如有)
- LinkedIn/专业社交档案(职业轨迹、公开活动)
- GitHub/技术博客(技术人物)
- 学术Google Scholar/ResearchGate(学术人物)

第二梯队(行业垂直):
- 行业媒体专访:《财经》《财新》《21世纪经济报道》《界面》
- 播客/视频访谈:YouTube/Ted/喜马拉雅(长对话揭示真实思维)
- 公开演讲/路演文字稿:峰会演讲、企业发布会
- 社交媒体:Twitter/X、微博、知乎(实时观点和反应)
- 公众号/Medium/Substack(深度文章)

第三梯队(辅助验证):
- 行业报告/年报中的管理者分析
- 竞争对手/合作伙伴的评价
- 员工评价平台:Glassdoor/脉脉
- 百科类:百度百科/ MBA智库(结构化背景信息)

社交媒体平台覆盖:
- 中文:微博、知乎、微信公众号、抖音/B站
- 英文:Twitter/X、LinkedIn、YouTube、Instagram、Facebook
- 专业技术:GitHub、Stack Overflow、Medium、Substack
- 视频:YouTube、B站、播客平台(Lex Fridman/Youtube/小宇宙)

通用排除来源:
- 未经核实的小道消息
- 匿名论坛爆料(无来源佐证)
- 纯营销软文(非独立第三方)

行业专项数据源(按领域补充)

金融/投资领域

P0级:
- 基金净值数据(Wind/东方财富/天天基金网)
- 季报/年报持仓变化(证监会披露)
- 私募排排网/格上财富业绩数据
- 上市公司公告(重大决策披露)

P1级:
- 雪球/东财讨论区(有据可查的行为记录)
- 机构调研纪要(Wind/东方财富)
- 券商研报中的管理组合分析

P2级:
- 公开演讲/路演文字记录
- 采访中的投资逻辑陈述
- 《上海证券报》《中国基金报》人物专访

教育/内容创作领域

P0级:
- 课程平台数据:Coursera/edX/网易云课堂/腾讯课堂学员数、评分
- YouTube/B站播放量、订阅数、内容更新频率
- 书籍销量(豆瓣/亚马逊)

P1级:
- 教学内容本身(课程视频/文章质量)
- 学员反馈/社区评价
- 竞品分析报告

P2级:
- 公开演讲/分享的文字稿
- 媒体专访

企业/管理领域

P0级:
- 公司年报/招股说明书中的管理层信息
- 商业数据库:Crunchbase/IT桔子/天眼查

P1级:
- 商业媒体报道:《财经》《商业周刊》《福布斯》
- 行业峰会演讲

P2级:
- 员工评价:Glassdoor/脉脉
- 合作伙伴评价

Agent执行规范

每个Agent必须:

  • 保存研究结果到 references/research/0X-xxx.md
  • 标注来源和可信度(P0-P5)
  • 区分"行为记录"vs"推断结论"
  • 当信息矛盾时,保留矛盾而非抹平

Agent失败处理:

  • 超时/无结果:继续,不等待
  • 来源稀缺(<5个可用):在Phase 1.5提醒用户,降低预期
  • 信息冲突:保留冲突,标注来源

阶段1.5:研究质量汇总(给用户确认)

所有Agent完成后,暂停并展示研究质量表:

┌──────────────────┬──────────┬──────────────────────────┐
│ Agent            │ 信息质量  │ 关键发现                  │
├──────────────────┼──────────┼──────────────────────────┤
│ B1 执行模式       │ P0-P2   │ 发现:决策周期约X天...      │
│ B2 成果追踪       │ P0-P1   │ 验证:原目标vs实际达成率X% │
│ B3 压力反应       │ P2-P3   │ 关键逆境:2015年股灾...     │
│ B4 协作模式       │ P2-P3   │ 团队规模:X人,授权程度...  │
│ B5 执行节奏       │ P1-P2   │ 节奏规律:憋-爆,周期X年    │
│ B6 失败记录       │ P2-P3   │ 失败次数:X次,恢复周期...  │
├──────────────────┼──────────┼──────────────────────────┤
│ 成果验证          │ 原话兑现率:X%                      │
│ 知行差距          │ 承诺vs交付存在X处明显差距            │
│ 信息缺口          │ B4协作模式信息最稀缺                │
└──────────────────┴──────────┴──────────────────────────┘

用户确认后 → 进入阶段2

用户要求补充 → 补充指定维度后继续


阶段2:行为框架提取

2.1 行为模型提取(3-7个)

识别标准:

  • 跨场景重现:同一行为模式出现在2+不同场景
  • 可观察性:能通过外部行为验证,不是内心猜测
  • 可复制性:其他人可以学习这个行为模式

每个行为模型记录:

  • 名称:行为模式的名字(不是思维模型的名字)
  • 一句话描述:这个人在X情况下通常会Y
  • 来源证据:≥2个具体场景
  • 行为触发条件:什么情况下这个模式会出现
  • 执行特征:具体怎么做的,不是怎么想的
  • 局限性:这个模式的失效条件

2.2 执行特征提取(5-10个)

= 这个人在做判断和行动时的快速规则。

格式:"如果X,则Y" + 具体案例支撑

例如:

  • "如果持仓回撤20%,不急着减仓,先问为什么跌"
  • "如果团队有不同意见,不立刻表态,让双方充分表达"
  • "如果项目进展顺利,不加资源,保持现状"

2.3 成果验证分析

核心问题:这个人的结果和他的行为之间是什么关系?

成果验证框架:
① 公开承诺 vs 实际交付
   - 他说过要做到X
   - 实际做到了吗?
   - 差距在哪里?

② 成功项目 vs 失败项目
   - 成功的项目有哪些共同的行为特征?
   - 失败的项目有哪些共同的行为特征?
   - 两者的关键差异是什么?

③ 环境依赖
   - 他的行为模式在什么环境下有效?
   - 在什么环境下可能失效?

2.4 知行差距分析

分析维度:
① 言行差距(说 vs 做)
   - 他说了什么?
   - 他做了什么?
   - 差距有多大?

② 意图 vs 结果
   - 他想实现什么?
   - 实际结果是什么?
   - 差距的来源是什么?

③ 能力 vs 表现
   - 他有这个能力吗?
   - 他实际展示过吗?
   - 什么条件下他会展示/不展示?

阶段3:技能建设

3.1 创建技能目录

根据阶段2的输出,创建目标人物的SKILL.md:

{person-name}-behavior/
├── SKILL.md                          # 主文件(必须)
├── scripts/                           # 可执行脚本(按需)
│   └── friction_diagnosis.py           # 知行摩擦诊断脚本(个性化)
└── references/
    ├── research/                     # 存档的研究材料
    └── validation/                   # 验证记录

3.2 检查可复用模块

在创建新脚本前,先检查是否有可复用资源

复用优先级检查清单:

① clawhub现有技能中的脚本:
   - songge-academic-search/ (论文检索模块)
   - tencent-cos-skill/ (数据处理相关)
   - 其他可适配的脚本

② 通用行为分析脚本:
   - 行为模式匹配脚本(正则/关键词)
   - 成果验证计算脚本

③ 数据处理脚本:
   - 文本清洗/结构化
   - 多源信息融合
   - 证据权重计算

④ 如果没有可复用:
   - 创建新脚本,模块化设计
   - 单个脚本不超过200行
   - 必须有输入/输出/日志说明
   - 必须可独立运行和验证

3.3 核心脚本:知行摩擦诊断器(个性化定制)

这是阳明先生的核心创新,每个生成的skill都包含此脚本,且根据目标人物的行为特征个性化定制

个性化诊断维度生成逻辑

# 基于人物的行为模型,动态生成诊断维度

def generate_diagnosis_dimensions(person_model):
    """
    根据目标人物的行为特征,生成个性化的诊断维度
    """
    dimensions = []

    # 从行为模型中提取关键行为特征
    for model in person_model.behavior_models:
        # 每个行为模型对应一个诊断维度
        dimensions.append({
            "name": model.name,  # 行为模式名称
            "description": model.description,  # 描述
            "trigger": model.trigger_condition,  # 触发条件
            "target_behavior": model.execution_feature,  # 目标行为
            "friction_type": model.friction_type  # 可能的摩擦类型
        })

    # 添加通用维度
    common_dimensions = [
        "决策时机",
        "压力反应",
        "失败恢复",
        "执行彻底性",
        "时间视野"
    ]

    for dim in common_dimensions:
        if dim not in [d["name"] for d in dimensions]:
            dimensions.append({
                "name": dim,
                "description": "通用行为维度",
                "target_behavior": "因人而异",
                "friction_type": "待分析"
            })

    return dimensions

friction_diagnosis.py 功能:

输入:
1. 用户的行为描述(以具体场景/故事形式)
2. 目标人物的行为模型(从SKILL.md读取)

输出:
① 用户行为与目标人物行为模式的匹配度
② 具体差距点(知行摩擦点)- 基于目标人物的个性化维度
③ 针对用户的个人改进建议
④ 练习建议(具体的、可操作的)

诊断维度(个性化):
- 每个维度来自目标人物的行为模型
- 不是固定模板,而是基于研究结果动态生成
- 用户可诊断的维度数量取决于行为模型的丰富度

诊断输出格式(个性化)

┌─────────────────────────────────────────┐
│  知行摩擦诊断报告                        │
│  用户 vs [目标人物]                       │
├─────────────────────────────────────────┤
│  【个性化摩擦点】                        │
│                                         │
│  摩擦点1:[目标人物行为模型A]             │
│  - 目标人物做法:[来自行为模型的执行特征]   │
│  - 你的做法:[用户描述的行为]              │
│  - 差距原因:[推断来源]                   │
│  - 建议:[针对性的、可操作的建议]          │
│                                         │
│  摩擦点2:[目标人物行为模型B]             │
│  - ...                                  │
│                                         │
├─────────────────────────────────────────┤
│  综合评估:知行摩擦指数 X/10              │
│  主要矛盾:[最突出的差距]                │
│  核心建议:[整体改进方向]                 │
└─────────────────────────────────────────┘

3.4 输出SKILL.md结构

每个生成的skill包含:

# [人物名] · 行为操作系统

## 身份激活规则
## 行为指纹档案(6个维度)
## 行为模型(3-7个,带场景证据)
## 执行特征(5-10个,带案例)
## 成果验证
## 知行差距分析
## 触发场景
## 应用指南
## 知行摩擦诊断(内置诊断问题)
## 局限与边界
## 退出规则

附录:
- 原始研究成果索引
- 可执行脚本说明

阶段4:质量验证

4.1 已知行为测试

选取目标人物3个已知行为场景,用新生成的skill回答"此人在此场景会怎么做",对比实际行为记录。

  • 匹配 → 模型有效
  • 偏离 → 追溯并调整行为模型权重

4.2 边缘行为推断

选取1个目标人物未公开讨论但相关的新场景,用skill推断。

  • 预期输出:"基于模型X和Y,可能...,但不确定"
  • 不应绝对确定

4.3 知行摩擦测试

用诊断脚本测试:

  • 输入用户自己的一个真实行为场景
  • 输出摩擦点和建议
  • 用户反馈是否准确

4.4 质量评分表

检查项通过信号
行为模型数量3-7个,每个有来源证据<3或>10个
每个模型局限性有明确的失效条件只写优点
执行特征可操作性5-10个,每个带案例模糊/通用
成果验证有承诺vs交付对比只写成功
知行差距分析≥2个矛盾对过于一致(假)
知行摩擦诊断脚本可运行,维度个性化无法诊断
主要来源比例>50%为P0-P2来源过多二手

阶段5:周期性执行日志(持续优化)

日志输出机制

每个生成的skill包含 logs/execution_log.md,记录:

# 行为skill执行日志

## 使用记录
| 日期 | 用户输入场景 | 诊断输出 | 用户反馈 |
|------|------------|---------|---------|
| 2026-05-24 | "我总是不能在压力下做决定" | 摩擦点:决策延迟 | 准确/需调整 |

## 摩擦点趋势
| 摩擦点 | 出现次数 | 严重程度 | 最近一次 |
|--------|---------|---------|---------|
| 压力下决策延迟 | 5次 | 高 | 2026-05-23 |

## 行为改进跟踪
| 目标 | 开始日期 | 当前状态 | 下次检查 |
|------|---------|---------|---------|
| 建立48小时决策规则 | 2026-05-20 | 进行中 | 2026-05-27 |

## 模型迭代记录
- [日期] 根据用户反馈,调整B3压力反应模型的权重

更新频率:每次使用skill后,用户确认诊断结果时更新日志


特色机制:知行摩擦

什么是"知行摩擦"

知行摩擦 = 知道应该做A
          但实际做了B
          差距的来源是C

例如:
- 知道应该长期持有,但实际频繁交易(摩擦:短期情绪驱动)
- 知道应该在压力下冷静,但实际立即反应(摩擦:情绪触发 vs 理性延迟)
- 知道应该逆向投资,但实际追涨杀跌(摩擦:群体压力 vs 独立判断)

个性化诊断说明

知行摩擦诊断不是固定模板,而是基于目标人物的行为模型动态生成

每个生成的skill包含:

  • 目标人物的行为模型列表(阶段2产出)
  • 个性化的诊断维度(从行为模型提取)
  • 针对性的摩擦分析(不是通用模板)

这确保:

  1. 诊断维度与目标人物的行为特征高度相关
  2. 摩擦分析基于真实研究而非泛泛而谈
  3. 用户得到的建议是针对具体差距的具体方案

特殊场景处理

历史人物

  • 信息源以正史/传记/书信为主,辅以后人研究
  • 无法获取量化成果,用定性描述替代
  • 行为推断需要更多上下文背景
  • 明确标注信息推断成分

当代公众人物

  • 优先使用可验证的业绩数据(P0级)
  • 公开言论作为验证,不作为主要依据
  • 特别注意:成功者的"幸存者偏差"
  • 失败案例同等重要

用户自定义人物

  • 用户需提供至少3个具体行为场景
  • 用户需说明与目标人物的关系(学习/模仿/超越/避免)
  • 诊断时会考虑用户的使用目的

质量红线(绝不触碰)

  1. 不编造行为记录:没有来源的行为描述不能写入skill
  2. 不美化失败:失败模式同等重要,不能只写成功
  3. 不承诺适用性:明确标注skill的局限性
  4. 不替代本人:免责声明必须明确
  5. 不模糊知行:知道和做到之间的差距必须明确指出

示例技能包(已生成,可直接使用)

本引擎已内置两个示例技能包,可直接激活使用:

吴恩达(Andrew Ng)· 规模化教育知行顾问

位置references/andrew-ng-behavior/SKILL.md

激活方式

  • "用吴恩达的视角分析"
  • "吴恩达会怎么做"
  • "AI教育怎么规模化"
  • "知行摩擦诊断吴恩达"

核心特征:规模化优先、快速重建、时机节奏感

适用场景:AI教育方向、创业时机判断、规模化扩张、职业转型


卡帕西(Andrej Karpathy)· 代码即教学知行顾问

位置references/karpathy-behavior/SKILL.md

激活方式

  • "用Karpathy的视角分析"
  • "Karpathy会怎么做"
  • "CS231n怎么学"
  • "知行摩擦诊断Karpathy"

核心特征:代码即教学、最小阻力原则、策略性退出

适用场景:深度学习路径、教学方法论、代码学习、职业生涯选择


如何使用示例技能包

直接说出触发词即可激活对应顾问,例如:

用户:吴恩达会怎么看待现在的AI教育市场?
→ 系统自动激活吴恩达视角,用第一人称回答

用户:我想诊断一下我和Karpathy的知行摩擦
→ 系统激活Karpathy,然后运行诊断脚本

如何使用本引擎创建新的skill

当用户说"帮我创建XX的知行顾问"时:

1. 阶段0:确认需求(用户输入名字和目的)
2. 阶段1:6个并行Agent研究行为模式
3. 阶段1.5:研究质量汇总
4. 阶段2:行为框架提取
5. 阶段3:生成SKILL.md + 知行摩擦诊断脚本
6. 阶段4:质量验证
7. 阶段5:注册到advisors列表

最终声明

"知行合一"不是方法论,是结果。 真正的"知"是能够做到的。 此skill的目的不是复制某个人,而是通过研究行为模式, 识别自己的知行摩擦,从而改进行为。

阳明先生,不是造人,是借镜照己。

🦀