Auto Coding V3

Automation

智能自主编码系统 v3.7-discipline — 全子代理架构 + 分阶段技能注入。支持 8 步循环、Reviewer 否决权、复杂度自动分级、Risk Scorecard 量化检测。触发词: auto-coding, 写代码, 开发, coding, karpathy

duplicate of @krislu1221/auto-coding-skill (3.1.1)

Install

openclaw skills install auto-coding-skill

Auto-Coding v3.7-discipline

概述 / Overview

Auto-Coding 是一个智能自主编码系统,通过全子代理架构 + 分阶段技能注入,完成从需求到代码的完整开发流程。

Auto-Coding is an intelligent autonomous coding system that completes the full development lifecycle from requirements to code through a fully sub-agent architecture with staged skill injection.

本质: 单进程串行 + 多角色 Prompt + 多模型切换。每一步换不同的人格和模型来审视代码,不是真正的多 Agent 并行。

Essence: Single-process serial execution + multi-role prompting + multi-model switching. Each step uses a different persona and model to review the code — not true multi-agent parallelism.

核心特性:

  • 全子代理架构 — 主会话只做监工,所有干活用子代理执行
  • 分阶段技能注入 — 每阶段注入对应技能文件,≤2 技能/阶段
  • 8 步循环 — 设计→分解→编码→测试→反思→优化→验证→输出
  • Reviewer 否决权 — 审查发现 🔴 阻塞项触发重写,最多 3 次迭代
  • 复杂度自动分级 — A (Micro) / B (Feature) / C (System),自动跳过不需要的阶段
  • Risk Scorecard — 五元组量化检测,公用信号识别
  • 状态持久化 — .auto-coding/state.json,session 断了可恢复
  • 审批策略 — .auto-coding/rules.yaml,敏感操作自动拦截

Key features:

  • Full sub-agent architecture — main session only supervises; all work delegated to sub-agents
  • Staged skill injection — each phase injects corresponding skill files, ≤2 skills per phase
  • 8-step cycle — Design → Decompose → Code → Test → Reflect → Optimize → Verify → Output
  • Reviewer veto power — 🔴 blockers trigger rewrite, up to 3 iterations
  • Auto complexity grading — A (Micro) / B (Feature) / C (System), auto-skip irrelevant phases
  • Risk Scorecard — 5-tuple quantified detection with public signal recognition
  • State persistence — .auto-coding/state.json, resume from last phase on session break
  • Approval rules — .auto-coding/rules.yaml, auto-intercept sensitive operations

设计哲学 / Design Philosophy

  1. 思考优先 — 不假设,模糊需求列出假设或直接提问

  2. 极简主义 — 最少代码解决问题,自检"200 行能否缩到 50 行"

  3. 手术刀修改 — 只改必须改的,不顺手重构,遵循现有风格

  4. 目标导向 — 先定义 Done 标准再编码,验证通过才算完成

  5. Think first — Don't assume; list assumptions for ambiguous requirements or ask directly

  6. Minimalism — Solve with minimal code; self-check "can 200 lines shrink to 50?"

  7. Scalpel edits — Only change what's necessary; don't refactor opportunistically; follow existing style

  8. Goal-oriented — Define Done criteria before coding; verification pass = completion


🔴 执行铁律

铁律 1: 自动推进,不中途停下

启动后连续完成所有阶段。只在 3 种情况打断: (1) 需求不明确 (2) 多方案需选择 (3) 安全审批。

铁律 2: 全子代理化,主会话只做监工

所有干活用子代理执行。主会话职责: 分阶段派活、检查文件质量、打回重写、交付结果。

铁律 3: 每步输出,不攒到最后

每阶段完成后立刻输出结果(当前阶段、模型、做了什么、发现了什么),然后直接进入下一阶段。


📋 8 步循环流程 + 技能注入

设计 → 分解 → 编码 → 测试 → 反思 → 优化 → 验证 → 输出
  ↑_______________________________________↓
              迭代 (最多 3 次)
步骤阶段注入技能模型职责
1设计grill-with-docsdeepseek-v4-pro需求对齐、技术方案
2分解decompositiondeepseek-v4-pro任务拆解、依赖分析
3编码tdddeepseek-v4-proTDD 红-绿-重构
4测试testingdeepseek-v4-pro边界覆盖、回归检测
5反思zoom-out + code-reviewdeepseek-v4-pro审查、🔴🟡💭 分级
6优化optimizedeepseek-v4-pro推理重构
7验证verificationdeepseek-v4-pro交付验证
8输出交付物

注入规则: 每阶段 ≤2 技能文件,全局文件(risk-scorecard + discipline-meta)随首次注入附带。注入失败不阻塞流程。

Reviewer 否决权: 审查发现 🔴 阻塞项(安全漏洞、不符合需求、过度设计)→ 触发重写,最多 3 次迭代。 详细见: skills/code-review.skill.md

调试子流程: 测试失败或否决时触发 6 阶段调试(反馈循环→复现→假设→插桩→修复→清理)。 详细见: skills/diagnose.skill.md

模型适配: 各阶段模型应根据自身模型配置进行重新适配,推荐采用多模型交叉检测与验证的方式,避免单一模型盲区。

Model adaptation: Each phase's model should be re-adapted based on available model configuration. Multi-model cross-validation is recommended over single-model detection to avoid blind spots.


⚡ 复杂度自动分级

等级特征阶段数典型耗时
A (Micro)单函数、Bug 修复编码→测试→验证 (3)<2 分钟
B (Feature)模块开发、单 API设计→编码→测试→验证 (4)2-5 分钟
C (System)完整系统、多文件重构设计→分解→编码→测试→反思→优化→验证 (7)5-15 分钟

A 级至少注入 grill-with-docs(需求确认部分)。连续 2 次阻塞自动升级为 B 级。


🤖 模型分配 + 降级

阶段首选Fallback 1Fallback 2
设计/分解deepseek-v4-proMiMo v2.5 Pro
编码/测试deepseek-v4-proMiMo v2.5 Pro
审查/优化deepseek-v4-proMiMo v2.5 Pro
验证deepseek-v4-proMiMo v2.5 Pro

降级原则: 优先同级别 → 降一级 → 记入日志。


📝 子代理铁律

所有子代理禁止输出完整内容到对话:

✅ {阶段}完成
📄 输出文件: {file1}, {file2}, ...
💡 一句话结论: {核心结论}

🧠 Karpathy 铁律(精简)

  1. 思考优先: 不假设,模糊需求列出假设或直接提问
  2. 极简主义: 最少代码解决问题,自检"200 行能否缩到 50 行"
  3. 手术刀修改: 只改必须改的,不顺手重构,遵循现有风格
  4. 目标导向: 先定义 Done 标准再编码,验证通过才算完成

📁 技能文件索引

技能文件注入阶段职责
skills/grill-with-docs.skill.mdStep 1 设计需求对齐、结构化追问、CONTEXT.md 维护
skills/decomposition.skill.mdStep 2 分解任务拆解纪律、依赖分析、粒度检查
skills/tdd.skill.mdStep 3 编码TDD 红-绿-重构循环、垂直切片规则
skills/testing.skill.mdStep 4 测试测试策略、边界覆盖、回归检测
skills/zoom-out.skill.mdStep 5 反思全局视角、跨模块依赖分析
skills/code-review.skill.mdStep 5 反思Reviewer 审查、🔴🟡💭 分级、Reviewer 否决权
skills/optimize.skill.mdStep 6 优化重构纪律、性能优化检查清单
skills/verification.skill.mdStep 7 验证交付验证清单、阶段聚合
skills/diagnose.skill.md调试子流程6 阶段系统化调试
skills/improve-architecture.skill.mdStep 8.5架构健康检查、深层耦合发现
skills/risk-scorecard.skill.md全局(首次附带)Risk Scorecard 五元组、公用信号检测规则
skills/discipline-meta.skill.md全局(首次附带)元规则、量化上限、override 流程

⚠️ 安全透明声明

外部操作

操作工具数据流向说明
模型推理openclaw infer model run任务描述 → 本地推理服务发送任务描述和代码上下文,不含 API 密钥
Cron 监控openclaw cron add/rmCron 名称 → OpenClaw 调度器创建/删除定时检查,可选飞书通知
飞书通知sessions_send任务标题/状态 → 飞书通道默认禁用,需显式开启
环境变量os.environ.get()系统环境 → 模型配置仅读取 AUTO_CODING_MODEL_*,不含敏感字段

文件系统

操作范围说明
写入工作目录内代码文件、测试文件、日志
读取工作目录内项目依赖、配置文件
状态.auto-coding/任务状态、阶段日志

模型环境变量

AUTO_CODING_MODEL_DESIGN=...     # 设计阶段模型覆盖
AUTO_CODING_MODEL_DECOMPOSE=...  # 分解阶段模型覆盖
AUTO_CODING_MODEL_CODE=...       # 编码阶段模型覆盖
AUTO_CODING_MODEL_TEST=...       # 测试阶段模型覆盖
AUTO_CODING_MODEL_REVIEW=...     # 审查阶段模型覆盖
AUTO_CODING_MODEL_OPTIMIZE=...   # 优化阶段模型覆盖
AUTO_CODING_MODEL_VERIFY=...     # 验证阶段模型覆盖
AUTO_CODING_FALLBACK_MODEL_1=... # 回退模型 1
AUTO_CODING_FALLBACK_MODEL_2=... # 回退模型 2

所有环境变量均为可选,不含 API 密钥或敏感配置。


📦 使用示例

  • A 级: "写一个 Python 函数计算两个列表的交集" → 编码→测试→验证
  • B 级: "帮我实现一个 REST API,支持用户注册和登录" → 设计→编码→测试→验证
  • C 级: "从零搭建一个博客系统,支持文章发布和评论" → 完整 7 阶段

⚙️ 项目配置

  • 状态持久化: .auto-coding/state.json — session 中断自动从上次阶段恢复
  • 审批策略: .auto-coding/rules.yaml — 自定义 auto_approve / require_approval
  • 阶段日志: .auto-coding/logs/{order}-{phase}.log — 每个阶段独立可追溯

v3.7-discipline · 2026-05-22