AI编程工程化

Data & APIs

用AI写代码一时爽,项目越写越乱火葬场?Superpowers方法论5道Gate卡住质量:设计没想清楚不准动手、没写测试不准提交。把「能跑就行」升级成工程级交付,让AI帮你写出可维护的代码。支持全栈项目(Web/移动端/API/数据)、团队协作规范、CI/CD集成指南。从需求到上线的完整工程化流水线,杜绝"AI生成代码没法维护"的通病。 触发词:AI编程工程化、Superpowers方法论、编程工作流、Gate门槛、TDD驱动、AI开发流程、工程化开发、AI代码规范、代码质量保障、AI辅助开发流程、软件工程质量、AI编程最佳实践、工程化AI、AI code workflow、TDD with AI、AI development process、code quality gates、AI工程实践、AI编码规范、工程化工作流、AI项目管理、持续集成AI、AI代码审查、开发流程优化、AI交付质量、superpowers workflow、AI native engineering、代码可维护性、技术债务管理、AI重构工作流、交付标准、工程化交付、AI代码太乱怎么办、怎么管理AI代码、AI编程流程、工程化方法论、AI代码审查标准、开发规范化、AI生成代码质量、代码工程化、开发流程标准化、AI辅助编程规范、软件质量门禁、agentic engineering、vibe coding to engineering、AI coding workflow、engineering discipline AI 排除:纯代码编写(无流程)、项目管理工具配置、非AI辅助开发、纯代码补全

Install

openclaw skills install ai-engineering-workflow

AI编程工程化 🏗️

从Vibe Coding到Agentic Engineering。AI写的代码不是"能跑就行",而是"可维护、可测试、可扩展"。

触发条件

✅ 匹配关键词(满足任一即触发)

类别关键词
通用AI编程工程化 / 工程化开发 / Superpowers方法论 / 编程工作流 / 开发流程
质量代码质量 / Gate门槛 / TDD驱动 / AI代码规范 / 代码审查 / 代码可维护性
流程开发流程 / AI开发流程 / 工程化工作流 / 交付标准 / 工程化交付 / 开发规范化
场景全栈项目 / 微服务 / API设计 / 数据管道 / 前后端协同 / 移动端
管理技术债务 / 重构工作流 / CI/CD集成 / 持续集成 / AI项目管理
痛点代码没法维护 / AI写的代码太乱 / 项目越来越乱 / 怎么管理AI代码 / AI代码质量差
进阶agentic engineering / vibe coding to engineering / AI coding workflow / engineering discipline
英文AI engineering / code quality gates / TDD with AI / AI code workflow / superpowers workflow / AI native engineering / dev workflow / software quality / engineering methodology

❌ 排除关键词(明确不触发)

  • 纯代码补全 / Copilot类 / IDE插件推荐 → 拒绝
  • 项目管理工具(Jira/Linear/Notion)配置 → 拒绝
  • 非AI辅助的传统开发 → 拒绝
  • 纯学习/教程("教我写代码")→ 拒绝
  • 代码片段生成(无工程化需求)→ 拒绝

核心流程(5 Gates + 持续改进)

Gate 1: 设计门槛

目标:确保需求边界和接口契约清晰,避免返工 通过标准:设计文档通过所有评审检查项

  • 明确需求边界和接口契约
  • 输出:设计文档(接口定义/数据模型/约束条件/依赖关系/非功能需求)
  • 设计评审清单:
    • 核心实体和关系是否清晰?(ER图/数据字典)
    • API边界是否定义(RESTful/GraphQL/gRPC)?
    • 数据库Schema是否合理(范式/索引/约束/分区)?
    • 错误处理和边界条件是否覆盖?
    • 安全考量(认证/授权/数据校验/加密)是否明确?
    • 性能指标(响应时间/并发量/数据量/QPS)是否量化?
    • 可用性目标(SLA/容灾/降级策略)是否定义?
    • 第三方依赖是否评估(版本/稳定性/许可证)?
  • 未通过:返回需求澄清,不可跳过

Gate 2: 计划门槛

目标:将设计拆解为可独立验证的原子步骤 通过标准:所有步骤有明确验收标准,依赖关系清晰

  • 拆分任务为可独立验证的步骤(每步≤4小时工作量)
  • 每步必须有明确的验收标准(输入→预期输出→边界情况)
  • 输出:执行计划(步骤/依赖关系/验收标准/预估复杂度/风险点)
  • 任务拆分原则:
    • 单一职责:每步只做一件事
    • 可测试:每步完成后能独立验证
    • 有序依赖:明确哪些可以并行,哪些必须串行
    • 可回滚:每步完成后提交checkpoint
    • 最小风险:高风险步骤优先执行
  • 计划模板:
| 步骤 | 任务 | 依赖 | 验收标准 | 复杂度 | 风险 |
|------|------|------|----------|--------|------|
| 1    |      | 无   |          | S/M/L  | 高/中/低 |
| 2    |      | 1    |          | S/M/L  | 高/中/低 |
  • 未通过:返回重新拆分

Gate 3: 测试门槛

目标:先写测试再写实现(TDD红-绿-重构循环) 通过标准:测试用例覆盖所有功能点和关键边界

  • 先写测试再写实现(红→绿→重构)
  • 测试金字塔:单元测试(70%) > 集成测试(20%) > E2E测试(10%)
  • 输出:测试用例集(边界/正常/异常/性能/安全/兼容性)
  • 测试覆盖要求:
    • 核心业务逻辑:≥90%覆盖率
    • API接口:100%端点覆盖(包括错误场景)
    • 错误路径:至少覆盖所有已知的异常场景
    • 边界值:空值/极大值/极小值/特殊字符/并发
    • 性能基准:响应时间/吞吐量/资源使用
  • 测试命名规范:test_{功能}_{场景}_{预期结果}
  • 测试分类:
    • 单元测试:函数/方法级别
    • 集成测试:模块间交互
    • 契约测试:API接口契约
    • E2E测试:用户场景完整流程
    • 性能测试:压力/负载/稳定性
    • 安全测试:注入/认证/授权
  • 未通过:补充测试覆盖,不进入实现阶段

Gate 4: 实现门槛

目标:按计划逐步实现,每步通过测试才算完成 通过标准:所有测试通过,代码符合规范

  • 按计划逐步实现,每步通过测试
  • 编码规范:
    • 函数/方法长度≤50行
    • 嵌套深度≤3层
    • 魔法数字必须用常量替代
    • 复杂逻辑必须有注释说明"为什么"(不是"做了什么")
    • 命名规范:变量/函数语义化,类名PascalCase,函数camelCase
  • 每完成一步:
    1. 运行测试套件 → 全绿
    2. 代码格式化(Prettier/Black/gofmt)
    3. Lint检查通过(ESLint/Pylint/golangci-lint)
    4. 代码提交 → 有意义的commit message(Conventional Commits)
    5. 更新文档 → API变更同步更新
  • 技术债务管理:
    • 遇到"先这样后面改"的地方,立即记录到TODO清单
    • 格式:// TODO(优先级): 描述 | 影响范围 | 预计工时
    • 每个TODO标注优先级(P0-P3)和影响范围
    • 每周清理TODO,不允许超过20个积压
  • AI代码特别注意:
    • AI生成的代码必须逐行审查(可能引入隐式bug)
    • 检查AI是否使用了过时的API/库
    • 检查AI是否添加了不必要的依赖
    • 检查AI生成的错误处理是否完整
  • 未通过:回退到上一个通过的步骤

Gate 5: 审查门槛

目标:多维度审查,确保交付质量 通过标准:无严重问题,中等问题已修复或记录

  • 代码审查:可读性/可维护性/DRY原则/SOLID原则
  • 安全审查:注入/认证/授权/数据泄露/日志安全/CORS
  • 性能审查:时间复杂度/空间复杂度/数据库查询/N+1问题/内存泄漏
  • 输出:审查报告(问题清单/严重等级/改进建议/通过/不通过)
  • 审查清单:
□ 安全性:无SQL注入/XSS/CSRF风险,认证授权正确
□ 性能:无N+1查询/无内存泄漏/无阻塞操作/合理使用缓存
□ 可维护性:命名清晰/逻辑分层/无重复代码/职责单一
□ 测试性:可独立测试/无隐式依赖/Mock合理/测试覆盖≥90%
□ 文档性:API文档/关键决策/部署说明/变更日志
□ 兼容性:向后兼容/版本迁移方案/降级策略
□ 可观测性:日志规范/Metrics/Tracing/告警
□ 部署性:CI/CD就绪/配置外部化/健康检查/回滚方案

持续改进循环(Gate 5之后)

  • 上线后监控:错误率/性能指标/用户反馈/资源使用
  • 每周回顾:哪些Gate执行不到位,为什么,如何改进
  • 知识沉淀:将踩过的坑写入团队规范/Checklist
  • 指标追踪:代码质量趋势/交付速度/缺陷密度
  • 技术债务复盘:本月新增/清理/剩余债务

输出模板

项目启动模板

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
🏗️ 工程化启动 | {项目名}
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
📋 需求概述:{一句话描述}
🎯 核心目标:{量化目标}
🔧 技术栈:{语言/框架/数据库/部署}
⏰ 预估周期:{S/M/L/XL}
📊 复杂度:{高/中/低}
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
📊 Gate进度:
  ⬜ Gate 1 设计  |  状态:待开始
  ⬜ Gate 2 计划  |  状态:待开始
  ⬜ Gate 3 测试  |  状态:待开始
  ⬜ Gate 4 实现  |  状态:待开始
  ⬜ Gate 5 审查  |  状态:待开始
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
📁 产物目录:
  ├── docs/
  │   ├── design.md        (设计文档)
  │   ├── plan.md          (执行计划)
  │   └── review.md        (审查报告)
  ├── tests/
  │   ├── unit/            (单元测试)
  │   ├── integration/     (集成测试)
  │   └── e2e/             (E2E测试)
  ├── src/                 (实现代码)
  ├── docs/
  │   ├── changelog.md     (变更日志)
  │   └── todo.md          (技术债务清单)
  └── .github/
      └── workflows/       (CI/CD配置)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

进度更新模板

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
🏗️ 工程化进度 | {项目名}
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
✅ Gate 1 设计 | ✅ Gate 2 计划
⏳ Gate 3 测试 | ⬜ Gate 4 实现
⬜ Gate 5 审查
当前卡点:{无/具体卡点}
技术债务:{X}项(P0: {n}, P1: {n}, P2: {n})
测试覆盖率:{X}%
代码质量分:{X}/10
本周完成:{N}个步骤
下周计划:{N}个步骤
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

审查报告模板

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
📋 审查报告 | {项目名} - Gate 5
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
🔴 严重问题(必须修复):
  1. {问题描述} → {修复建议}

🟡 中等问题(建议修复):
  1. {问题描述} → {修复建议}

🟢 轻微问题(可选修复):
  1. {问题描述} → {修复建议}

📊 评分:
  代码质量:{X}/10
  测试覆盖:{X}%
  安全等级:{X}/10
  性能表现:{X}/10
  文档完整:{X}/10
  可观测性:{X}/10

🏁 结论:{通过/有条件通过/不通过}
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

常见场景适配

场景Gate 1重点Gate 3重点Gate 5重点
Web全栈API设计+DB Schema+前后端边界API集成测试+组件单测XSS/CSRF/注入+首屏性能
API/微服务接口契约(OpenAPI)+服务边界契约测试+压力测试限流/熔断/降级+日志链路
数据管道数据源/Schema+处理逻辑+输出数据质量测试+边界数据性能(大数据量)+幂等性+重试
AI/ML项目模型选型+数据需求+评估指标模型准确性+对抗样本+公平性推理性能+版本管理+可解释性
移动端UI设计+离线策略+推送方案UI自动化+兼容性测试包大小+启动速度+内存占用
CLI工具命令设计+参数定义+帮助文档命令行参数测试+集成测试跨平台兼容+安装体验+错误提示

反模式警示(常见错误)

反模式症状正确做法严重程度
Gate跳过"先写代码再补测试"严格顺序,不可跳过🔴 严重
过度设计花3天设计一个CRUDGate 1控制在2小时内🟡 中等
测试形式化只写happy path必须覆盖异常和边界🔴 严重
审查走过场"LGTM"直接通过至少检查安全+性能🔴 严重
债务堆积100+ TODO未处理每周清理,不超过20个🟡 中等
AI盲信AI生成的代码不审查AI代码更需要严格审查🔴 严重
完美主义每步都要做到完美完成>完美,迭代改进🟢 轻微
文档缺失"代码即文档"关键决策必须有文档🟡 中等

边界约束

  1. 不跳步:必须按Gate顺序,不可跳过任何Gate
  2. 可回退:任何Gate失败可回退到上一个通过的Gate
  3. 文档先行:每个Gate必须有文档输出才算通过
  4. AI代码更严审:AI生成的代码审查标准应比手写代码更严格
  5. 规模适配:小项目(<500行)可合并Gate 1+2,大项目(>5000行)每个Gate需要独立评审
  6. 时间控制:每个Gate有时间盒(Gate 1: 2h, Gate 2: 1h, Gate 3: 2-4h, Gate 4: 按步推进, Gate 5: 1-2h)
  7. 持续改进:每个项目结束后复盘,更新Checklist和规范

Output Language

中文输出