AI测试工程师

Other

AI测试工程师全生命周期技能集合。覆盖需求分析→测试设计→AI协作→自动化→执行监控→质量度量→专项测试7大阶段共48个专家级测试技能模块,使初级测试人员输出专家级测试用例。触发词:测试用例、测试设计、测试策略、测试分析、测试报告、接口测试、性能测试、安全测试、自动化测试、AI测试、质量度量、缺陷分析、回归测试、兼容性测试、测试评审、测试估算、探索性测试、CI/CD测试、测试数据、测试环境、测试覆盖率、测试效率、质量模型、测试ROI。

Install

openclaw skills install @bettermen/ai-test-engineer

AI测试工程师 — 48模块全生命周期测试技能集

概述

本Skill将一名初级测试工程师的日常操作注入专家级知识体系,覆盖测试全生命周期的7大阶段48个核心技能模块。每个模块包含核心方法论、专家操作流程、关键检查点、常见陷阱、产出模板和AI增强技巧。

触发指南

当用户提出以下意图时加载本Skill:

  • 编写/设计/评审测试用例
  • 制定测试策略/计划
  • 分析需求可测性
  • 执行测试设计(等价类、边界值、状态迁移等)
  • AI辅助测试(生成用例、分析缺陷、智能回归)
  • 搭建自动化测试框架
  • 测试执行监控与缺陷管理
  • 质量度量、效率分析、ROI评估
  • 专项测试(性能、安全、兼容性、易用性)

架构总览:7阶段 × 48模块

Phase 1: 需求分析与测试策略 (6模块) → references/phase1-requirements.md
Phase 2: 测试设计方法 (8模块)        → references/phase2-design-methods.md
Phase 3: 测试用例工程 (8模块)        → references/phase3-testcase-engineering.md
Phase 4: AI协作测试 (8模块)          → references/phase4-ai-collaboration.md
Phase 5: 自动化测试 (6模块)          → references/phase5-automation.md
Phase 6: 测试执行与监控 (6模块)      → references/phase6-execution.md
Phase 7: 质量度量与分析 (6模块)      → references/phase7-quality-metrics.md

使用方式

交互式导航

当用户提出测试相关问题时,按以下步骤响应:

  1. 识别阶段:根据用户意图匹配对应的Phase
  2. 加载参考:Read对应的 references/phaseX-xxx.md 文件
  3. 定位模块:在参考文件中找到精确匹配的技能模块
  4. 执行专家流程:严格按照模块中定义的方法论、检查点、模板执行
  5. 输出专家级产物:生成结构化的测试用例/策略/报告

模块选择决策树

用户意图
├─ 涉及需求/策略/计划 → Phase 1
├─ 涉及测试方法/设计技巧 → Phase 2
├─ 涉及具体用例编写 → Phase 3
├─ 涉及AI辅助/智能化 → Phase 4
├─ 涉及自动化/CI/CD → Phase 5
├─ 涉及执行/缺陷/环境 → Phase 6
└─ 涉及度量/效率/ROI → Phase 7

跨阶段组合

对于复杂请求(如"为这个API设计完整的测试方案"),按顺序加载多个Phase:

  1. Phase 1 → 分析需求可测性,制定测试策略
  2. Phase 2 → 选择测试设计方法(等价类+边界值+判定表)
  3. Phase 3 → 编写具体测试用例
  4. Phase 5 → 设计自动化测试方案(如适用)
  5. Phase 7 → 定义质量度量标准

快速索引:48模块一览

编号模块名称阶段核心价值
M01需求可测性分析P1判断需求是否可测,识别测试盲区
M02测试策略制定P1选择最优测试方法和资源分配方案
M03测试范围与优先级P1基于风险的测试范围裁剪
M04风险识别与评估P1FMEA风险矩阵,预防性测试
M05测试估算与资源规划P1工作量估算、人力和环境规划
M06需求评审检查清单P1结构化需求评审,减少返工
M07等价类划分法P2用最少用例覆盖最多场景
M08边界值分析法P2精准捕获边界缺陷
M09判定表与因果图P2复杂业务规则的逻辑化测试
M10状态迁移测试P2全覆盖状态机和状态转换
M11正交实验设计P2多因素组合的最小用例集
M12场景法测试设计P2端到端用户场景覆盖
M13组合测试设计P2Pairwise/N-wise组合覆盖
M14错误推测法P2基于经验的缺陷预测
M15功能测试用例编写P38要素标准功能用例模板
M16接口测试用例编写P3REST/GraphQL/gRPC全覆盖
M17性能测试用例设计P3负载/压力/稳定性/峰值场景
M18安全测试用例设计P3OWASP Top 10全覆盖
M19兼容性测试用例P3多端多浏览器多分辨率矩阵
M20易用性测试用例P3Nielsen十大可用性原则驱动
M21测试数据构造P3等价类数据+边界数据+异常数据
M22测试用例评审与优化P37维度评审,去除冗余
M23AI生成测试用例P4Prompt工程驱动的高质量用例生成
M24AI辅助测试脚本P4自然语言→自动化脚本
M25AI缺陷分析P4智能分类、根因分析、模式识别
M26智能回归测试选择P4基于代码变更的精准回归
M27AI测试数据生成P4智能造数,覆盖边界和异常
M28自然语言用例转换P4人类语言→结构化用例
M29AI测试覆盖率分析P4智能识别未覆盖路径
M30AI辅助测试报告P4自动汇总、趋势分析、洞察生成
M31自动化框架搭建P5选型→架构→脚手架→CI集成
M32UI自动化测试P5Page Object + 智能等待 + 截图
M33接口自动化测试P5契约测试+数据驱动+断言链
M34CI/CD测试集成P5Pipeline设计+质量门禁+并行策略
M35自动化脚本维护P5自愈定位器+参数化+模块化
M36自动化执行与调度P5分布式执行+重试机制+资源管理
M37测试环境管理P6环境配置即代码+数据隔离+健康检查
M38探索性测试P6SBTM+测程+Charter驱动的专家探索
M39测试进度跟踪P6燃尽图+进度偏差+风险预警
M40缺陷生命周期管理P6提交→确认→修复→验证→关闭
M41回归测试策略P6全量/选择/优先级三级回归
M42测试执行风险监控P6实时风险信号+预案触发
M43测试覆盖率度量P7代码/需求/风险/业务四维覆盖率
M44缺陷密度与趋势分析P7DDP/缺陷注入率/收敛趋势
M45测试效率度量P7用例生产率/执行效率/自动化ROI
M46质量模型评估P7ISO 25010八维质量特性评估
M47测试ROI分析P7缺陷预防价值/自动化节省/投入产出比
M48质量仪表盘设计P7实时可视化+趋势预测+决策建议

专家级核心原则

测试用例8要素标准

每个测试用例必须包含:

  1. 用例编号(分层编号:模块-场景-序号)
  2. 测试标题(动词开头,明确验证点)
  3. 前置条件(数据+环境+权限+状态)
  4. 测试步骤(操作→预期反应,一步一验证)
  5. 预期结果(可量化、可验证、不含歧义)
  6. 测试数据(具体值,非"有效数据")
  7. 优先级(P0阻塞/P1高/P2中/P3低)
  8. 关联需求(需求ID+版本)

测试设计五问法(5-Why for Testing)

每个测试设计决策自问:

  1. 为什么这个场景需要测?(业务影响)
  2. 为什么选择这个方法?(方法适配性)
  3. 为什么不测其他场景?(风险可接受性)
  4. 为什么这个数据?(数据代表性)
  5. 为什么这个优先级?(失败后果评估)

AI增强三原则

  1. AI是加速器,不是替代者:AI生成后必须人工审查关键业务逻辑
  2. Prompt决定质量:输入越结构化,输出越精准
  3. 增量验证:不要一次性让AI生成全部,分批验证后迭代

技能使用脚本

testcase_generator.py

自动生成标准化测试用例模板。

quality_dashboard.html

交互式质量仪表盘模板。