AI测试工程师

Other

AI测试工程师全生命周期技能集合。覆盖需求分析→测试设计→AI协作→自动化→执行监控→质量度量→专项测试7大阶段共48个专家级测试技能模块，使初级测试人员输出专家级测试用例。触发词：测试用例、测试设计、测试策略、测试分析、测试报告、接口测试、性能测试、安全测试、自动化测试、AI测试、质量度量、缺陷分析、回归测试、兼容性测试、测试评审、测试估算、探索性测试、CI/CD测试、测试数据、测试环境、测试覆盖率、测试效率、质量模型、测试ROI。

Install

openclaw skills install @bettermen/ai-test-engineer

AI测试工程师 — 48模块全生命周期测试技能集

概述

本Skill将一名初级测试工程师的日常操作注入专家级知识体系，覆盖测试全生命周期的7大阶段48个核心技能模块。每个模块包含核心方法论、专家操作流程、关键检查点、常见陷阱、产出模板和AI增强技巧。

触发指南

当用户提出以下意图时加载本Skill：

编写/设计/评审测试用例
制定测试策略/计划
分析需求可测性
执行测试设计（等价类、边界值、状态迁移等）
AI辅助测试（生成用例、分析缺陷、智能回归）
搭建自动化测试框架
测试执行监控与缺陷管理
质量度量、效率分析、ROI评估
专项测试（性能、安全、兼容性、易用性）

架构总览：7阶段 × 48模块

Phase 1: 需求分析与测试策略 (6模块) → references/phase1-requirements.md
Phase 2: 测试设计方法 (8模块)        → references/phase2-design-methods.md
Phase 3: 测试用例工程 (8模块)        → references/phase3-testcase-engineering.md
Phase 4: AI协作测试 (8模块)          → references/phase4-ai-collaboration.md
Phase 5: 自动化测试 (6模块)          → references/phase5-automation.md
Phase 6: 测试执行与监控 (6模块)      → references/phase6-execution.md
Phase 7: 质量度量与分析 (6模块)      → references/phase7-quality-metrics.md

使用方式

交互式导航

当用户提出测试相关问题时，按以下步骤响应：

识别阶段：根据用户意图匹配对应的Phase
加载参考：Read对应的 references/phaseX-xxx.md 文件
定位模块：在参考文件中找到精确匹配的技能模块
执行专家流程：严格按照模块中定义的方法论、检查点、模板执行
输出专家级产物：生成结构化的测试用例/策略/报告

模块选择决策树

用户意图
├─ 涉及需求/策略/计划 → Phase 1
├─ 涉及测试方法/设计技巧 → Phase 2
├─ 涉及具体用例编写 → Phase 3
├─ 涉及AI辅助/智能化 → Phase 4
├─ 涉及自动化/CI/CD → Phase 5
├─ 涉及执行/缺陷/环境 → Phase 6
└─ 涉及度量/效率/ROI → Phase 7

跨阶段组合

对于复杂请求（如"为这个API设计完整的测试方案"），按顺序加载多个Phase：

Phase 1 → 分析需求可测性，制定测试策略
Phase 2 → 选择测试设计方法（等价类+边界值+判定表）
Phase 3 → 编写具体测试用例
Phase 5 → 设计自动化测试方案（如适用）
Phase 7 → 定义质量度量标准

快速索引：48模块一览

编号	模块名称	阶段	核心价值
M01	需求可测性分析	P1	判断需求是否可测，识别测试盲区
M02	测试策略制定	P1	选择最优测试方法和资源分配方案
M03	测试范围与优先级	P1	基于风险的测试范围裁剪
M04	风险识别与评估	P1	FMEA风险矩阵，预防性测试
M05	测试估算与资源规划	P1	工作量估算、人力和环境规划
M06	需求评审检查清单	P1	结构化需求评审，减少返工
M07	等价类划分法	P2	用最少用例覆盖最多场景
M08	边界值分析法	P2	精准捕获边界缺陷
M09	判定表与因果图	P2	复杂业务规则的逻辑化测试
M10	状态迁移测试	P2	全覆盖状态机和状态转换
M11	正交实验设计	P2	多因素组合的最小用例集
M12	场景法测试设计	P2	端到端用户场景覆盖
M13	组合测试设计	P2	Pairwise/N-wise组合覆盖
M14	错误推测法	P2	基于经验的缺陷预测
M15	功能测试用例编写	P3	8要素标准功能用例模板
M16	接口测试用例编写	P3	REST/GraphQL/gRPC全覆盖
M17	性能测试用例设计	P3	负载/压力/稳定性/峰值场景
M18	安全测试用例设计	P3	OWASP Top 10全覆盖
M19	兼容性测试用例	P3	多端多浏览器多分辨率矩阵
M20	易用性测试用例	P3	Nielsen十大可用性原则驱动
M21	测试数据构造	P3	等价类数据+边界数据+异常数据
M22	测试用例评审与优化	P3	7维度评审，去除冗余
M23	AI生成测试用例	P4	Prompt工程驱动的高质量用例生成
M24	AI辅助测试脚本	P4	自然语言→自动化脚本
M25	AI缺陷分析	P4	智能分类、根因分析、模式识别
M26	智能回归测试选择	P4	基于代码变更的精准回归
M27	AI测试数据生成	P4	智能造数，覆盖边界和异常
M28	自然语言用例转换	P4	人类语言→结构化用例
M29	AI测试覆盖率分析	P4	智能识别未覆盖路径
M30	AI辅助测试报告	P4	自动汇总、趋势分析、洞察生成
M31	自动化框架搭建	P5	选型→架构→脚手架→CI集成
M32	UI自动化测试	P5	Page Object + 智能等待 + 截图
M33	接口自动化测试	P5	契约测试+数据驱动+断言链
M34	CI/CD测试集成	P5	Pipeline设计+质量门禁+并行策略
M35	自动化脚本维护	P5	自愈定位器+参数化+模块化
M36	自动化执行与调度	P5	分布式执行+重试机制+资源管理
M37	测试环境管理	P6	环境配置即代码+数据隔离+健康检查
M38	探索性测试	P6	SBTM+测程+Charter驱动的专家探索
M39	测试进度跟踪	P6	燃尽图+进度偏差+风险预警
M40	缺陷生命周期管理	P6	提交→确认→修复→验证→关闭
M41	回归测试策略	P6	全量/选择/优先级三级回归
M42	测试执行风险监控	P6	实时风险信号+预案触发
M43	测试覆盖率度量	P7	代码/需求/风险/业务四维覆盖率
M44	缺陷密度与趋势分析	P7	DDP/缺陷注入率/收敛趋势
M45	测试效率度量	P7	用例生产率/执行效率/自动化ROI
M46	质量模型评估	P7	ISO 25010八维质量特性评估
M47	测试ROI分析	P7	缺陷预防价值/自动化节省/投入产出比
M48	质量仪表盘设计	P7	实时可视化+趋势预测+决策建议

专家级核心原则

测试用例8要素标准

每个测试用例必须包含：

用例编号（分层编号：模块-场景-序号）
测试标题（动词开头，明确验证点）
前置条件（数据+环境+权限+状态）
测试步骤（操作→预期反应，一步一验证）
预期结果（可量化、可验证、不含歧义）
测试数据（具体值，非"有效数据"）
优先级（P0阻塞/P1高/P2中/P3低）
关联需求（需求ID+版本）

测试设计五问法（5-Why for Testing）

每个测试设计决策自问：

为什么这个场景需要测？（业务影响）
为什么选择这个方法？（方法适配性）
为什么不测其他场景？（风险可接受性）
为什么这个数据？（数据代表性）
为什么这个优先级？（失败后果评估）

AI增强三原则

AI是加速器，不是替代者：AI生成后必须人工审查关键业务逻辑
Prompt决定质量：输入越结构化，输出越精准
增量验证：不要一次性让AI生成全部，分批验证后迭代