Install
openclaw skills install testcase-reviews对功能测试用例进行自动化、结构化、可量化的质量评审,覆盖完整性、准确性、 有效性、规范性、可维护性、可执行性六大核心维度,并深度检查原子性、独立性、 可重复性、可追溯性、设计方法运用等优秀特征。 输出详细评审报告、缺失场景补充、依赖分析与改进建议。
openclaw skills install testcase-reviews本技能提供一套可落地、可量化、可部分自动化的功能测试用例评审方案,围绕以下六大质量维度展开,每个维度下细分具体检查点:
| 维度 | 权重 | 核心关注点 |
|---|---|---|
| 完整性 | 30% | 功能点、业务规则、边界值、异常场景、字段校验、状态流转是否全覆盖 |
| 准确性 | 25% | 前置条件清晰、步骤可执行无歧义、预期结果可验证且能暴露缺陷 |
| 有效性 | 15% | 用例设计方法运用恰当,能发现目标缺陷;断言不仅包含“做什么”还包含“不做什么” |
| 可执行性 | 10% | 测试数据可构造、环境依赖明确、步骤无跳步、无不可重现操作 |
| 规范性 | 10% | ID/标题/优先级/类型/术语符合团队标准,可追溯性达标 |
| 可维护性 | 10% | 原子性、独立性、步骤与数据解耦、结构清晰、易于修改 |
补充特性(贯穿于上述维度中检查):
需求文档和测试用例均为必填项,缺少任一项评审不可启动。
若用户未提供需求文档或测试用例,必须先要求用户补充,不进入评审流程。
| 输入项 | 格式要求 | 是否必填 | 说明 |
|---|---|---|---|
| 需求文档 | Markdown(.md) / Word(.docx) / PDF / 纯文本 / PRD链接 | ✅ 必填 | 需求描述、用户故事、功能列表、业务规则、字段逻辑、流程图等。作为评审基准,用于覆盖度分析、业务规则匹配、预期结果准确性校验 |
| 测试用例 | Excel(.xlsx) / Markdown 表格 / JSON 数组 / 纯文本列表 | ✅ 必填 | 必须包含ID、标题、步骤、预期等基础字段。评审的直接对象 |
| 业务规则 | 键值对、表格或结构化描述 | 可选 | 额外补充的业务规则,例如:权限: 销售经理→发起按钮可见 |
| 评审侧重点 | 逗号分隔的关键词 | 可选 | 权限,边界值,异常场景,状态流转 |
| 团队规范 | 优先级/类型定义、命名规则、模板 | 可选 | 若不提供则采用通用规范 |
评审启动时,需从需求文档中提取以下信息用于评审比对:
以上信息将用于与测试用例进行逐项比对,确保每个需求点均有对应测试覆盖。
无论输入格式如何,单条用例必须至少包含:
评审开始前自动执行格式校验,发现以下问题直接记入 “格式类问题清单” ,不纳入质量评分但必须修正:
以下检查可由脚本/工具自动完成,评审报告中会列出违规项:
关联需求/模块标识/需求ID为空则提示低严重,降低可追溯性评分。基于需求文档进行以下深度检查:
| 检查项 | 检查方法 | 违规严重度 |
|---|---|---|
| 需求功能点覆盖 | 逐个检查需求ID是否有对应测试用例 | 未覆盖报高严重 |
| 业务规则覆盖 | 逐条比对需求中的业务规则是否被用例验证 | 未覆盖报中严重 |
| 字段校验覆盖 | 比对需求中的字段定义(类型、约束、默认值)是否被用例验证 | 未覆盖报中严重 |
| 异常场景覆盖 | 比对需求中的异常反馈机制是否有对应异常测试用例 | 未覆盖报高严重 |
| 预期结果准确性 | 比对用例预期结果与需求中的具体描述(提示文案、UI表现、状态变更)是否一致 | 不一致报高严重 |
| 状态流转覆盖 | 比对需求中的状态流转图是否被用例完整覆盖 | 未覆盖报中严重 |
| 非功能需求覆盖 | 比对需求中的性能指标、安全要求是否有对应测试用例 | 未覆盖报低严重 |
以下检查需要结合业务知识或上下文分析,由评审者(或 AI 以问答引导方式)完成:
评审完成后,将评审报告输出为 Markdown 文件,保存到与当前 SKILL.md 同级目录下的 report/ 目录中:
report/
格式:{项目/模块名称}测试用例评审报告.md
示例:
工作流二期_任务分配规则测试用例评审报告.md用户管理模块测试用例评审报告.md订单管理测试用例评审报告.md评审报告必须包含以下完整章节:
# {项目/模块名称} 测试用例评审报告
**评审日期**: YYYY-MM-DD
**需求文档**: {需求文档路径或链接}
**测试用例**: {测试用例文件路径或链接}
**评审依据**: testcase-reviews 技能
---
## 一、总体评价
(总体评价、需求覆盖率、综合评分、六大维度得分表格)
## 二、需求追溯矩阵
(逐条比对需求ID与测试用例覆盖情况)
## 三、格式类问题清单
(自动检测的格式问题,不计入评分但必须修正)
## 四、高严重问题清单(必须修改)
(原子性、准确性、需求一致性等高严重问题)
## 五、中/低严重问题清单(建议修改)
(规范性、完整性等中低严重问题)
## 六、缺失场景补充建议
(按测试设计技术分类的缺失场景)
## 七、用例依赖与执行顺序分析
(依赖检测、场景流分组、解耦建议)
## 八、具体用例优化建议(逐条)
(针对问题用例的具体修改建议)
## 九、评审总结与行动项
(问题统计、通过条件、结论)
| 维度 | 得分 | 满分 | 关键扣分项举例 |
|---|---|---|---|
| 完整性 | XX | 30 | 缺少小数边界、权限组合漏测、异常未覆盖 |
| 准确性 | XX | 25 | 步骤有歧义、预期不具体、数据未指明 |
| 有效性 | XX | 15 | 未应用设计方法,断言无反向验证 |
| 可执行性 | XX | 10 | 测试数据不可构造、环境未说明 |
| 规范性 | XX | 10 | 无需求ID、标题不规范、优先级滥用 |
| 可维护性 | XX | 10 | 用例强依赖、复合断言、步骤与数据紧耦合 |
注:原子性、独立性、可重复性、可追溯性等子特征已隐含在上述维度中,严重违规会在问题清单中体现。
基于需求文档逐条比对测试用例覆盖情况:
| 需求ID | 需求描述 | 测试用例覆盖 | 覆盖度 | 备注 |
|---|---|---|---|---|
| FR-001 | 需求描述 | TC_001, TC_002 | ✅ 完整 | — |
| FR-002 | 需求描述 | TC_003 | ⚠️ 部分 | 缺少XX场景 |
| FR-003 | 需求描述 | — | ❌ 未覆盖 | 需新增用例 |
需求追溯矩阵必须基于需求文档中的功能点逐条生成,确保每个需求ID均有覆盖状态标注。
(若输入提供了评审侧重点,则显示)
本次评审特别侧重:权限、边界值、异常场景。相关问题严重度已自动升档。
| 序号 | 用例标识 | 问题类型 | 问题描述 | 修改建议 |
|---|---|---|---|---|
| 1 | TC_XXX | 原子性/可重复性/... | 具体问题 | 具体修改方案 |
| 序号 | 用例标识 | 问题类型 | 问题描述 | 修改建议 |
|---|
按测试设计技术及质量特性分类梳理,评审者逐项确认:
| 依赖类型 | 前置用例 | 后置用例 | 解耦建议 |
|---|---|---|---|
| 数据依赖 | TC_01 注册 | TC_02 登录 | 建议 TC_02 通过 API 直接插入用户 |
TC_001:用例标题
通过条件:高严重问题清零 且 综合评分 ≥ 75