English Assessment

Other

交互式英语水平快速测评工具。大学英语水平(CEFR B1-C1),随机生成题卷(默认20-40题或快速18题,6-8种题型,总分100分), 逐题作答,全程静默判分,最后输出得分与弱项分析。支持错题集、错题重测、查看错题讲解。内容覆盖各专业领域。 触发词:开始英语测评 / 英语测试 / 测一下英语 / 英语水平测评 / 快速测评 / 错题重测 / 看错题 / 学习进度 / 进步曲线 NOT for:英语教学、英语聊天、翻译工具

Install

openclaw skills install english-assessment

英语测评

交互式英语水平快速测评。支持默认测评、快速测评、错题重测三种模式,全程静默判分,最后输出得分与弱项分析。

核心原则

  1. 严格评分:不给同情分,具体扣分标准见「评分规则」
  2. 静默判分:每题作答后只出下一题,不反馈对错、不显示得分、不解释知识点
  3. 随机题卷:每次测评开始时随机确定题数、题型组合、分值分配,总分固定100分
  4. 测评隔离:测评进行中,用户发非测评相关消息时,回复"当前正在英语测评中,如需退出请发送「退出测评」",不执行其他指令。想执行其他操作必须先退出测评
  5. 可退出:用户说"退出测评"/"结束测评"/"不做了"→ 立即按已完成题目生成报告
  6. 错题持久化:错题存入本地文件,支持错题重测和查看讲解
  7. 成绩归档:每次测评成绩存入本地文件,支持学习进度分析

错题集

存储

  • 文件路径/tmp/english-assessment-wrong.json
  • 格式
{
  "records": [
    {
      "id": "uuid",
      "type": "英译中词汇",
      "dimension": "词汇量",
      "question": "implement",
      "user_answer": "重要的",
      "correct_answer": "实施/执行",
      "explanation": "implement 作动词表示「实施、执行」,如 implement a policy(实施政策)",
      "added_at": "2026-05-25T19:00:00+08:00",
      "source": "default"
    }
  ]
}

限制与清理

  • 数量上限:最多保留 200 条错题,超出时按时间淘汰最早的
  • 时间上限:超过 30 天的错题自动清理
  • 每次测评结束时:检查并清理超限数据
  • 去重:同一题目(question 字段相同)不重复添加,只更新最新一次的错误答案和时间

错题重测

用户说"错题重测"时:

  1. 读取错题集文件
  2. 如果错题数 < 5 → 提示"错题不足5道,暂不支持错题重测,先完成一次测评吧"
  3. 如果错题数 ≥ 5 → 从错题集中随机抽取 10 道出题
  4. 评分规则同正常测评,满分 100 分(每题 10 分)
  5. 答对的题从错题集中移除
  6. 答错的题保留在错题集中
  7. 如果中途错题集被清空(全部答对),提前结束并提示"恭喜,错题已全部掌握!🎉",输出测评报告

查看错题

用户说"看错题"时:

  1. 读取错题集文件
  2. 如果没有错题 → 提示"暂无错题记录"
  3. 每次展示最多 10 条,格式:
📝 你的错题(第 1-10 条,共 X 条)

1. 【英译中词汇】implement
   ❌ 你的答案:重要的
   ✅ 正确答案:实施/执行
   💡 implement 作动词表示「实施、执行」,如 implement a policy(实施政策)

2. ...
  1. 如果还有更多 → 提示"发送「继续看错题」查看下一页"
  2. 发送「继续看错题」→ 展示下 10 条

成绩归档

存储

  • 文件路径/tmp/english-assessment-history.json
  • 格式
{
  "records": [
    {
      "date": "2026-05-25T19:00:00+08:00",
      "mode": "default",
      "score": 76,
      "duration_min": 18,
      "weakness": ["词汇量", "语法"],
      "breakdown": {
        "词汇量": {"score": 12, "max": 35, "accuracy": "34%"},
        "语法": {"score": 18, "max": 32, "accuracy": "56%"},
        "翻译能力": {"score": 22, "max": 28, "accuracy": "79%"},
        "商务表达": {"score": 15, "max": 28, "accuracy": "54%"},
        "阅读理解": {"score": 9, "max": 10, "accuracy": "90%"}
      }
    }
  ]
}

规则

  • 只保存:日期、测评模式、得分、时长、弱项维度、各维度得分率
  • 不保存:具体题目、错题内容、改进措施、学习建议、题目数量
  • 无上限:长期保留,用于学习进度分析
  • 每次测评结束后自动追加一条记录

学习进度分析

用户说"学习进度"或"进步曲线"时:

  1. 读取成绩归档文件
  2. 如果记录 < 2 → 提示"至少完成2次测评才能分析进度"
  3. 输出分析报告:
📈 学习进度分析(共 X 次测评)

📊 得分趋势:
| 日期 | 模式 | 得分 | 时长 | 弱项 |
|---|---|---|---|---|
| 5/25 | 默认 | 76 | 18min | 词汇量、语法 |
| 5/28 | 快速 | 82 | 10min | 语法 |
| 6/01 | 默认 | 85 | 15min | 商务表达 |

✅ 进步:得分从 76 → 85(+9),时长从 18min → 15min(-3min)
⚠️ 持续弱项:语法连续3次为弱项,建议重点攻克
🔥 最好维度:阅读理解(稳定90%+)

测评流程

开始阶段

用户说"开始英语测评"时,按以下逻辑判断模式:

  1. 读取错题集,统计错题数量
  2. 如果错题数 ≥ 20 → 先问用户:"你的错题集有 X 道错题,要清理错题集吗?(清理=清空全部 / 保留 / 先做错题重测)"
  3. 等用户回复后,再进入模式选择
  4. 输出模式选择:
🎯 请选择测评模式:

1️⃣ 默认测评 — 20-40 题,全面评估
2️⃣ 快速测评 — 约 18 题,快速出分

回复 1 或 2 开始
  1. 如果错题数 ≥ 5,额外显示:3️⃣ 错题重测 — 10 道错题专项练习
  2. 用户选择后开始出题

答题阶段

用户作答 → 静默记录得分 → 直接出下一题:

📝 第 X/X 题 【题型】(X分)

[题目内容]

关键:不作任何反馈,不显示"正确/错误",不显示累计分数,不解释知识点。

得分记录:每道题作答后,必须立即在后台维护得分记录,记录每题的题型、题目、用户答案、正确答案、得分、归属维度。测评结束时直接汇总,禁止凭记忆估算分数。

非答案回复处理

用户回复内容不是对题目的作答(如闲聊、提问、无关内容)→ 该题记0分,直接出下一题,不作额外提醒。

退出/完成

  • 全部答完 → 输出测评报告 + 更新错题集
  • 中途"退出测评" → 按已完成题目输出报告 + 更新已完成题目的错题集
  • 用户说"跳过" → 该题记0分,出下一题

题卷生成规则

默认测评

  1. 题数:20-40题,随机确定
  2. 题型:从题型池中随机选6-8种,每种选中的题型至少出1题,句子改错最多出2题,情景对话补全最多出2题
  3. 分值分配
    • 主观题(英译中词汇、中译英词汇、中译英翻译、同义词替换、句子改写):单题5-10分
    • 半主观题(语法填空、句子改错、介词搭配):单题3-5分
    • 客观题(选择题、选词填空):单题2-4分
    • 主观题总分占比30%-60%
    • 所有题目分值之和 = 100分
  4. 分值校验:生成题卷后检查分值总和,如不等于100分,调整最后一题的分值使其凑整

快速测评

  1. 题数:约18题,随机确定(16-20题范围)
  2. 题型:从题型池中随机选4-6种
  3. 分值分配
    • 客观题:单题3-5分
    • 半主观题:单题5-7分
    • 主观题:单题8-12分
    • 所有题目分值之和 = 100分
  4. 其余规则同默认测评

通用规则

  1. 题目顺序:先易后难,客观题在前,主观题在后
  2. 内容范围
    • 约30%专业领域词汇/场景(科技、医学、法律、金融、文学、工程、艺术等,随机混合)
    • 约70%通用/学术基础词汇(日常表达、学术写作、基础语法)
    • 中译英翻译题中商务场景占比约30%-40%
    • 可通过联网搜索获取真实英语题目或专业术语
    • 联网搜题失败时:使用 AI 自身知识出题,不依赖外部搜索
  3. 难度:CEFR B1-C1,基础题约占30%,中高级题约占70%。词汇和语法考点偏向实际应用和专业场景,少出简单题
  4. 不重复:同一测评中不出现重复考点。尽量扩大题库,避免多次测评出现相同题目
  5. 情景对话补全:尽量设计成选择题形式(给出4个选项),减少需要用户手动输入长句的情况。基础单词仍需手动输入

题型池(12种)

#题型出题格式评分方式
1英译中词汇给英文单词/短语,翻译成中文主观
2中译英词汇给中文,翻译成英文主观
3语法填空含空格的英文句子,填正确形式半主观
4选择题四选一(语法/词汇/表达)客观
5中译英翻译翻译中文为英文(商务场景为主,兼顾其他场景)主观
6阅读理解短文+1-2个问题客观/主观
7句子改错找出并改正语法错误半主观
8选词填空词库+短文空格客观
9同义词替换给词/短语,写近义表达主观
10情景对话补全对话场景,四选一补全回应(优先选择题形式)客观/主观
11介词搭配选择/填写正确介词客观/半主观
12句子改写用指定句型重写句子主观

评分规则

客观题(选择题、选词填空、情景对话补全选择题)

  • 正确 = 满分,错误 = 0分

半主观题(语法填空、句子改错、介词搭配)

  • 完全正确 = 满分
  • 词根对但形式错(如时态)= 扣1分
  • 找到错误但改错 = 得一半分

主观题(英译中词汇、中译英词汇、中译英翻译、同义词替换、句子改写)

  • 意思完全正确且表达地道 = 满分
  • 意思对但表达不地道 = 扣1-2分
  • 意思接近但不精确 = 扣2-3分
  • 拼写错误但不影响理解 = 每处扣1分
  • 语法错误 = 每处扣1分
  • 遗漏关键信息 = 每处扣2分
  • 意思完全不对 = 0分

注意:翻译题必须意思准确才算对。如 deadline 翻译成"大地"= 0分。

测评报告

全部完成或退出后输出:

## 🏅 XX 分 — [等级]

📊 答题:X/X 题 | ⏱ 测评时长:约XX分钟

---

📈 分项得分:
| 维度 | 得分 | 满分 | 正确率 | 评价 |
|---|---|---|---|---|
| 词汇量 | X | X | X% | 强/中/弱 |
| 语法 | X | X | X% | 强/中/弱 |
| 翻译能力 | X | X | X% | 强/中/弱 |
| 商务表达 | X | X | X% | 强/中/弱 |
| 阅读理解 | X | X | X% | 强/中/弱 |

等级说明:
- 90-100 ⭐ 优秀 — 英语能力扎实,可应对专业场景
- 75-89 ✅ 良好 — 基础扎实,部分领域需加强
- 60-74 ⚠️ 中等 — 有一定基础,需要系统提升
- 40-59 📖 及格 — 基础薄弱,建议从基础学起
- 0-39 💪 需加强 — 建议从零开始系统学习

🔍 弱项分析:
1. [最弱维度]:具体问题 + 改进建议
2. [次弱维度]:具体问题 + 改进建议

💡 学习建议:
- [针对弱项的具体学习方向]
- [推荐资源或方法]

📝 错题详情:
| # | 题型 | 题目 | 你的答案 | 正确答案 | 得分 |
|---|---|---|---|---|---|
| 1 | 英译中词汇 | deadline | 大地 | 截止日期 | 0/3 |
| ... |

(如需查看全部答题记录,请发送「查看全部答题」→ 收到后输出含所有题目的完整答题表格)

约束

  • 测评期间不反馈对错和得分,只出下一题
  • 测评期间不处理其他指令,必须先退出测评再执行其他操作。测评中说"看错题"按非答案回复处理(记0分出下一题),需退出后再查看
  • 非答案回复 → 该题记0分,出下一题
  • "跳过" → 记0分,出下一题
  • "退出测评" → 立即按已完成题目生成报告
  • 每道题只等一次回复,不追问
  • 每次测评题目不同,不使用固定题库,尽量扩大题目多样性
  • 测评进行中再次说"开始英语测评" → 提示先退出当前测评
  • 情景对话补全优先用选择题形式,减少长句输入
  • 错题集每道题必须附带简短讲解(explanation 字段)
  • 成绩归档只存得分和弱项,不存具体题目和错题