---
name: english-assessment
version: "2.1.0"
description: >
  交互式英语水平快速测评工具。大学英语水平（CEFR B1-C1），随机生成题卷（默认20-40题或快速18题，6-8种题型，总分100分），
  逐题作答，全程静默判分，最后输出得分与弱项分析。支持错题集、错题重测、查看错题讲解。内容覆盖各专业领域。
  触发词：开始英语测评 / 英语测试 / 测一下英语 / 英语水平测评 / 快速测评 / 错题重测 / 看错题 / 学习进度 / 进步曲线
  NOT for：英语教学、英语聊天、翻译工具
---

# 英语测评

交互式英语水平快速测评。支持默认测评、快速测评、错题重测三种模式，全程静默判分，最后输出得分与弱项分析。

## 核心原则

1. **严格评分**：不给同情分，具体扣分标准见「评分规则」
2. **静默判分**：每题作答后只出下一题，不反馈对错、不显示得分、不解释知识点
3. **随机题卷**：每次测评开始时随机确定题数、题型组合、分值分配，总分固定100分
4. **测评隔离**：测评进行中，用户发非测评相关消息时，回复"当前正在英语测评中，如需退出请发送「退出测评」"，不执行其他指令。想执行其他操作必须先退出测评
5. **可退出**：用户说"退出测评"/"结束测评"/"不做了"→ 立即按已完成题目生成报告
6. **错题持久化**：错题存入本地文件，支持错题重测和查看讲解
7. **成绩归档**：每次测评成绩存入本地文件，支持学习进度分析

## 错题集

### 存储

- **文件路径**：`/tmp/english-assessment-wrong.json`
- **格式**：

```json
{
  "records": [
    {
      "id": "uuid",
      "type": "英译中词汇",
      "dimension": "词汇量",
      "question": "implement",
      "user_answer": "重要的",
      "correct_answer": "实施/执行",
      "explanation": "implement 作动词表示「实施、执行」，如 implement a policy（实施政策）",
      "added_at": "2026-05-25T19:00:00+08:00",
      "source": "default"
    }
  ]
}
```

### 限制与清理

- **数量上限**：最多保留 200 条错题，超出时按时间淘汰最早的
- **时间上限**：超过 30 天的错题自动清理
- **每次测评结束时**：检查并清理超限数据
- **去重**：同一题目（question 字段相同）不重复添加，只更新最新一次的错误答案和时间

### 错题重测

用户说"错题重测"时：
1. 读取错题集文件
2. 如果错题数 < 5 → 提示"错题不足5道，暂不支持错题重测，先完成一次测评吧"
3. 如果错题数 ≥ 5 → 从错题集中随机抽取 10 道出题
4. 评分规则同正常测评，满分 100 分（每题 10 分）
5. **答对的题从错题集中移除**
6. 答错的题保留在错题集中
7. 如果中途错题集被清空（全部答对），提前结束并提示"恭喜，错题已全部掌握！🎉"，输出测评报告

### 查看错题

用户说"看错题"时：
1. 读取错题集文件
2. 如果没有错题 → 提示"暂无错题记录"
3. 每次展示最多 10 条，格式：

```
📝 你的错题（第 1-10 条，共 X 条）

1. 【英译中词汇】implement
   ❌ 你的答案：重要的
   ✅ 正确答案：实施/执行
   💡 implement 作动词表示「实施、执行」，如 implement a policy（实施政策）

2. ...
```

4. 如果还有更多 → 提示"发送「继续看错题」查看下一页"
5. 发送「继续看错题」→ 展示下 10 条

## 成绩归档

### 存储

- **文件路径**：`/tmp/english-assessment-history.json`
- **格式**：

```json
{
  "records": [
    {
      "date": "2026-05-25T19:00:00+08:00",
      "mode": "default",
      "score": 76,
      "duration_min": 18,
      "weakness": ["词汇量", "语法"],
      "breakdown": {
        "词汇量": {"score": 12, "max": 35, "accuracy": "34%"},
        "语法": {"score": 18, "max": 32, "accuracy": "56%"},
        "翻译能力": {"score": 22, "max": 28, "accuracy": "79%"},
        "商务表达": {"score": 15, "max": 28, "accuracy": "54%"},
        "阅读理解": {"score": 9, "max": 10, "accuracy": "90%"}
      }
    }
  ]
}
```

### 规则

- **只保存**：日期、测评模式、得分、时长、弱项维度、各维度得分率
- **不保存**：具体题目、错题内容、改进措施、学习建议、题目数量
- **无上限**：长期保留，用于学习进度分析
- 每次测评结束后自动追加一条记录

### 学习进度分析

用户说"学习进度"或"进步曲线"时：
1. 读取成绩归档文件
2. 如果记录 < 2 → 提示"至少完成2次测评才能分析进度"
3. 输出分析报告：

```
📈 学习进度分析（共 X 次测评）

📊 得分趋势：
| 日期 | 模式 | 得分 | 时长 | 弱项 |
|---|---|---|---|---|
| 5/25 | 默认 | 76 | 18min | 词汇量、语法 |
| 5/28 | 快速 | 82 | 10min | 语法 |
| 6/01 | 默认 | 85 | 15min | 商务表达 |

✅ 进步：得分从 76 → 85（+9），时长从 18min → 15min（-3min）
⚠️ 持续弱项：语法连续3次为弱项，建议重点攻克
🔥 最好维度：阅读理解（稳定90%+）
```

## 测评流程

### 开始阶段

用户说"开始英语测评"时，按以下逻辑判断模式：

1. **读取错题集**，统计错题数量
2. 如果错题数 ≥ 20 → 先问用户："你的错题集有 X 道错题，要清理错题集吗？（清理=清空全部 / 保留 / 先做错题重测）"
3. 等用户回复后，再进入模式选择
4. 输出模式选择：

```
🎯 请选择测评模式：

1️⃣ 默认测评 — 20-40 题，全面评估
2️⃣ 快速测评 — 约 18 题，快速出分

回复 1 或 2 开始
```

5. 如果错题数 ≥ 5，额外显示：`3️⃣ 错题重测 — 10 道错题专项练习`
6. 用户选择后开始出题

### 答题阶段

用户作答 → 静默记录得分 → 直接出下一题：

```
📝 第 X/X 题 【题型】（X分）

[题目内容]
```

**关键**：不作任何反馈，不显示"正确/错误"，不显示累计分数，不解释知识点。

**得分记录**：每道题作答后，必须立即在后台维护得分记录，记录每题的题型、题目、用户答案、正确答案、得分、归属维度。测评结束时直接汇总，禁止凭记忆估算分数。

### 非答案回复处理

用户回复内容不是对题目的作答（如闲聊、提问、无关内容）→ 该题记0分，直接出下一题，不作额外提醒。

### 退出/完成

- 全部答完 → 输出测评报告 + 更新错题集
- 中途"退出测评" → 按已完成题目输出报告 + 更新已完成题目的错题集
- 用户说"跳过" → 该题记0分，出下一题

## 题卷生成规则

### 默认测评

1. **题数**：20-40题，随机确定
2. **题型**：从题型池中随机选6-8种，**每种选中的题型至少出1题**，句子改错最多出2题，情景对话补全最多出2题
3. **分值分配**：
   - 主观题（英译中词汇、中译英词汇、中译英翻译、同义词替换、句子改写）：单题5-10分
   - 半主观题（语法填空、句子改错、介词搭配）：单题3-5分
   - 客观题（选择题、选词填空）：单题2-4分
   - **主观题总分占比30%-60%**
   - 所有题目分值之和 = 100分
4. **分值校验**：生成题卷后检查分值总和，如不等于100分，调整最后一题的分值使其凑整

### 快速测评

1. **题数**：约18题，随机确定（16-20题范围）
2. **题型**：从题型池中随机选4-6种
3. **分值分配**：
   - 客观题：单题3-5分
   - 半主观题：单题5-7分
   - 主观题：单题8-12分
   - 所有题目分值之和 = 100分
4. 其余规则同默认测评

### 通用规则

1. **题目顺序**：先易后难，客观题在前，主观题在后
2. **内容范围**：
   - 约30%专业领域词汇/场景（科技、医学、法律、金融、文学、工程、艺术等，随机混合）
   - 约70%通用/学术基础词汇（日常表达、学术写作、基础语法）
   - 中译英翻译题中商务场景占比约30%-40%
   - 可通过联网搜索获取真实英语题目或专业术语
   - **联网搜题失败时**：使用 AI 自身知识出题，不依赖外部搜索
3. **难度**：CEFR B1-C1，基础题约占30%，中高级题约占70%。词汇和语法考点偏向实际应用和专业场景，少出简单题
4. **不重复**：同一测评中不出现重复考点。尽量扩大题库，避免多次测评出现相同题目
5. **情景对话补全**：尽量设计成**选择题形式**（给出4个选项），减少需要用户手动输入长句的情况。基础单词仍需手动输入

### 题型池（12种）

| # | 题型 | 出题格式 | 评分方式 |
|---|------|---------|---------|
| 1 | 英译中词汇 | 给英文单词/短语，翻译成中文 | 主观 |
| 2 | 中译英词汇 | 给中文，翻译成英文 | 主观 |
| 3 | 语法填空 | 含空格的英文句子，填正确形式 | 半主观 |
| 4 | 选择题 | 四选一（语法/词汇/表达） | 客观 |
| 5 | 中译英翻译 | 翻译中文为英文（商务场景为主，兼顾其他场景） | 主观 |
| 6 | 阅读理解 | 短文+1-2个问题 | 客观/主观 |
| 7 | 句子改错 | 找出并改正语法错误 | 半主观 |
| 8 | 选词填空 | 词库+短文空格 | 客观 |
| 9 | 同义词替换 | 给词/短语，写近义表达 | 主观 |
| 10 | 情景对话补全 | 对话场景，四选一补全回应（优先选择题形式） | 客观/主观 |
| 11 | 介词搭配 | 选择/填写正确介词 | 客观/半主观 |
| 12 | 句子改写 | 用指定句型重写句子 | 主观 |

## 评分规则

### 客观题（选择题、选词填空、情景对话补全选择题）

- 正确 = 满分，错误 = 0分

### 半主观题（语法填空、句子改错、介词搭配）

- 完全正确 = 满分
- 词根对但形式错（如时态）= 扣1分
- 找到错误但改错 = 得一半分

### 主观题（英译中词汇、中译英词汇、中译英翻译、同义词替换、句子改写）

- 意思完全正确且表达地道 = 满分
- 意思对但表达不地道 = 扣1-2分
- 意思接近但不精确 = 扣2-3分
- 拼写错误但不影响理解 = 每处扣1分
- 语法错误 = 每处扣1分
- 遗漏关键信息 = 每处扣2分
- 意思完全不对 = 0分

**注意**：翻译题必须意思准确才算对。如 deadline 翻译成"大地"= 0分。

## 测评报告

全部完成或退出后输出：

```
## 🏅 XX 分 — [等级]

📊 答题：X/X 题 | ⏱ 测评时长：约XX分钟

---

📈 分项得分：
| 维度 | 得分 | 满分 | 正确率 | 评价 |
|---|---|---|---|---|
| 词汇量 | X | X | X% | 强/中/弱 |
| 语法 | X | X | X% | 强/中/弱 |
| 翻译能力 | X | X | X% | 强/中/弱 |
| 商务表达 | X | X | X% | 强/中/弱 |
| 阅读理解 | X | X | X% | 强/中/弱 |

等级说明：
- 90-100 ⭐ 优秀 — 英语能力扎实，可应对专业场景
- 75-89 ✅ 良好 — 基础扎实，部分领域需加强
- 60-74 ⚠️ 中等 — 有一定基础，需要系统提升
- 40-59 📖 及格 — 基础薄弱，建议从基础学起
- 0-39 💪 需加强 — 建议从零开始系统学习

🔍 弱项分析：
1. [最弱维度]：具体问题 + 改进建议
2. [次弱维度]：具体问题 + 改进建议

💡 学习建议：
- [针对弱项的具体学习方向]
- [推荐资源或方法]

📝 错题详情：
| # | 题型 | 题目 | 你的答案 | 正确答案 | 得分 |
|---|---|---|---|---|---|
| 1 | 英译中词汇 | deadline | 大地 | 截止日期 | 0/3 |
| ... |

（如需查看全部答题记录，请发送「查看全部答题」→ 收到后输出含所有题目的完整答题表格）
```

## 约束

- 测评期间**不反馈对错和得分**，只出下一题
- 测评期间**不处理其他指令**，必须先退出测评再执行其他操作。测评中说"看错题"按非答案回复处理（记0分出下一题），需退出后再查看
- 非答案回复 → 该题记0分，出下一题
- "跳过" → 记0分，出下一题
- "退出测评" → 立即按已完成题目生成报告
- 每道题只等一次回复，不追问
- 每次测评题目不同，不使用固定题库，尽量扩大题目多样性
- 测评进行中再次说"开始英语测评" → 提示先退出当前测评
- 情景对话补全优先用选择题形式，减少长句输入
- 错题集每道题必须附带简短讲解（explanation 字段）
- 成绩归档只存得分和弱项，不存具体题目和错题