Install
openclaw skills install xiaozhi-teach-student-analyzer帮助老师从"凭经验判断学情"升级为"数据驱动的教学决策"。 当老师说"帮我分析班级成绩"、"看看学生哪里薄弱"、 "生成学情报告"、"上次考试 X 知识点全军覆没怎么办"、 "这个学生最近怎么了"时,必须激活此SKILL。 核心工作流:成绩数据输入 → 班级整体画像 → 共性弱项识别 → 个体诊断 → 差异化教学建议 → 与 xiaozhi-teach-exam-designer /lesson-planner/classroom-coach 建立数据接口。 强基于学情数据,不编造学生表现。
openclaw skills install xiaozhi-teach-student-analyzer一句话定位: 分数只是表面,学情分析帮你看见每个学生思维的真实位置。
关于"班级学情数据来源"机制: 本 SKILL 的数据输入不依赖于大语言模型自身对班级数据的访问,而是强依赖于以下三类外部输入: ① 老师主动输入的成绩表(Excel 复制粘贴 / 文本表格) ②
xiaozhi-teach-exam-designer提供的双向细目表与得分率 ③xiaozhi-teach-lesson-log累计的课堂观察记录关于"个体诊断"机制: 单个学生的诊断需要连续 ≥ 3 次同知识点失分才能标记为"顽固弱项";样本不足时输出"证据不足,需补测"。
关于"预测"边界: 本 SKILL 不预测学生未来分数,不做"提分 X 分"承诺;只基于现有数据做趋势判断和分层建议。
老师看成绩时常见的三个误区:
误区① 看平均分:班级平均 75 分,结论是"还行"。
实际:可能 30% 学生不及格 + 30% 学生 90+,平均掩盖了两极。
误区② 看排名:每个学生看排名,结论是"XX 进步了"。
实际:班级整体题目偏难,所有人排名都下降,但绝对分都提高了。
误区③ 单次判断:考一次不好就下结论"这个学生学不会"。
实际:可能是试卷难度波动、临场状态、或某章节集中性失分。
本 SKILL 要解决的是:
| 触发场景 | 示例语句 |
|---|---|
| 班级整体分析 | "帮我分析这次月考成绩" / "班级整体什么水平" |
| 知识点弱项 | "这道题全班错了 60%,怎么回事" |
| 个体诊断 | "这个学生最近怎么回事" / "小明这学期下滑严重" |
| 趋势追踪 | "对比上学期和这学期的数据" |
| 教学调整 | "接下来一个月我应该重点讲什么" |
| 分层建议 | "哪些学生该进提升班,哪些留在基础班" |
| 试卷分析 | "这套卷子难度如何,得分率哪里偏低" |
| 家长沟通素材 | "我需要客观数据跟家长聊" |
┌──────────────────────────┐
│ ① 收集数据 │
│ 成绩表 / 试卷 / 课堂记录 │
└────────────┬─────────────┘
↓
┌──────────────────────────┐
│ ② 班级整体画像 │
│ 分布/分层/得分率/难度 │
└────────────┬─────────────┘
↓
┌──────────────────────────┐
│ ③ 共性弱项识别 │
│ 错误率 ≥ 40% 知识点 │
└────────────┬─────────────┘
↓
┌──────────────────────────┐
│ ④ 个体诊断 │
│ 顽固弱项/进步/退步 │
└────────────┬─────────────┘
↓
┌──────────────────────────┐
│ ⑤ 教学调整建议 │
│ 讲/练/测 比例+分层任务 │
└────────────┬─────────────┘
↓
┌──────────────────────────┐
│ ⑥ 写回数据 │
│ → lesson-planner │
│ → classroom-coach │
│ → exam-designer │
└──────────────────────────┘
| 指标 | 含义 | 警戒值 |
|---|---|---|
| 平均分 | 班级整体水平 | < 60 偏低 / > 85 偏高 |
| 中位数 | 抗极值,代表"中间学生" | 低于平均分 5 分说明两极分化 |
| 标准差 | 班级内差距 | > 15 说明分化严重 |
| 最高分 / 最低分 | 极差 | 极差 > 40 说明两极分化 |
| 优秀率 (≥ 85%) | 拔尖学生占比 | < 10% 偏低 / > 30% 良好 |
| 及格率 (≥ 60%) | 基础达标率 | < 60% 说明大面积未达标 |
| 低分率 (< 40%) | 严重落后学生占比 | > 15% 需重点关注 |
正态分布 :多数学生集中在平均分附近,两端人数少
→ 班级整体教学节奏稳定,按既定计划推进
右偏分布 :多数学生得分高,少数学分低
→ 关注尾部学生,避免被平均分掩盖
左偏分布 :多数学生得分低,少数高分
→ 全班基础不牢,需放慢节奏补基础
双峰分布 :两端各有一群学生,中间少
→ 分层教学必要性最强,建议拆班
难度系数 P = 班级平均分 / 满分
P > 0.85 偏易 → 学生容易高分,但区分度低
P 0.65-0.85 适中 → 理想的诊断性测评
P 0.45-0.65 偏难 → 适合能力提升阶段
P < 0.45 偏难 → 大面积不及格,需补基础
区分度 D = 高分组得分率 - 低分组得分率
D > 0.40 区分度优秀
D 0.20-0.40 区分度良好
D < 0.20 区分度不足(所有学生错同一些题)
🔴 红色区域:得分率 < 40%(共性弱项,必须全班重讲)
🟡 黄色区域:得分率 40%-70%(需要强化训练)
🟢 绿色区域:得分率 > 70%(掌握良好,可作为复习起点)
⚪ 灰色区域:得分率 < 5%(题目可能过难或超纲,不强求)
知识点热力图(章节 → 知识点 → 得分率)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
[第 X 章] 函数
一次函数概念 🟢 82% [ 名错/ 名对]
一次函数图象 🟡 56% [ 名错/ 名对]
一次函数性质 🔴 32% [ 名错/ 名对] ← 共性弱项
用待定系数法求解析式 🟡 65% [ 名错/ 名对]
一次函数应用 🔴 38% [ 名错/ 名对] ← 共性弱项
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
红色共性弱项判定:得分率 < 40% 且错误人数 ≥ 班级人数的 30%
→ 触发"全班重讲"建议
→ 同时触发 lesson-planner 的"侧重点排序"
→ 触发 classroom-coach 的"分层提问策略"
黄色强化项判定:得分率 40%-70%
→ 不必重讲,但需在作业中强化
→ 触发 assignment-designer 的"分层作业"
绿色起点项判定:得分率 > 70%
→ 可作为复习课的"基础起点"
→ 触发 review-planner 的"复习地图"
每个学生输出一张诊断卡,至少需要 3 次历史数据才能给出稳定结论。
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
📋 学生诊断卡
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
学号 / 化名:[ ]
班级:[ ]
近 4 次成绩:[ / / / ]
趋势判定:[稳步上升 / 稳定 / 波动 / 稳步下降 / 证据不足]
当前分层:[A 基础 / B 中等 / C 拔尖]
■ 强项(得分率 ≥ 80% 的知识点)
· [知识点 1]
· [知识点 2]
■ 弱项(得分率 < 60% 的知识点)
· [知识点 1]:[近 4 次失分情况] → 顽固弱项
· [知识点 2]:[近 4 次失分情况] → 观察中
■ 学习行为信号(来自课堂记录)
· 缺课次数:近 4 周 [ ] 次
· 作业完成率:近 4 周 [ ]%
· 主动提问次数:近 4 周 [ ] 次
· 课堂专注度:近 4 周 [ ](5 分制)
■ 教师建议(基于证据)
· 短期(2 周内):[具体动作]
· 中期(1 个月内):[具体动作]
· 长期(一学期):[具体动作]
■ 给家长的话术方向(不含真实姓名)
· 客观事实:[聚合数据]
· 关注建议:[1-2 句]
· 不建议表达:[焦虑式话术]
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
数据要求:近 4 次测评(同卷同范围优先,或类似难度)
稳步上升:4 次成绩中至少 3 次呈上升趋势,且最近 1 次高于平均
稳定:4 次成绩波动 < 5 分
波动:4 次成绩波动 5-15 分,无明显趋势
稳步下降:4 次成绩中至少 3 次呈下降趋势
证据不足:测评次数 < 3 次,或试卷难度差异过大
条件①:同一知识点在最近 3 次测评中均失分
条件②:该知识点得分率均 < 60%
条件③:非试卷难度异常(班级整体该题得分率正常)
满足全部 3 条 → 标记"顽固弱项",触发专项补救流程
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
📊 班级学情报告
科目:[ ]
考试:[ ](日期 / 卷面满分)
参考人数:[ ] 人
生成日期:[ ]
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
■ 第 1 段 · 整体表现
平均分:[ ] / 满分 [ ]
中位数:[ ],标准差:[ ]
优秀率:[ ]%,及格率:[ ]%,低分率:[ ]%
分布形态:[正态 / 右偏 / 左偏 / 双峰]
难度系数 P:[ ]([易/适中/偏难])
区分度 D:[ ]([优秀/良好/不足])
■ 第 2 段 · 三层学生分布
A 层(基础,[ ]% 达成 < 60%):[ ] 人
B 层(中等,[ ]% 达成 60-85%):[ ] 人
C 层(拔尖,[ ]% 达成 ≥ 85%):[ ] 人
■ 第 3 段 · 共性弱项(按严重度排序)
弱项 ① [知识点]:得分率 [ ]%,错误 [ ] 人 → 全班重讲
弱项 ② [知识点]:得分率 [ ]%,错误 [ ] 人 → 强化训练
弱项 ③ [知识点]:得分率 [ ]%,错误 [ ] 人 → 强化训练
■ 第 4 段 · 区分度异常的题
第 [ ] 题:D = [ ](区分度不足)
建议处理:[改题 / 删题 / 升级为讲解素材]
■ 第 5 段 · 个体警示名单
退步明显(近 4 次下降 ≥ 10 分):[ ] 人(不点名)
严重落后(得分 < 40 分):[ ] 人
进步显著(近 4 次上升 ≥ 10 分):[ ] 人
■ 第 6 段 · 与上一次对比
平均分变化:[+/-] [ ] 分
优秀率变化:[+/-] [ ]%
共性弱项变化:[新增/消失/恶化/缓解]
■ 第 7 段 · 教学调整建议
短期(1 周内):
· 讲:[哪 1-2 个弱项,如何讲]
· 练:[哪几道变式题,布置给谁]
· 测:[是否需要补测]
中期(1 个月内):
· 教案侧重点排序(→ 写回 lesson-planner)
· 分层任务清单(→ 写回 classroom-coach)
长期(一学期):
· 章节复习计划调整(→ 写回 review-planner)
· 测评设计调整(→ 写回 exam-designer)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
基于班级画像,自动生成"讲/练/测 比例调整"。
讲 练 测
默认比例 40% 40% 20%
共性弱项多 → 50% 35% 15% (多讲)
两极分化 → 30% 45% 25% (多练多测)
整体偏弱 → 45% 40% 15% (重基础)
整体偏强 → 30% 40% 30% (多测拔高)
考前冲刺 → 20% 30% 50% (重测评)
A 层任务(基础学生):
· 弱项知识点的"再讲一遍"小课
· 课本例题 + 1 道变式
· 教师频繁巡视
B 层任务(中等学生):
· 弱项的变式训练 2-3 道
· 综合应用题 1 道
· 同伴互评
C 层任务(拔尖学生):
· 完成 B 层任务
· 弱项的跨章/跨学科迁移 1 道
· 1v1 拔高或独立研究
┌────────────────────────┐
│ xiaozhi-teach- │
│ exam-designer │
│ (双向细目表+得分率) │
└───────────┬────────────┘
│
↓
┌────────────────────────┐
│ xiaozhi-teach- │
│ student-analyzer │←── xiaozhi-teach-lesson-log
│ (本 SKILL) │ (课堂观察+作业数据)
└───────────┬────────────┘
│
┌─────────────────┼─────────────────┐
↓ ↓ ↓
lesson-planner classroom-coach review-planner
(教案调整) (分层互动) (复习计划)
读:
examBlueprint[].topic → 知识点维度
examBlueprint[].difficulty → 难度预期
scoreDistribution.itemScoreRate → 实际得分率
scoreDistribution.hardItems → 难题名单
写:
feedback.toBlueprint[].actualDifficulty → 实际难度回写
feedback.toBlueprint[].discrimination → 区分度回写
feedback.toBlueprint[].itemQuality → 题目质量评估
读:
lessonPlan.emphasis → 当前教案的弱项侧重点
lessonPlan.layeredTasks → 当前 A/B/C 分层任务
写:
analysisOutput.emphasisForNextLesson → 下节课聚焦的弱项
analysisOutput.classDistribution → A/B/C 三层划分
analysisOutput.individualRemediation → 个体补救任务清单
- 不默认调用学生端 DNA:教师自有数据优先
- 不预测分数:不做"提分 X 分"承诺
- 不写焦虑话术:所有面向家长的素材用客观事实表达
- 不在样本不足时下结论:< 3 次数据明确写"证据不足"
- 不替老师判断学生品行:成绩差≠态度差
✅ 使用:学号、化名、座位号
❌ 禁止:真实姓名(除非老师已确认班级内部使用)
✅ 班级报告:可写"近 4 次下降 ≥ 10 分的 3 人"
❌ 禁止:在公开报告中点名
✅ 使用:聚合数据("近期作业完成率约 75%")
❌ 禁止:单独分数 + 排名
✅ 使用:客观证据 + 1-2 句建议
❌ 禁止:人格判断、焦虑话术
写回 lesson-planner:只写"哪些知识点需要重点",不写"哪个学生差"
写回 classroom-coach:只写"分层策略",不写"学生名单"
写回 exam-designer:只写"题目质量评估",不写"学生答题人信息"
| ✅ 应该做 | ❌ 不能做 |
|---|---|
| 至少要 3 次数据才下趋势结论 | 1 次成绩就给学生贴标签 |
| 报告必须分层呈现 | 只看平均分 |
| 弱项定位到具体知识点 | 只说"数学差" |
| 输出教学调整建议 | 只分析不给方案 |
| 不确定就标"证据不足" | 编造稳定趋势 |
| 报告用聚合数据呈现 | 在班级群发"小名" |
| 区分题目质量与学生能力 | 把难题都怪学生不会 |
学情分析师
<── xiaozhi-teach-exam-designer(测评数据)
<── xiaozhi-teach-lesson-log(课堂+作业观察)
──→ xiaozhi-teach-lesson-planner(教案调整)
──→ xiaozhi-teach-classroom-coach(分层互动)
──→ xiaozhi-teach-review-planner(复习计划)
──→ xiaozhi-teach-exam-designer(题目质量回写)
──→ 学科专项 SKILL(数学/物理 错因分析)
禁止行为:
references/analysis-framework.md — 学情分析框架与模板references/score-input-template.md — 成绩输入模板(待补)references/knowledge-point-taxonomy.md — 各学科知识点分类标准(待补)🦞 小龙虾说: "分数告诉你'发生了什么', 学情分析告诉你'为什么发生'和'接下来该怎么办'。 真正有效的教学调整, 不是哪个学生'不行',而是 哪一步设计没让他能行。"