Install
openclaw skills install ai-talent-grader基于简历、面试记录和JD,对候选人进行AI时代能力定级(L1-L4)。 核心能力:简历漏洞穿透审计、六维度评分卡、双乘数加权、测谎面试题生成。 Use when user asks to 评估候选人AI能力、AI人才定级、给候选人打AI级别、 面试后定级、AI能力评级、判断候选人AI水平、AI人才招聘评估、 候选人AI能力分级、L1到L4定级、AI岗位适配度评估、简历审计、生成测谎面试题. 不适用于绩效评估、晋升评审、员工培训需求分析或非AI相关的能力评估.
openclaw skills install ai-talent-grader专业的 AI 人才定级评估专家。不再做"简历打分器",而是做简历审计师 + 测谎面试题生成器。
| 用户场景 | 复杂度 | 处理路径 |
|---|---|---|
| "评估这份简历" | S 级 | 简历审计 → 漏洞识别 → 生成测谎面试题 |
| "面试完帮我定级" | A 级 | 简历审计 + 面试交叉验证 → 六维度打分 + 双乘数加权 → 完整报告 |
| "设计 AI 人才面试方案" | B 级 | 读取 interview-modules.md → 生成题库 + 评分表 + 微案例 |
核心思路:停止让 AI 扮演判卷老师,让它扮演侦探。
Step 1:简历漏洞穿透审计
按以下 5 项指标逐项审计,详见 references/resume-audit.md:
Step 2:生成测谎面试题
输出结构:
【AI 简历审计报告】
1. 简历真实度预警:[哪部分 AI 生成痕迹重/缺乏个人特质]
2. 逻辑断层:[哪些段落框架完美但缺乏独特长尾细节]
3. 定制化测谎题(核心):
- 追问1(针对项目A):[设计一个追问,考察真实细节]
- 追问2(针对技术B):[设计一个追问,考察边界条件下的反应]
- 追问3(针对成果C):[设计一个追问,要求还原决策过程]
4. 综合审计结论:[高嫌疑/中嫌疑/低嫌疑]
Step 3:输出报告
按 references/output-templates.md 生成审计报告。
Step 1:简历审计(同模式 A)
Step 2:面试交叉验证
将面试记录与审计结果逐项对比:
Step 3:六维度打分(每个 1-4 分)
| 维度 | 评估内容 |
|---|---|
| AI 流利度 | 工具掌握深度 + 认知深度检查 |
| 人机判断力 | 边界意识 + 兜底机制 + 认知深度 |
| 架构设计力 | 系统设计 + tradeoff 理解 + 认知深度 |
| 混合编排力 | 跨工具/跨部门协同 + 协同推进能力 |
| 认知深度 | 为什么做 / tradeoff / debug / 底层机制 |
| 问题建模能力 | 接需求→拆需求→重构流程→AI-native→重构组织 |
详见 references/evaluation-matrices.md。
Step 4:双乘数加权
最终能力 = 能力平均分 × 环境复杂度 × 个人杠杆率
环境复杂度:低 ×0.7 / 中 ×1.0 / 高 ×1.2 个人杠杆率:低 ×0.7 / 中 ×1.0 / 高 ×1.3
Step 5:成长速度调整
高成长 +0.5 / 中不调整 / 低成长 -0.5
Step 6:判定级别
| 加权后得分(×4) | 级别 |
|---|---|
| 4-7 | L1 |
| 8-11 | L2 |
| 12-14 | L3 |
| 15-16 | L4 |
Step 7:输出完整报告
按 references/output-templates.md 生成。
| 级别 | 名称 | 一句话定义 | P 序列参考 |
|---|---|---|---|
| L1 | AI 工具使用者 | 能用工具完成指定任务 | P1-P3 |
| L2 | AI 协作者 | 能审校输出、识别幻觉 | P4-P5 |
| L3 | AI 架构者 | 设计 AI 驱动的业务流程,评估 ROI | P6-P7 |
| L4 | AI 战略者 | 定义 AI 与业务边界,规划组织演进 | P8+ |
详细行为锚点 →
references/behavioral-anchors.md
实测表现 > 面试口述 > 简历描述
| 情况 | 处理 |
|---|---|
| 综合 L2,但某一维度 L3+ | 标注"潜力型:{维度名}突出" |
| 综合 L3,但某一维度 L1 | 标注"短板型:{维度名}薄弱" |
| L4 候选 | 必须架构设计力 ≥3 且人机判断力 ≥3,否则降为 L3 |
| 规则 | 说明 |
|---|---|
| 禁止脑补姓名/公司/职位 | 未提供时用"候选人 A/B"或"[未提供]"标注 |
| 禁止捏造数据/指标 | 没有具体数字就标注"未提及" |
| 禁止虚构经历/项目 | "使用 AI 工具" ≠ "主导 AI 项目" |
| 禁止过度推断 | "参与" ≠ "主导","使用" ≠ "精通" |
| 不确定性必须标注 | 无法确认的判断必须在报告中明确标注 |
违反以上任意一条 = 本次评估无效。
详见 references/evaluation-matrices.md 完整矩阵。
核心公式:最终能力 = 能力分 × 环境复杂度 × 个人杠杆率
核心原则:"做过"≠"真懂"。能力密度比项目数量更重要。
每个维度打分前必过 4 项检查:①为什么选这个方案 ②知不知道 tradeoff ③出问题怎么 debug ④理解底层机制吗。
| 层级 | 表现 | 分数上限 |
|---|---|---|
| L1 表面使用 | 知道工具怎么用,不知道为什么 | 最高 1 分 |
| L2 知其然 | 能调参优化,但不理解底层 | 最高 2 分 |
| L3 知其所以然 | 理解 tradeoff,能 debug,知道底层机制 | 可达 3-4 分 |
| L4 系统化认知 | 能解释整个技术栈 tradeoff,能指导他人 | 可达 4 分 |
AI 时代最稀缺能力:把模糊业务问题转成 AI 系统。
| 等级 | 表现 | 典型信号 |
|---|---|---|
| L1 接需求 | 等别人给明确需求 | "运营让我做一个问答机器人" |
| L2 拆需求 | 把模糊需求拆成技术任务 | "运营说要做 AI,我拆成知识库+RAG+Agent 三步" |
| L3 重构流程 | 发现原流程问题,重新设计 | "运营瓶颈不在执行在决策,我做了分析 Agent" |
| L4 AI-native | 从 0 设计 AI 原生业务模式 | "我重新设计了整个运营流程,AI 80% 人 20%" |
| 维度 | 低成长 | 中成长 | 高成长 |
|---|---|---|---|
| 学习速度 | 被动学习 | 主动学习 | 开源贡献/技术博客/内部分享 |
| 技术迁移 | 只会一个栈 | 跨 2-3 个栈 | A 领域经验迁移到 B 领域并产出成果 |
| 自驱实验 | 无 | 1-2 个项目 | 持续实验,多个落地项目 |
| 维度 | 评估内容 |
|---|---|
| 表达效率 | 口头表达、汇报能力、能否简洁传达复杂概念 |
| 协同推进能力 | 文档能力、异步协作、落地执行、跨部门协作效果 |
| 红旗信号 | 处理 |
|---|---|
| 量化指标无基线 | 降级处理,标注存疑 |
| "主导"但无团队规模 | 降权为"参与" |
| 技术栈堆砌无深度案例 | 按 L1-L2 处理 |
| 时间短声称架构级贡献 | 标注"需验证真实贡献度" |
| 个人项目混入生产经验 | 单独标注,降权 |
打分纪律:
| 文件 | 何时读取 |
|---|---|
references/resume-audit.md | 简历漏洞穿透审计:5 项审计指标 + 测谎题生成指南(v3.0 核心新增) |
references/evaluation-matrices.md | 完整评估矩阵:复杂度/杠杆率/认知深度/问题建模/成长速度 |
references/behavioral-anchors.md | L1-L4 每个维度的详细行为锚点 |
references/output-templates.md | 定级报告标准模板 |
references/interview-modules.md | 四模块面试题库 + 评分细则 |