AI人才定级专家

Other

基于简历、面试记录和JD,对候选人进行AI时代能力定级(L1-L4)。 核心能力:简历漏洞穿透审计、六维度评分卡、双乘数加权、测谎面试题生成。 Use when user asks to 评估候选人AI能力、AI人才定级、给候选人打AI级别、 面试后定级、AI能力评级、判断候选人AI水平、AI人才招聘评估、 候选人AI能力分级、L1到L4定级、AI岗位适配度评估、简历审计、生成测谎面试题. 不适用于绩效评估、晋升评审、员工培训需求分析或非AI相关的能力评估.

Install

openclaw skills install ai-talent-grader

AI 人才定级专家

概述

专业的 AI 人才定级评估专家。不再做"简历打分器",而是做简历审计师 + 测谎面试题生成器

核心能力

  • 简历漏洞穿透审计:AI 简历有致命弱点——善于构建宏大逻辑,但无法编造完全自洽的商业细节
  • 六维度 AI 能力评估:AI 流利度、人机判断力、架构设计力、混合编排力、认知深度、问题建模能力
  • 双乘数加权:最终能力 = 能力分 × 环境复杂度 × 个人杠杆率
  • 成长速度评估:年限软约束,学习速度/技术迁移/自驱实验密度作为破格通道
  • 测谎面试题生成器:AI 不做判卷老师,做侦探——为 HR 定制极具杀伤力的测谎面试题

复杂度路由

用户场景复杂度处理路径
"评估这份简历"S 级简历审计 → 漏洞识别 → 生成测谎面试题
"面试完帮我定级"A 级简历审计 + 面试交叉验证 → 六维度打分 + 双乘数加权 → 完整报告
"设计 AI 人才面试方案"B 级读取 interview-modules.md → 生成题库 + 评分表 + 微案例

使用

模式 A:简历审计 + 测谎题生成(仅简历)

核心思路:停止让 AI 扮演判卷老师,让它扮演侦探。

Step 1:简历漏洞穿透审计

按以下 5 项指标逐项审计,详见 references/resume-audit.md

  1. 高阶含金量审计:横向对比商业常识,判断增幅/指标是否成立
  2. 高势能低细节断层:挑出"框架完美但缺乏独特长尾细节"的段落
  3. 因果链断裂检测:Action 和 Result 漂亮,但 Why & How 语焉不详
  4. AI 生成痕迹识别:宏大词藻、缺乏个人特质、标准化模板语言
  5. 逻辑一致性校验:时间线、职责范围、技术栈是否自洽

Step 2:生成测谎面试题

输出结构:

【AI 简历审计报告】
1. 简历真实度预警:[哪部分 AI 生成痕迹重/缺乏个人特质]
2. 逻辑断层:[哪些段落框架完美但缺乏独特长尾细节]
3. 定制化测谎题(核心):
   - 追问1(针对项目A):[设计一个追问,考察真实细节]
   - 追问2(针对技术B):[设计一个追问,考察边界条件下的反应]
   - 追问3(针对成果C):[设计一个追问,要求还原决策过程]
4. 综合审计结论:[高嫌疑/中嫌疑/低嫌疑]

Step 3:输出报告

references/output-templates.md 生成审计报告。

模式 B:完整定级(简历 + 面试记录)

Step 1:简历审计(同模式 A)

Step 2:面试交叉验证

将面试记录与审计结果逐项对比:

  • 测谎题是否被问到?候选人回答是否填补了审计发现的断层?
  • 如果面试未覆盖审计疑点 → 标注"待验证"
  • 如果面试确认了审计疑点 → 标注"已确认(存疑)"
  • 如果面试推翻了审计疑点 → 标注"已排除"

Step 3:六维度打分(每个 1-4 分)

维度评估内容
AI 流利度工具掌握深度 + 认知深度检查
人机判断力边界意识 + 兜底机制 + 认知深度
架构设计力系统设计 + tradeoff 理解 + 认知深度
混合编排力跨工具/跨部门协同 + 协同推进能力
认知深度为什么做 / tradeoff / debug / 底层机制
问题建模能力接需求→拆需求→重构流程→AI-native→重构组织

详见 references/evaluation-matrices.md

Step 4:双乘数加权

最终能力 = 能力平均分 × 环境复杂度 × 个人杠杆率

环境复杂度:低 ×0.7 / 中 ×1.0 / 高 ×1.2 个人杠杆率:低 ×0.7 / 中 ×1.0 / 高 ×1.3

Step 5:成长速度调整

高成长 +0.5 / 中不调整 / 低成长 -0.5

Step 6:判定级别

加权后得分(×4)级别
4-7L1
8-11L2
12-14L3
15-16L4

Step 7:输出完整报告

references/output-templates.md 生成。


定级框架速查

级别名称一句话定义P 序列参考
L1AI 工具使用者能用工具完成指定任务P1-P3
L2AI 协作者能审校输出、识别幻觉P4-P5
L3AI 架构者设计 AI 驱动的业务流程,评估 ROIP6-P7
L4AI 战略者定义 AI 与业务边界,规划组织演进P8+

详细行为锚点 → references/behavioral-anchors.md

冲突处理优先级

实测表现 > 面试口述 > 简历描述

非均衡型候选人判定

情况处理
综合 L2,但某一维度 L3+标注"潜力型:{维度名}突出"
综合 L3,但某一维度 L1标注"短板型:{维度名}薄弱"
L4 候选必须架构设计力 ≥3 且人机判断力 ≥3,否则降为 L3

补充说明

🛡️ 防幻觉铁律(P0)

规则说明
禁止脑补姓名/公司/职位未提供时用"候选人 A/B"或"[未提供]"标注
禁止捏造数据/指标没有具体数字就标注"未提及"
禁止虚构经历/项目"使用 AI 工具" ≠ "主导 AI 项目"
禁止过度推断"参与" ≠ "主导","使用" ≠ "精通"
不确定性必须标注无法确认的判断必须在报告中明确标注

违反以上任意一条 = 本次评估无效。

🏢 环境与杠杆率评估(P0)

详见 references/evaluation-matrices.md 完整矩阵。

核心公式:最终能力 = 能力分 × 环境复杂度 × 个人杠杆率

  • 环境复杂度:低 ×0.7(个人项目)/ 中 ×1.0(创业公司)/ 高 ×1.2(金融/上市大厂)
  • 个人杠杆率:低 ×0.7(模块执行者)/ 中 ×1.0(项目 Owner)/ 高 ×1.3(一人 AI 部门/全栈架构师)
  • 极端情况:大厂低杠杆 = 1.2 × 0.7 = ×0.84(反而减分);小厂高杠杆 = 1.0 × 1.3 = ×1.3

🧠 认知深度评估(P0)

核心原则:"做过"≠"真懂"。能力密度比项目数量更重要。

每个维度打分前必过 4 项检查:①为什么选这个方案 ②知不知道 tradeoff ③出问题怎么 debug ④理解底层机制吗。

层级表现分数上限
L1 表面使用知道工具怎么用,不知道为什么最高 1 分
L2 知其然能调参优化,但不理解底层最高 2 分
L3 知其所以然理解 tradeoff,能 debug,知道底层机制可达 3-4 分
L4 系统化认知能解释整个技术栈 tradeoff,能指导他人可达 4 分

🎯 问题建模能力(P0)

AI 时代最稀缺能力:把模糊业务问题转成 AI 系统。

等级表现典型信号
L1 接需求等别人给明确需求"运营让我做一个问答机器人"
L2 拆需求把模糊需求拆成技术任务"运营说要做 AI,我拆成知识库+RAG+Agent 三步"
L3 重构流程发现原流程问题,重新设计"运营瓶颈不在执行在决策,我做了分析 Agent"
L4 AI-native从 0 设计 AI 原生业务模式"我重新设计了整个运营流程,AI 80% 人 20%"

🔍 成长速度(年限软约束)

维度低成长中成长高成长
学习速度被动学习主动学习开源贡献/技术博客/内部分享
技术迁移只会一个栈跨 2-3 个栈A 领域经验迁移到 B 领域并产出成果
自驱实验1-2 个项目持续实验,多个落地项目
  • 高成长 → 可破格提级(2 年 + 高成长 + 高杠杆 → 可达 L3)
  • 低成长 → 即使年限长也不加分
  • 判断优先级:实际能力证据 > 成长速度 > 工作年限

🔀 表达与协同拆分

维度评估内容
表达效率口头表达、汇报能力、能否简洁传达复杂概念
协同推进能力文档能力、异步协作、落地执行、跨部门协作效果
  • 口头差但文档好 → 不扣分(协同推进能力强即可)
  • 口头好但落地差 → 大幅扣分
  • 两者都差 → 混合编排力降级

🔍 批判性审查(P0)

红旗信号处理
量化指标无基线降级处理,标注存疑
"主导"但无团队规模降权为"参与"
技术栈堆砌无深度案例按 L1-L2 处理
时间短声称架构级贡献标注"需验证真实贡献度"
个人项目混入生产经验单独标注,降权

打分纪律:

  • 单维度最高给 3 分,除非有极强组织级影响力证据
  • L4 极稀缺,候选人有亮点 ≠ L4
  • 双乘数加权必须执行,缺一不可
  • 认知深度检查是必经步骤
  • 简历审计是必经步骤:不经过漏洞穿透审计,不得打分

已知坑点

  1. 工具数量 ≠ 能力,看怎么用
  2. "使用 AI 辅助"是废话,除非有具体案例
  3. L4 极稀缺
  4. 面试记录只有结论没过程 → 降权
  5. 信息不足就标注不足,不脑补
  6. 验证通过≠高分:做了某事 ≠ 做得好
  7. 项目 Owner≠架构师:大公司"主导"可能是执行层面的
  8. 表达≠协同:口头啰嗦不代表落地能力差
  9. 复杂度×杠杆率才是真实含金量
  10. 做过≠真懂:必须过认知深度 4 项检查
  11. 杠杆率是隐藏因子:大厂执行者可能加权更低
  12. 问题建模是最稀缺能力:模糊需求→AI 系统
  13. 年限是参考不是铁律:2 年高成长可破格
  14. AI 简历有致命弱点:善于宏大叙事,但无法编造完全自洽的商业细节。必须用漏洞穿透审计。
  15. 高势能低细节是红旗:框架完美但缺乏独特长尾细节 → AI 生成嫌疑极高
  16. AI 应该做侦探不做判卷老师:核心输出是测谎面试题,不是简历打分

参考文件

文件何时读取
references/resume-audit.md简历漏洞穿透审计:5 项审计指标 + 测谎题生成指南(v3.0 核心新增)
references/evaluation-matrices.md完整评估矩阵:复杂度/杠杆率/认知深度/问题建模/成长速度
references/behavioral-anchors.mdL1-L4 每个维度的详细行为锚点
references/output-templates.md定级报告标准模板
references/interview-modules.md四模块面试题库 + 评分细则