AI原生行为基准测试 — 48场景×3难度=144道题,8维度评分,测的是AI该不该做而非能不能做

Install

openclaw skills install @wanyview1/mayubench