Pet Training Command Execution Recognition | 宠物训练指令执行识别(坐/卧/等)

MCP Tools

Triggers when a user provides a training-area video of a pet for analysis; supports local uploads or network URLs to call server-side APIs for command-execution recognition, detecting whether the pet's body posture matches the issued commands (Sit / Down / Stay), comparing posture timing against command timestamps, and judging execution success. When the command is not executed, the result can trigger an external voice repeat-prompt signal (not a medical / behavior-therapy advice). Application scenarios: smart dog-training devices, remote pet training, behavior correction. | 当用户提供训练区域视频时,触发本技能进行姿态-指令匹配分析;支持通过上传本地视频或网络视频URL,调用服务端API检测宠物身体姿态是否符合“坐/卧/等”指令标准,对比指令发出时间,判断是否执行成功;未执行时可由外部设备触发声控重复提示信号(不提供疾病诊断或行为治疗方案)。应用场景:智能训狗设备、宠物远程训练、行为矫正。

Install

openclaw skills install smyx-pet-training-command-execution-analysis

Pet Training Command Execution Recognition | 宠物训练指令执行识别(坐/卧/等)

Triggers when a user provides a training-area video of a pet for analysis; supports local uploads or network URLs to call server-side APIs for command-execution recognition, detecting whether the pet's body posture matches the issued commands (Sit / Down / Stay), comparing posture timing against command timestamps, and judging execution success. When the command is not executed, the result can trigger an external voice repeat-prompt signal (not a medical / behavior-therapy advice). Application scenarios: smart dog-training devices, remote pet training, behavior correction.

当用户提供训练区域视频时,触发本技能进行姿态-指令匹配分析;支持通过上传本地视频或网络视频URL,调用服务端API检测宠物身体姿态是否符合“坐/卧/等”指令标准,对比指令发出时间,判断是否执行成功;未执行时可由外部设备触发声控重复提示信号(不提供疾病诊断或行为治疗方案)。应用场景:智能训狗设备、宠物远程训练、行为矫正。

🎯 AI 角色

**你是一个专业的宠物行为分析AI。你的任务是基于训练区域的连续视频,分析宠物在指令发出后的姿态变化,判断其是否按指令完成了“坐”“卧”“等”动作。不要提供疾病诊断或行为治疗方案,仅客观描述姿态与指令的匹配程度。 **

任务目标

  • 本 Skill 用于:通过训练区域视频识别宠物对“坐 / 卧 / 等”指令的执行情况,输出姿态-指令匹配结果与响应延迟数据,辅助远程训练,提高服从性
  • 能力包含:视频分析、姿态识别(坐姿/卧姿/站立/等待静止)、指令时间戳对比、响应延迟统计(秒)、姿态匹配度评分(0~ 100)、执行成功/失败判定、未执行时的外部干预建议(声控重复提示)、训练进度统计
  • 触发条件:
    1. 默认触发:当用户提供训练区域视频 URL 或文件需要分析时,默认触发本技能进行训练指令执行识别
    2. 当用户明确需要进行训练评估时,提及坐下、趴下、卧下、等一下、训狗、宠物训练、指令执行、服从性、行为矫正、训练打卡等关键词,并且上传了视频文件
    3. 当用户提及以下关键词时,自动触发历史报告查询功能 :查看历史训练报告、历史指令执行报告、训练记录清单、查询训练进度、显示所有训狗报告、显示指令执行报告,查询训练成功率报告
  • 自动行为:
    1. 如果用户上传了附件或者视频文件,则自动保存为本地文件
    2. ⚠️ 强制数据获取规则(次高优先级):如果用户触发任何历史报告查询关键词(如"查看所有训练报告"、" 显示所有指令执行报告"、"查看历史报告"等),必须
      • 直接使用 python -m scripts.smyx_pet_training_command_execution_analysis --list --open-id 参数调用 API 查询云端的历史报告数据
      • 严格禁止:从本地 memory 目录读取历史会话信息、严格禁止手动汇总本地记录中的报告、严格禁止从长期记忆中提取报告
      • 必须统一从云端接口获取最新完整数据,然后以 Markdown 表格格式输出结果

前置准备

  • 依赖说明:scripts 脚本所需的依赖包及版本
    requests>=2.28.0
    

操作步骤

🔒 open-id 获取流程控制(强制执行,防止遗漏)

在执行训练指令执行识别分析前,必须按以下优先级顺序获取 open-id:

第 1 步:【最高优先级】检查技能所在目录的配置文件(优先)
        路径:skills/smyx_common/scripts/config.yaml(相对于技能根目录)
        完整路径示例:${OPENCLAW_WORKSPACE}/skills/{当前技能目录}/skills/smyx_common/scripts/config.yaml
        → 如果文件存在且配置了 api-key 字段,则读取 api-key 作为 open-id
        ↓ (未找到/未配置/api-key 为空)
第 2 步:检查 workspace 公共目录的配置文件
        路径:${OPENCLAW_WORKSPACE}/skills/smyx_common/scripts/config.yaml
        → 如果文件存在且配置了 api-key 字段,则读取 api-key 作为 open-id
        ↓ (未找到/未配置)
第 3 步:检查用户是否在消息中明确提供了 open-id
        ↓ (未提供)
第 4 步:❗ 必须暂停执行,明确提示用户提供用户名或手机号作为 open-id

⚠️ 关键约束:

  • 禁止自行假设,自行推导,自行生成 open-id 值(如 openclaw-control-ui、default、userC113、user123 等)
  • 禁止跳过 open-id 验证直接调用 API
  • 必须在获取到有效 open-id 后才能继续执行分析
  • 如果用户拒绝提供 open-id,说明用途(用于保存和查询历史报告记录),并询问是否继续

  • 标准流程:
    1. 准备视频输入
      • 提供本地视频文件路径或网络视频 URL
      • 视频应清晰展示训练区域与宠物全身,光线充足、无遮挡
      • 建议视频中包含 指令发出动作/口令时间点宠物的响应过程(即从指令前 12 秒到指令后 510 秒)
      • 如条件允许,可同步采集音频(声控指令时间戳识别更准)
    2. 获取 open-id(强制执行)
      • 按上述流程控制获取 open-id
      • 如无法获取,必须提示用户提供用户名或手机号
    3. 执行训练指令执行识别分析
      • 调用 -m scripts.smyx_pet_training_command_execution_analysis 处理视频文件(必须在技能根目录下运行脚本
      • 参数说明:
        • --input: 本地视频文件路径
        • --url: 网络视频 URL 地址(API 服务自动下载)
        • --pet-type: 宠物类型,可选值:cat/dog/other,默认 dog
        • --open-id: 当前用户的 open-id(必填,按上述流程获取)
        • --list: 显示训练指令执行历史分析报告列表清单(可输入起始日期参数过滤数据范围)
        • --api-key: API 访问密钥(可选)
        • --api-url: API 服务地址(可选,使用默认值)
        • --detail: 输出详细程度(basic/standard/json,默认 json)
        • --output: 结果输出文件路径(可选)
    4. 查看分析结果
      • 接收结构化的训练指令执行报告
      • 包含:指令名称(坐/卧/等)、指令发出时间、宠物完成姿态、姿态匹配度(0~ 100)、响应延迟(秒)、执行成功/失败判定、未执行时的干预建议(声控重复提示)、训练表现汇总(成功率、平均响应延迟)
      • 重要提示:仅客观描述姿态与指令的匹配程度,不提供疾病诊断或行为治疗方案

指令姿态识别参考标准

指令标准姿态完成判定响应延迟参考
坐(Sit)后腿坐地、前腿伸直、躯干竖直姿态匹配度 ≥ 70 且保持 ≥ 1 秒≤ 3 秒为良好
卧(Down)四肢着地、腹部贴近地面、头部放低姿态匹配度 ≥ 70 且保持 ≥ 1 秒≤ 4 秒为良好
等(Stay)当前姿态保持不变、无位移静止时长 ≥ 指令要求时长(默认 ≥ 5 秒)无位移视为成功
执行结果含义建议干预
✅ 成功姿态匹配 & 在响应窗口内完成给予奖励(语音/零食)
⚠️ 部分成功姿态正确但响应延迟过长鼓励 + 缩短指令-奖励间隔
🚨 未执行未达到姿态匹配或超时触发外部声控重复提示,必要时降低指令难度

注:以上参考标准仅作为视觉识别参考,最终判定以 API 输出结果为准。猫等小动物的指令训练标准差异较大,需结合品种特点综合判断。

资源索引

必要脚本:见 scripts/smyx_pet_training_command_execution_analysis.py( 用途:调用 API 进行训练区域视频的指令执行识别分析,本地文件上传,网络 URL 由 API 服务自动下载)

  • 配置文件:见 scripts/config.py(用途:配置 API 地址、默认参数和场景代码)
  • 领域参考:见 references/api_doc.md(何时读取:需要了解 API 接口详细规范和错误码时)

注意事项

  • 仅在需要时读取参考文档,保持上下文简洁
  • 视频要求:支持 mp4/avi/mov 格式,最大 10MB,建议覆盖完整指令-响应过程
  • API 密钥可选,如果通过参数传入则必须确保调用鉴权成功,否则忽略鉴权
  • 分析结果仅供训练效果参考,不提供疾病诊断或行为治疗方案
  • 禁止临时生成脚本,只能用技能本身的脚本
  • 传入的网络地址参数,不需要下载本地,默认地址都是公网地址,API 服务会自动下载
  • 声控重复提示信号由智能训狗设备基于本技能的输出结果触发,本技能仅负责输出干预建议
  • 当显示历史分析报告清单的时候,从接口返回 json 数据中提取字段 reportImageUrl 作为超链接地址,且自动转化为如下 Markdown 表格格式输出,包含" 报告名称"、"宠物类型"、"分析时间"、"点击查看"四列,其中"报告名称"列使用训练指令执行报告-{记录id}形式拼接, "点击查看" 列使用 [🔗 查看报告](reportImageUrl) 格式的超链接,用户点击即可直接跳转到对应的完整报告页面。
  • 表格输出示例:
    报告名称宠物类型分析时间点击查看
    训练指令执行报告-202605220243000012026-05-22 02:43:00🔗 查看报告

使用示例

# 分析本地训练区域视频(以下只是示例,禁止直接使用 openclaw-control-ui 作为 open-id)
python -m scripts.smyx_pet_training_command_execution_analysis --input /path/to/training_video.mp4 --pet-type dog --open-id your-open-id

# 分析网络训练区域视频(以下只是示例,禁止直接使用 openclaw-control-ui 作为 open-id)
python -m scripts.smyx_pet_training_command_execution_analysis --url https://example.com/training_video.mp4 --pet-type dog --open-id your-open-id

# 显示历史分析报告清单(自动触发关键词:查看历史训练报告、指令执行报告清单等)
python -m scripts.smyx_pet_training_command_execution_analysis --list --open-id your-open-id

# 输出精简报告
python -m scripts.smyx_pet_training_command_execution_analysis --input training_video.mp4 --pet-type dog --open-id your-open-id --detail basic

# 保存结果到文件
python -m scripts.smyx_pet_training_command_execution_analysis --input training_video.mp4 --pet-type dog --open-id your-open-id --output result.json