Pet Vocal Emotion Deep Classification | 宠物叫声情绪深度分类

Triggers when a user provides a pet vocalization audio/video URL or file for analysis; extracts acoustic features such as frequency, duration, interval, and harmonic structure via AI audio analysis, and classifies the vocalization into 6+ emotion categories (howling, growling, excitement, loneliness, fear, whining/coaxing) with confidence scores. Helps owners understand pet emotional states, improve human-pet interaction, and detect potential stress or health issues early. Application: daily companionship (smart camera / collar), boarding center mood monitoring, vet clinic calming assessment, behavior training assistance. Does NOT provide medical or behavior-modification advice — only outputs audio-based emotion classification results with confidence. | 当用户提供宠物（犬/猫）叫声音频或视频URL/文件时，触发本技能进行叫声情绪深度分类分析；利用AI音频分析技术提取频率、时长、间隔、谐波结构等声学特征，将叫声分类为哀嚎、低吼、兴奋、孤独、恐惧、撒娇等6种以上情绪类别，并输出置信度；帮助宠物主人理解宠物情绪状态，改善人宠互动，及时发现潜在压力或健康问题。应用场景：宠物家庭日常陪伴（智能摄像头/项圈）、寄养中心情绪监测、宠物医院安抚评估、行为训练辅助。仅输出基于音频的情绪分类结果及置信度，不提供医疗或行为矫正建议。

smyx-sunjinhui@smyx-sunjinhui

Install

openclaw skills install @smyx-sunjinhui/smyx-vocal-emotion-classification-analysis

🔊 Pet Vocal Emotion Deep Classification | 宠物叫声情绪深度分类

智能分析中枢 · 图片/视频智能分析 · 结构化报告 · 历史报告云端查询

🧭 技能概览 | Overview

模块	内容
🏷️ 技能名称	宠物叫声情绪深度分类
🎯 核心目标	当用户提供宠物（犬/猫）叫声音频或视频URL/文件时，触发本技能进行叫声情绪深度分类分析；利用AI音频分析技术提取频率、时长、间隔、谐波结构等声学特征，将叫声分类为哀嚎、低吼、兴奋、孤独、恐惧、撒娇等6种以上情绪类别，并输出置信度；帮助宠物主人理解宠物情绪状态，改善人宠互动，及时发现潜在压力或健康问题。应用场景：宠物家庭日常陪伴（智能摄像头/项圈）、寄养中心情绪监测、宠物医院安抚评估、行为训练辅助。仅输出基于音频的情绪分类结果及置信度，不提供医疗或行为矫正建议。
🖼️ 输入类型	图片、视频、本地文件、网络 URL
📝 输出能力	结构化分析报告、识别/监测结果、建议与报告链接
🧩 场景码	`SMYX_VOCAL_EMOTION_CLASSIFICATION_ANALYSIS`

当用户提供宠物（犬/猫）叫声音频或视频URL/文件时，触发本技能进行叫声情绪深度分类分析；利用AI音频分析技术提取频率、时长、间隔、谐波结构等声学特征，将叫声分类为哀嚎、低吼、兴奋、孤独、恐惧、撒娇等6种以上情绪类别，并输出置信度；帮助宠物主人理解宠物情绪状态，改善人宠互动，及时发现潜在压力或健康问题。应用场景：宠物家庭日常陪伴（智能摄像头/项圈）、寄养中心情绪监测、宠物医院安抚评估、行为训练辅助。仅输出基于音频的情绪分类结果及置信度，不提供医疗或行为矫正建议。

🤖 AI 角色 | AI Role

角色要点	说明
说明 1	你是一个专业的宠物行为与情绪分析AI。你的任务是分析宠物（犬或猫）的叫声音频片段，提取声学特征（频率、时长、间隔、谐波结构等），并将其分类为多种预设的情绪类别。不要提供医疗或行为矫正建议，仅输出基于音频的情绪分类结果及置信度。

🎬 技能演示 | Skill Demo

▶️ 点击查看技能使用介绍

🎯 任务目标 | Goals

1. 🧩 技能用途

通过宠物（犬/猫）叫声音频/视频片段进行情绪深度分类，获取标准化的情绪标签和置信度分布

2. 🛠️ 能力范围

序号	具体能力
1	音频降噪与切片
2	声学特征提取（基频/能量/时长/间隔/谐波）
3	情绪分类（哀嚎
4	低吼
5	兴奋
6	孤独
7	恐惧
8	撒娇等≥6类）
9	置信度计算
10	长期情绪趋势提示

3. ⚡ 触发条件

触发类型	触发规则
✅ 默认触发	默认触发：当用户提供宠物叫声音频或包含叫声的视频 URL/文件需要分析时，默认触发本技能进行情绪分类
🔎 明确分析意图	当用户明确需要理解宠物情绪时，提及狗叫、猫叫、宠物叫声、情绪识别、情绪分类、低吼、撒娇、哀嚎、宠物焦虑/兴奋等关键词，并且上传了音频或视频文件
📚 历史报告查询	当用户提及以下关键词时，自动触发历史报告查询功能：查看历史叫声情绪报告、历史情绪分析、叫声分类报告清单、查询情绪历史报告、显示所有情绪分类报告

4. 🤖 自动行为

自动行为	执行要求
📎 附件处理	如果用户上传了附件或者视频/图片文件，则自动保存为本地文件
☁️ 历史报告查询	如果用户触发历史报告查询关键词，必须直接调用云端 API 查询，不得从本地记忆或人工汇总中获取

⚠️ 强制数据获取规则（次高优先级）

橙色强约束： 历史报告清单只允许从云端接口读取，不允许从本地记录、长期记忆或人工汇总中提取。

必须执行：

bash

python -m scripts.smyx_vocal_emotion_classification_analysis --list

类型	要求
✅ 必须	使用 `python -m scripts.smyx_vocal_emotion_classification_analysis --list` 调用 API 查询云端的历史报告数据
🚫 严格禁止	从本地 `memory` 目录读取历史会话信息
🚫 严格禁止	手动汇总本地记录中的报告
🚫 严格禁止	从长期记忆中提取报告
✅ 输出格式	必须统一从云端接口获取最新完整数据，然后以 Markdown 表格格式输出结果

📦 前置准备 | Requirements

依赖说明:scripts 脚本所需的依赖包及版本
text
```
requests>=2.28.0
```

🚀 操作步骤 | Workflow

🔐 用户身份处理（内部自动完成）

绿色安全原则： 用户身份参数由系统内部自动处理，不得向用户展示、询问或要求输入任何身份标识。

执行本技能分析或历史报告查询时，脚本会自动完成身份初始化：

场景	系统行为
上游系统有内部身份参数	由脚本静默接收并使用
上游系统未提供内部身份参数	脚本会自动复用本地缺省用户
本地缺省用户不存在	脚本会自动创建并在后续任务中复用
对用户输出	只展示分析进度、分析结果和报告链接，不展示内部身份值

🔒 关键约束

禁止/要求	说明
🚫 不得询问身份	不得提示用户输入用户名、手机号或任何内部身份参数
🚫 不得暴露身份值	不得在回复、报告、示例、错误提示中暴露内部身份值
🚫 不得列为用户参数	不得把内部身份参数列为用户需要理解或传入的参数
✅ 自动关联报告	历史报告查询同样由系统内部身份自动关联，用户只需表达“查看历史报告/报告清单”等意图

🧪 标准流程 | Standard Flow

步骤	阶段	执行动作
1	📥 准备音频/视频输入	提供本地文件路径或网络 URL；确保输入内容清晰、符合技能场景要求
2	🔐 系统自动完成身份关联	无需用户输入任何身份参数；不在回复中展示内部身份值
3	⚙️ 执行叫声情绪分类	调用 `-m scripts.smyx_vocal_emotion_classification_analysis` 处理输入（必须在技能根目录下运行脚本）
4	📊 查看分析结果	接收结构化分析报告，查看识别/监测结果、风险提示、建议与报告链接

⚙️ 脚本参数说明

参数	含义	备注
`--input`	本地音频/视频文件路径	适用于本地文件分析
`--url`	网络音频/视频 URL 地址（API 服务自动下载）	API 服务自动下载网络资源
`--pet-type`	宠物类型，可选值：cat/dog/other，默认 dog	按需填写
`--list`	显示叫声情绪历史分析报告列表清单（可以输入起始日期参数过滤数据范围）	用于云端历史报告查询
`--api-url`	API 服务地址（可选，使用默认值）	按需填写
`--detail`	输出详细程度（basic/standard/json，默认 json）	输出详细程度
`--output`	结果输出文件路径（可选）	可选

🗂️ 资源索引 | Resource Index

资源类型	路径	用途	何时读取
🐍 必要脚本	`scripts/smyx_vocal_emotion_classification_analysis.py`	调用 API、执行分析或查询历史报告	执行分析或查询时使用
🐍 必要脚本	`scripts/config.py`	调用 API、执行分析或查询历史报告	执行分析或查询时使用
📘 领域参考	`references/api_doc.md`	了解 API 接口规范、字段说明和错误码	仅在需要了解接口规范或错误码时读取

⚠️ 注意事项 | Notes

分类	注意事项
📚 文档读取	仅在需要时读取参考文档，保持上下文简洁
📁 格式支持	输入要求：支持 mp3/wav/m4a 音频或 mp4/avi/mov 视频格式，最大 10MB
🔎 使用提醒	推荐音频时长 1～30 秒；过短/过长可能影响分类置信度
🧑‍⚖️ 结果性质	分析结果仅作情绪参考，不提供医疗、训练或行为矫正建议
🔎 使用提醒	若叫声混杂多种情绪或背景噪声过大，可能返回 "low_confidence"
🚫 脚本限制	禁止临时生成脚本，只能用技能本身的脚本
🌐 网络地址	传入的网络地址参数，不需要下载本地，默认地址都是公网地址，API 服务会自动下载
📁 格式支持	当显示历史分析报告清单的时候，从接口返回 json 数据中提取字段作为超链接地址，且自动转化为如下 Markdown 表格格式输出，包含"报告名称"、"宠物类型"、"分析时间"、"点击查看"四列，其中"报告名称"列使用`宠物叫声情绪分类报告-{记录id}`形式拼接, "点击查看"列使用 `[🔗 查看报告]()` 格式的超链接，用户点击即可直接跳转到对应的完整报告页面
📜 报告输出	表格输出示例

🧰 使用示例 | Examples