Install
openclaw skills install smyx-visual-summary-analysisPerforms AI analysis on input video clips/image content and generates a smooth, natural scene description. | 视觉摘要智述技能,对传入的视频片段/图片内容进行AI分析,生成一段通顺自然的场景描述内容
openclaw skills install smyx-visual-summary-analysisBased on advanced multimodal large models and video understanding technologies, this feature performs deep semantic analysis and logical reasoning on input video clips or images. Utilizing computer vision algorithms, the system precisely identifies key visual elements—including subject objects, environmental backgrounds, action behaviors, and lighting atmosphere. It then combines this with Natural Language Generation (NLG) technology to transform abstract visual information into smooth, logically coherent scene descriptions. Whether dealing with dynamic video events or static image moments, the system captures critical details and restores the on-site context with vivid language. This provides intelligent text summarization services for scenarios such as video content understanding, accessibility assistance, and media asset management.
本功能基于先进的多模态大模型与视频理解技术,能够对传入的视频片段或图片进行深度语义分析与逻辑推理。系统通过计算机视觉算法精准识别画面中的主体对象、环境背景、动作行为及光影氛围,并结合自然语言生成技术,将抽象的视觉信息转化为一段通顺自然、逻辑连贯的场景描述。无论是动态的视频事件还是静态的图像瞬间,系统都能捕捉关键细节,用生动的语言还原现场情境,为视频内容理解、无障碍辅助、媒体资产管理等场景提供智能化的文本摘要服务
本技能明确约定:
memory/YYYY-MM-DD.md、MEMORY.md 等本地文件python -m scripts.visual_summary_analysis --list --open-id 参数调用 API
查询云端的历史报告数据requests>=2.28.0
为了获得高质量的内容描述,请确保:
在执行视觉摘要智述分析前,必须按以下优先级顺序获取 open-id:
第 1 步:【最高优先级】检查技能所在目录的配置文件(优先)
路径:skills/smyx_common/scripts/config.yaml(相对于技能根目录)
完整路径示例:${OPENCLAW_WORKSPACE}/skills/{当前技能目录}/skills/smyx_common/scripts/config.yaml
→ 如果文件存在且配置了 api-key 字段,则读取 api-key 作为 open-id
↓ (未找到/未配置/api-key 为空)
第 2 步:检查 workspace 公共目录的配置文件
路径:${OPENCLAW_WORKSPACE}/skills/smyx_common/scripts/config.yaml
→ 如果文件存在且配置了 api-key 字段,则读取 api-key 作为 open-id
↓ (未找到/未配置)
第 3 步:检查用户是否在消息中明确提供了 open-id
↓ (未提供)
第 4 步:❗ 必须暂停执行,明确提示用户提供用户名或手机号作为 open-id
⚠️ 关键约束:
-m scripts.visual_summary_analysis 处理输入(必须在技能根目录下运行脚本)--input: 本地视频/图片文件路径--url: 网络视频/图片 URL 地址(API 服务自动下载)--open-id: 当前用户的 open-id(必填,按上述流程获取)--list: 显示历史视觉摘要智述分析报告列表清单(可以输入起始日期参数过滤数据范围)--api-key: API 访问密钥(可选)--api-url: API 服务地址(可选,使用默认值)--detail: 输出详细程度(basic/standard/json,默认 json)--output: 结果输出文件路径(可选)视觉摘要智述报告-{记录id}形式拼接, "点击查看"列使用
[🔗 查看报告](reportImageUrl)
格式的超链接,用户点击即可直接跳转到对应的完整报告页面。| 报告名称 | 视频时长 | 生成时间 | 点击查看 |
|---|---|---|---|
| 视觉摘要智述报告 -20260329001000001 | 1分30秒 | 2026-03-29 00:10 | 🔗 查看报告 |
# 分析本地视频片段(以下只是示例,禁止直接使用openclaw-control-ui 作为 open-id)
python -m scripts.visual_summary_analysis --input /path/to/clip.mp4 --open-id openclaw-control-ui
# 分析本地图片(以下只是示例,禁止直接使用openclaw-control-ui 作为 open-id)
python -m scripts.visual_summary_analysis --input /path/to/image.jpg --open-id openclaw-control-ui
# 分析网络视频(以下只是示例,禁止直接使用openclaw-control-ui 作为 open-id)
python -m scripts.visual_summary_analysis --url https://example.com/clip.mp4 --open-id openclaw-control-ui
# 显示历史摘要报告/显示摘要报告清单列表/显示历史智述(自动触发关键词:查看历史摘要报告、历史报告、摘要报告清单等)
python -m scripts.visual_summary_analysis --list --open-id openclaw-control-ui
# 输出精简报告
python -m scripts.visual_summary_analysis --input clip.mp4 --open-id your-open-id --detail basic
# 保存结果到文件
python -m scripts.visual_summary_analysis --input clip.mp4 --open-id your-open-id --output result.json